OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平-脚本导航

> 自媒体 > （AI）人工智能 > OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

来源：AI科技评论

2023-08-03 13:47:36

469

管理

图注：方法概述

在许多不同的语音处理任务中训练一个序列到序列的转换器模型，包括多语言语音识别、语音翻译、口头语言识别和语音活动检测；所有任务都表示为要由解码器预测的标记序列，允许单一模型取代传统语音处理管道的不同阶段；多任务训练格式使用一组特殊的标记，作为任务指定者或分类目标

Whisper 架构采用一种简单的端到端方法，通过编码器-解码器 Transformer 来实现：输入音频被分成30秒的块，转换成 log-Mel 频谱图后传递到编码器。解码器可预测相应的文本标题，并与特殊标记混合，由这些标记指导单个模型执行诸如语言识别、短语级时间戳、多语言语音转录和英语语音翻译等任务。

图注：Whisper 架构

值得一提的是，由于「Whisper 」是在一个庞大且多样的数据集上进行，没有针对任何特定的数据集进行微调，因此它不会击败专门研究 LibriSpeech 性能的模型。

此外研究团队还发现，当在许多不同的数据集上测量「Whisper 」的零样本性能时，「Whisper 」相比其他模型表现更加稳健，错误率降低了 50%。

除了足够大的数据集规模外，「Whisper 」还支持多种语言的转录，以及将这些语言翻译成英语。

当前在68万小时音频中，共11.7万个小时覆盖了96中其他语言，还包括12.5万个小时的转录和翻译数据，即大约有三分之一是非英语的。

「Whisper 」会交替执行以原始语言转录或翻译成英语的任务，对此研究团队发现，这种方法在学习语音到文本的翻译方面特别有效，并且优于 CoVoST2 到英语翻译零样本的监督 SOTA。

目前，「Whisper 」已开源，可用于对语音识别方面的进一步研究。

OpenAI 创始人 Ilya Sutskever 对此表示，“终于有一个能理解我说话的可靠的语音识别系统。”

前特斯拉人工智能和自动驾驶部门负责人 Andrej Karpathy 也转发了这一消息称“OpenAI 正处于最好的状态中”。

那么大家怎么看？

参考链接：https://openai.com/blog/whisper/

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

如何理解看待 OpenAI 公布PPO算法？

因错误率较高，OpenAI被迫叫停AI内容识别软件

相关文章

“局长与女子不雅聊天记录”事件还涉一名胡姓局长？柳州纪委回应..

纵览新闻记者刘世鹏6月1日晚，针对“局长与女子不雅聊天记录”事件，柳..

韩国斗山机器人公司使用GPT打造“更智能”的协作机器人..

据韩联社 8月24日报道，韩国斗山机器人（Doosan Robotics）正在开发一种..

ChatGPT：人工智能是否可以取代教育？

人工智能是否可以取代教育？虽然人工智能技术在教育领域有着广泛的应用和..

ChatGPT 不仅是 AI 的成功，也是云计算的成功

作者 | 多颗糖责编 | 梦依丹出品 | CSDN（ID：CSDNnews）最近 ChatGPT ..

科技大厂“混战”ChatGPT，新搜索大战一触即发

华夏时报（www.chinatimes.net.cn）记者卢晓北京报道如果说AlphaGo当年..

谷歌推出AI聊天机器人Bard，这是对ChatGPT的挑战还是致敬？..

AI聊天机器人是近年来人工智能领域的热门话题，各大科技公司都在争相推出..

2023第一波冷水浇向AIGC？

数智世界风起云涌，互联网新旧迭代，元宇宙蓬勃而出。m360互联网日报，从..

硬核观察 | 硬核观察 #997 OpenAI 用 GPT-4 来解释 GPT-2 的行为..

OpenAI 用 GPT-4 来解释 GPT-2 的行为大语言模型（LLM）像大脑一样，它们..

让女生极度舒服的10个聊天技巧

标题：让女生极度舒服的10个聊天技巧第一章：建立良好的沟通基础与女生聊..

关于作者

舞月(普通会员)

文章

377

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

聊天交友软件常用骗局（套路）交友需小心！

10个月前

02

微信聊天时，女人说“哼哼”，10个高情商回复

8个月前

03

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

9个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

10个月前

05

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

标签云

成员 网址收录40331 企业收录2981 印章生成189111 电子证书803 电子名片49 自媒体21677

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索