> 自媒体 > (AI)人工智能 > 谷歌发布最大语言模型:等于9个GPT-3,训练成本却低得多
谷歌发布最大语言模型:等于9个GPT-3,训练成本却低得多
来源:量子位
2023-04-28 17:39:47
468
管理

杨净 发自 凹非寺量子位 报道 | 公众号 QbitAI

今天,谷歌大脑声称,他们新技术能训练万亿级参数的语言模型。

与此同时,此次也首次展现了大型稀疏模型(参数量惊人,但计算成本恒定)也可以用较低精度的格式进行训练。

迄今最大语言模型

Switch Transformer的设计原则是,用一种简单有效的稀疏性扩展Transformer模型的参数量。

它建立在专家混合的基础上,这是90年代初首次提出的人工智能模型范式。

简单来说,就是在一个更大的模型内保留多个专家,或专门从事不同任务的模型,并由一个“门控网络”为任何给定数据选择咨询哪些专家。

接着,研究人员使用了32个TPU内核在一个数据集上预训练了几个不同的Switch Transformer模型。

这一数据集叫做Colossal Clean Crawled Corpus,750GB大小,包含了从Reddit、维基百科和其他网络资源中搜索的文本。

研究人员给这些模型布置了任务,比如,在有15%单词被掩盖的段落中预测出缺失的单词;检索文本来回答问题。

研究人员表示,他们拥有2048个专家系统的1.6万亿参数模型(Switch-C)“完全没有不稳定性”,其速度相比于T5-XXL模型提升了4倍。

此外,研究者还将模型与T5-Base和 T5-Large进行了对比,结果表明,在相同的计算资源下,新模型预训练速度有最高7倍的提升。

研究人员表示,大型稀疏模型可用于创建较小的密集模型,在任务上进行微调,其质量增益为大型模型的30%。

从整体结果上看,Switch Transformer 模型在多项推理和知识任务中带来了显著性能提升。这说明该模型架构不只对预训练有用,还可以通过微调将质量改进迁移至下游任务中。

研究人员表示,

我们无法完全保留模型质量,但通过将我们的稀疏模型提炼成密集模型,可以实现10到100倍的压缩率,同时实现约30%的专家模型的质量增益。

在未来的工作中,研究人员计划将Switch Transformer应用于不同模态或多模态模型,包括图像和文本。

参考链接:论文地址:https://arxiv.org/abs/2101.03961https://venturebeat.com/2021/01/12/google-trained-a-trillion-parameter-ai-language-model/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

2
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
会做策划,能写代码:聊天机器人ChatGPT将抢走更多游戏人的饭碗?..
策划美术程序运营,一个也别想跑。文/托马斯之颅这几天,OpenAI的新产品C..
撩妹情话套路大全,一问一答,高情商撩妹要会
本文分享撩妹情话套路大全,高情商撩妹聊天思维要会,轻松和女生拉近感情..
ChatGPT来了,这个据说很神的“人工智能”到底能做什么?..
很火的ChatGPT智能聊天软件来了。为了验证它到底能做什么,我在微信上登..
马斯克:ChatGPT展示了AI有多先进,需立法保障人类安全..
作为Open AI创始人,特斯拉CEO埃隆·马斯克给予聊天机器人ChatGPT很高的..
ChatGPT的底层逻辑
#头条创作挑战赛#“一些未知的东西正在做我们不知道的事情。”阿瑟·爱丁..
GPT-4没通过图灵测试!60年前老AI击败ChatGPT,人类胜率仅有63%..
在阅读本文前,敬请您点击一下“关注”,方便后续的讨论和分享,小编会每..
ChatGPT遭多国“围剿”,国内新玩家为何仍争相入局?
新兴人工智能工具的使用在过去几个月大范围风靡,典型如ChatGPT,短短几..
OpenAI又又又又又进行大规模账号封禁
今日,OpenAI 官方似乎对使用虚拟卡和电话号码,所注册的 Chat*** plus用..
ChatGPT都快成韭菜收割机了,别对这个概念太上头!
公众号最近改版啦常有读者朋友错过文章更新点击左上角蓝字【三节课】..
关于作者
有点醉(普通会员)
文章
628
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40367 企业收录2981 印章生成216385 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
2
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索