字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径-脚本导航

> 自媒体 > （AI）人工智能 > 字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

来源：量子位

2023-11-14 13:48:56

308

管理

丰色克雷西发自凹非寺

量子位 | 公众号 QbitAI

GPT-3究竟是如何进化到GPT-4的？

字节给OpenAI所有大模型来了个“开盒”操作。

结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。

更直观的表现如下图所示（“粉圈”为进化后的text-davinci-001）。

接着，GPT开始进入3.5系列，在该系列早期阶段，先是最基础的code-davinci002采用同样的技术进化成text-davinci-002。

然而这一进化操作的效果属实不大，GPT的各项性能只有少数几个提升，更多是不增反减的。

在此，作者引出他们的第一个结论，即：

SFT只在较弱的基础模型上管用，用在更强的模型上收效甚微。

类似现象在开源模型身上也可见（这个评测还测了Llama1和2、PaLM2-L、Claude 2等模型）：

在初代Llama-65B之上，SFT成功提升了它在MMLU基准上的性能，但是，所有使用了SFT改进的Llama2-70B在Open LLM Leaderboard榜单上却只表现出微小的进步。

总结：在GPT3阶段，SFT技术对模型的进化起到了关键作用。

2、RLHF和SFT：编码能力提升的功臣

顺着GPT3.5系列接着看，从text-davinci-002开始，OpenAI开始引入新技术基于PPO算法的RLHF，得到text-davinci-003。

此时，它在大部分基准上的表现和前代模型持平或略变差，说明作用不是特别明显（在开源模型身上也是如此）。

但有一个除外：编码任务，最高足足增加了近30分。

此外诸如CoT、样本数量以及采样方差等因素也都被包括进了敏感性测试当中。

未来，作者计划从能力种类、测试数据集和模型三个维度继续扩展GPT-Fathom，将支持多轮对话、多模态等能力的测评，以及增加对多个数据集和模型的测试。

GPT-Fatham的两位共同一作分别是字节公司应用机器学习研究组的研究人员张驭宇（Yuyu Zhang）和实习生Shen Zheng。

Shen Zheng是伊利诺伊大学香槟分校（UIUC）的一名硕士生。

此外，字节公司的Yijie Zhu等四名研究人员，以及UIUC的Kevin Chen-Chuan Chang教授也参与了这项研究。

论文地址：https://arxiv.org/abs/2309.16583参考链接：https://github.com/GPT-Fathom/GPT-Fathom

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

微软论文一张截图,曝出GPT-3

3.9分钟训完GPT-3，英伟达H100再次刷新MLPerf六项纪录

相关文章

喝酒行情来了！创业板指涨逾1%，哪些板块在表演？

近期美股走势是一根大阳线带上几根小阴线，整体来看还是明显的上攻形态，..

四川某乡镇公职人员被曝涉不雅聊天、索要钱财？官方通报..

“镇政府工作人员”，“女性”，“不雅聊天”，还“索要钱财”？这些自带..

全球首个内置 ChatGPT 智能音箱 ChatMini 计划下周发布

品玩8月11日讯，智度科技今天宣布，全球首款内置 ChatGPT 的智能音箱 Vif..

“派出所里有奸细！”杭州女孩接到电话吓懵了……

来源：杭州公安 2023年8月1日17时许西湖区公安分局蒋村派出所接到反诈平..

需求量太大，ChatGPT暂停Plus付费升级服务

ChatGPT暂时关闭了20美元/月的Plus付费服务。4月5日，澎湃新闻记者进入Ch..

一个AI撰写的博客着重指出了人类对GPT-3的错误判断

文 | AI国际站唐恩编 | 艾娃本文由AI国际站原创出品，未经许可，任何渠..

市场监管总局曝光！这款“ChatGPT”受罚

9月26日，市场监管总局官网公布了9起网络不正当竞争典型案例，涉及“Chat..

ChatGPT4.0：如果地球上只剩下一男一女,多久可以恢复到75亿人?..

第一部分：生物学和人口增长在探讨人口恢复问题之前，我们首先要理解人类..

如何跟普通女朋友聊天，聊这3个话题，让你们相处更融洽..

和女生聊天没话题，很大程度上还是心态问题，换句话说，你太在意女生的想..

关于作者

黑暗森林(普通会员)

文章

374

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

聊天交友软件常用骗局（套路）交友需小心！

10个月前

02

微信聊天时，女人说“哼哼”，10个高情商回复

8个月前

03

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

9个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

10个月前

05

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

标签云

成员 网址收录40331 企业收录2981 印章生成189109 电子证书803 电子名片49 自媒体21677

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索