> 自媒体 > (AI)人工智能 > OpenAI炸裂新作:GPT-4破解GPT-2大脑!30万神经元全被看透
OpenAI炸裂新作:GPT-4破解GPT-2大脑!30万神经元全被看透
来源:新智元
2023-05-22 16:09:25
522
管理

编辑:编辑部

【新智元导读】OpenAI又双叒叕有新整活了!难懂的GPT-2神经元,让GPT-4来解释。人类看不懂的AI黑箱,就交给AI吧!

刚刚,OpenAI发布了震惊的新发现:GPT-4,已经可以解释GPT-2的行为!

大语言模型的黑箱问题,是一直困扰着人类研究者的难题。

模型内部究竟是怎样的原理?模型为什么会做出这样那样的反应?LLM的哪些部分,究竟负责哪些行为?这些都让他们百思不得其解。

万万没想到,AI的「可解释性」,竟然被AI自己破解了?

就是说,搞快点,赶紧快进到天网吧。

比如,如果给出这么一个prompt,「哪些漫威超级英雄拥有最有用的超能力?」 「漫威超级英雄神经元」可能就会增加模型命名漫威电影中特定超级英雄的概率。

OpenAI的工具就是利用这种设定,把模型分解为单独的部分。

第一步:使用GPT-4生成解释

首先,找一个GPT-2的神经元,并向GPT-4展示相关的文本序列和激活。

然后,让GPT-4根据这些行为,生成一个可能的解释。

比如,在下面的例子中GPT-4就认为,这个神经元与电影、人物和娱乐有关。

第三步:对比打分

最后,将模拟神经元(GPT-4)的行为与实际神经元(GPT-2)的行为进行比较,看看GPT-4究竟猜得有多准。

还有局限

通过评分,OpenAI的研究者衡量了这项技术在神经网络的不同部分都是怎样的效果。对于较大的模型,这项技术的解释效果就不佳,可能是因为后面的层更难解释。

这些有趣的神经元是怎么发现的?策略就是,找到那些token空间解释很差的神经元。

就这样,背景神经元被发现了,也就是在某些语境中密集激活的神经元,和许多在文档开头的特定单词上激活的神经元。

另外,通过寻找在上下文被截断时以不同方式激活的上下文敏感神经元,研究者发现了一个模式破坏神经元,它会对正在进行的列表中打破既定模式的token进行激活(如下图所示)。

网友:OpenAI,搞慢点吧

毫不意外地,网友们又炸了。

咱就是说,OpenAI,你搞慢点行不?

这就是传说中的「存在主义风险神经元」吧,只要把它关掉,你就安全了(Doge)。

ChatGPT从互联网中学习,现在它正在创造更多的互联网。很快,它就会自我反哺,真正的天网就要来临。

听说GPT-5已经达到奇点,并且它正在与地外生命谈判和平条约。

有网友恶搞了一个关于「Yudkowsky」的解释,他一直是「AI将杀死所有人」阵营的主要声音之一。

之前「暂停AI训练」公开信在网上炒得沸沸扬扬时,他就曾表示:「暂停AI开发是不够的,我们需要把AI全部关闭!如果继续下去,我们每个人都会死。」

他知道我们在计划什么

我们必须不惜一切代价让他丧失信誉

一旦他走了,就没有人能够反对我们了

「Eliezer Yudkowsky看到这一幕,一定又笑又哭——让我们使用自己不能信任的技术来告诉我们,它是如何工作的,并且它是对齐的。」

现在,人类反馈强化学习(RLHF)是主场,当AI懂了AI,将会在微调模型上开辟一个新纪元:

人工智能反馈的神经元过滤器(NFAIF)

参考资料:

https://openai.com/research/language-models-can-explain-neurons-in-language-models

https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html

https://techcrunch.com/2023/05/09/openais-new-tool-attempts-to-explain-language-models-behaviors/

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Joby航空在日本成功展示首飞,丰田投资超过8.94亿美元..
2024年11月2日,Joby Aviation 在日本上演了一场令人瞩目的飞行演示,展..
丰田GR打造拉力版86,采用GR四驱动力系统
之前就有传闻,下一代GR86可能采用GR雅力士的1.6T发动机,这会丰田真的把..
本田和丰田的差距到底在哪里?内行人:一个搞技术,一个为赚钱..
本田和丰田,两大日系车企巨头,在汽车界掀起了一场硝烟四起的技术与市场..
丰田中期财报显示净利润大幅下滑
新华社东京11月6日电(记者刘春燕 欧阳迪娜)丰田汽车公司6日发表的中期..
加价170万,买前面试,丰田又在收割中国“土豪”
很多人都说“加价”几乎成了丰田的代名词,以前汉兰达还热销时加价3万元..
硬派外观设计,或将不再推出燃油版, 新款丰田RAV4曝光..
近日,网上曝光了一组新款丰田RAV4的渲染图,新款车型预计在2026年初正式..
深耕六秩“丰”华正茂 携手共绘美好出行新蓝图 进博“全勤生”丰田:未来出..
1964年进入中国市场的皇冠车型回溯往昔,1964年的秋季广交会上,一位客户..
丰田汽车发布2025财年第二财季财报,净利润下滑55%,下调2024年全球销量预..
【环球网科技综合报道】全球领先的汽车制造商丰田汽车近日公布了其2025财..
这样的丰田普拉多谁不爱?要是能实现量产就好了
是一条国内车讯:丰田最新一代普拉多已经在国内上市,新车外形采用当下主..
关于作者
赶海的老阿姨..(普通会员)
文章
1328
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40405 企业收录2984 印章生成242329 电子证书1086 电子名片62 自媒体69766

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索