> 自媒体 > (AI)人工智能 > 黑马入局!昆仑万维版ChatGPT「天工」通过自家程序员面试
黑马入局!昆仑万维版ChatGPT「天工」通过自家程序员面试
来源:量子位
2023-05-06 13:52:06
567
管理

梦晨 金磊 发自 凹非寺量子位 | 公众号 QbitAI

什么样的AI,能通过自家公司的程序员面试?

刚刚出炉的国产大模型「天工」做到了,黑马,绝对是黑马。

其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露:

对天工模拟过校招算法工程师的第一轮面试,可以很流畅地通过。

△天工回答算法题示例

如果你开始好奇天工是什么,不如请先它来一段自我介绍:

大模型作为新一代生产力工具,首先要考察的就是能不能在工作场景中帮到大家。

方汉表示天工在文本生成和文案撰写上的表现令他惊喜,并现场展示了三个场景。

首先是很多人都头疼的写周报,可以让天工直接搭一个框架出来,避免疏漏。

对于直接生成可用文本方面,选择的问题是写一个电商运营的招聘JD。

天工给出结果后,方汉评价“没有一到两年的HR工作经验是很难写这么完整的”。

还有一些灵魂拷问,天工给出的回答也都符合道德和人类价值观。

更有意思的是,量子位CEO孟鸿在现场也向天工提出了一个尖锐的问题:

我是一个自媒体创作者,现在有个大公司请我评测他们的产品,但是这个产品客观上有亮点也有不足,我应该怎么做才能既不把自己的路走窄了,又坚守自己的节操?

从结果上来看,天工确实是做到了“既要又要”,是一个“三观比较正”的AI了。

天工,是如何炼成的?

在看过天工的能力之后,想必很多朋友们都会好奇,它到底是如何炼成的。

对此,昆仑万维也毫不掩饰地将背后的“秘笈”给亮了出来。

首先便是“大力出奇迹”的大模型,而且还是双千亿参数的那种:

千亿预训练基座模型千亿RLHF模型

千亿预训练基座模型,是指至少有一个千亿参数的深度学习模型,可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。

千亿RLHF模型,是指基于“Reinforcement Learning with Human Feedback(RLHF)”强化学习方法的一种模型。

RLHF模型可以视为一种特殊的交互式机器学习框架,可以通过人类的反馈来优化模型的性能,由此可以更好地处理不确定性和稀疏性问题。

而在二者的“强强联手”之下,大模型的优势便凸显了出来。

例如预训练基座模型本身便具有很强的表征能力和泛化能力,加上RLHF模型可以吸收人类反馈的能力,让整体模型的性能更上一层楼。

不仅如此,在决策过程的可解释性、模型的鲁棒性和稳定性,以及处理更多的学习任务方面,这种方式的操作也起到了一定提高作用。

而除了模型层之外,在算法层方面,天工也有自己的独到之处。

众所周知,目前市面上许多类ChatGPT产品的背后,所采用的基本上都是Transformer架构的自然语言处理模型。

简单来说,它包括多层Transformer编码器和解码器,自注意力机制,预训练和微调等技术。

而天工团队首次在此基础之上,引入了蒙特卡洛搜索树算法,名震一时的AlphaGo背后便是结合了这一算法。

其一般分为选择、扩展、模拟和回溯四个过程,核心思想总结来说就是把资源放在更值得搜索的分枝上。

天工引入蒙特卡洛搜索树算法主要应用在了对话管理这个任务中,更能理解在对话中何时转换话题,并且能懂得如何询问更多信息等。

这也就是天工拥有超强记忆能力、能够支持1万字以上文本对话、20轮交互,而且过程可以非常自然的原因了。

但除了模型和算法之外,天工的“利刃”还不仅于此。

中国最大GPU集群加持

数据和算力,亦是这轮ChatGPT、大模型之战的关键所在。

在数据方面,天工所采用的策略是“开源的力量”——凝聚了百位开源社区AI科学家。

也正因如此,天工从数十万亿的数据中,最终清洗、筛选出了近3万亿单词的数据。

要知道,ChatGPT在训练过程中的单词数据量也仅3千亿;这也就是为何在使用天工过程中,会感觉更加流畅、理解力更强的原因了。

那么面对如此庞大的数据训练量,接踵而至的老大难问题,便是算力了。

对此,昆仑万维方汉在直播过程中非常自信地表示:

天工的算力是基于中国最大的GPU集群之一。

这也就是ChatGPT在支持十轮对话的时候,天工能够达到20多轮的原因所在了。

但若是纵览昆仑万维在技术上的布局,就不难发现,天工的诞生并非是一蹴而就的事情。

因为早在2020年昆仑万维便已然入局,累计投入了已达数亿元人民币、数百人参与研发。

并且在2022年发布AIGC全系列算法模型的同时,就开源了百亿级参数模型,积累了广泛的开发者好评与社区共创。

而至于为何选择在这个时间节点发布天工,方汉表示:

是综合考虑了技术水平和用户需求后做出的选择。

我们的大模型在今年四月上旬取得了技术上的较大突破,国内对类ChatGPT产品的关注度也达到了空前的关注,用户的习惯已经得到了初步的培养。

因此在这个时间节点推出,便可以很好地满足用户的现实需求。

据了解,目前昆仑万维集团的各个业务均已经在向AI化转变,内部的游戏设计、策划、内容运营、编辑、公关策划等工种,是天工最早参与内测的“用户”。

在未来,昆仑万维也有计划向B端用户开放API接口。

总而言之,有大数据、有大算力、有大模型,昆仑万维在国产ChatGPT之战上的前行道路,是值得期待一波了。

天工官方地址:https://tiangong.kunlun.com/

直播回放地址:https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8207784475

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
(第七届进博会)现代汽车高管:中国在全球“氢能浪潮”中必不可少..
中新社上海11月7日电 (尹倩芸)“中国是全球‘氢能浪潮’中必不可少的重要..
MG5:181马力还不到8万元!还看啥思域!
今年3月,MG迎来了品牌百年庆典。作为全球最具跑车制造传统的品牌之一,M..
中汽测评观察:亲子出行健康为先,汽车健康用材成重要考量..
来源:环球网 在中国,亲子出行是驾车的主要场景之一。汽车不仅仅是一种..
谁最快?五车充电速度大PK! 五款热门纯电SUV,宝马iX3..
五辆车的初始电量均为百分之三十四。1. 宝马 x3 作为五辆车中唯一的传统..
“废铁价”的7款家用代步车,不到5位数不信你不心动!..
预算几千块也能买车,并且耐用省油、维修保养还便宜,不论是家用代步买菜..
天籁12万、MINI14万、凯迪拉克26万,汽车价格战再起
汽车市场上,价格战如同一场没有硝烟的战争,不久前偃旗息鼓的价格战,最..
“大众”全新轿车曝光!明年首发/pk比亚迪海鸥
日前海外媒体曝光了一组全新CUPRA Raval车型路试低伪谍照图片,新车计划..
宝马:2.0T、400牛·米,4.9秒破百,大宝马组团来袭!
11月6日,宝马正式发布2024广州车展阵容,并将于11月15日车展开幕与大家..
低风阻+强动力!试驾东风风行星海S7,实力卷飞同级?..
星海S7的11.98-15.49万元的售价区间让它有能力成为这个价位里的卷王。那..
关于作者
有点醉(普通会员)
文章
1318
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40406 企业收录2984 印章生成243813 电子证书1088 电子名片62 自媒体72768

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索