> 自媒体 > (AI)人工智能 > Claude 3全面碾压GPT-4成最强大模型?《科创板日报》记者实测报告来了!
Claude 3全面碾压GPT-4成最强大模型?《科创板日报》记者实测报告来了!
来源:科创板日报
2025-02-06 15:41:52
284
管理

《科创板日报》3月5日讯(记者 朱凌)一款被认为碾压GPT-4的模型火了!近日,Anthropic发布Claude 3系列模型,该公司称这是迄今为止速度最快、功能最强大的人工智能模型。

据了解,Claude 3模型系列包括三个模型,按能力升序排列依次是:Claude 3 Haiku(中杯)、Claude 3 Sonnet(大杯)、 Claude 3 Opus(超大杯)。

同时,Claude 3是多模态大模型,具有强大的“视觉能力”,用户可以上传照片、图表、文档和其他类型的数据,对其进行分析和提问。

该公司表示,新模型中能力最强的Claude 3 Opus在部分行业基准测试中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra,如本科生水平的知识、研究生水平的推理和基础数学。

▍Claude 3 Opus VS GPT-4:未具备明显优势

《科创板日报》记者第一时间对Claude 3 Opus进行测试,并与GPT-4进行对比。

首先,对于Claude 3宣称的视觉能力,《科创板日报》记者注意到,相比于GPT-4,Claude 3 Opus确实在图片识别上会有更多细节表现,但在准确率上表现仍不佳。

为验证视觉水平,《科创板日报》记者上传华为Mate50的手机宣传图,并分别对Claude 3 Opus和GPT-4进行提问:这是什么手机?

其中,Claude 3 Opus以肯定的回答这是华为Mate系列的产品,并分别对图中三个手机进行描写,但均将其错认成“Mate40”。

而GPT-4则表示无法识别出具体型号,不过,其提到“华为Mate系列在过去曾使用过类似的设计布局”。

《科创板日报》记者以“鲁迅为什么打周树人”为题目,分别测试Claude 3 Opus和GPT-4,两者都能做出正确回答。

最后,《科创板日报》记者以“只切一刀,如何把四个橘子分给四个小朋友?”为问题,分别测试Claude 3 Opus和GPT-4。

其实这道题是一个小陷阱,考验模型的常识和推理能力,GPT-4虽然没有犯下如Claude一样的严重错误,但也没有绕过题目本身的推理陷阱。这道题的正确答案很简单:只要每个小朋友分到一个完整的橘子就可以了,根本不需要切开。

综上,记者的实测结果显示,Claude 3并未超越GPT4。

▍Anthropic是谁?

实际上,这家与ChatGPT-4媲美的大模型公司仅成立不到3年,值得一提的是,该公司核心成员的老东家正是ChatGPT-4的开发商OpenAI。

其中,Anthropic的两位创始人Dario Amodei和Daniela Amodei兄妹,离任前分别在OpenAI担任研究部门副总裁和安全与策略部门副总监。同时,Dario Amodei离任时还带走了OpenAI十多名心腹,其中就包括GPT-3首席工程师Tom Brown。

强大的团队阵容让Claude一路狂飙。据了解,在ChatGPT推出不久后的2023年3月,Anthropic就发布了首款名为“Claude”的AI助手。 彼时,这款类似于ChatGPT的产品让该公司一度被认为是Open AI的最大竞争对手。

光环之下,Anthropic受到资本追捧。据了解,仅2023年一年这家初创公司就完成了五笔不同的融资交易,总计约73亿美元,投资方包括谷歌、亚马逊、Salesforce以及韩国SK Telecom。其中,亚马逊和谷歌分别向其投资高达40亿美元和20亿美元。

公司规模来看,Anthropic联合创始人丹妮拉-阿莫迪(Daniela Amodei)在接受采访时说,目前该公司有60到80人从事核心人工智能模型的开发,总共有120到150人从事技术方面的工作。

据Anthropic公司称,Claude 3 Sonnet和Opus从下周一开始在159个国家上市,而Haiku将很快上市。

有业内人士向《科创板日报》记者表示,随着此轮Claude 3的热度,预计大模型行业会进入一轮新的厮杀。不过,其提醒,Claude3是与OpenAI一年前的模型的比较,而GPT-5预计今年发布,其的性能或将上新台阶。

根据PitchBook的数据,在过去一年里,生成式人工智能领域出现了爆炸式增长,2023年近700笔交易的投资额达到了创纪录的291亿美元,交易额同比增长超过260%。

其中,OpenAI曾在去年4月完成103亿美元的大额融资。近期亦有消息称OpenAI正在寻求新的融资,如果有竞争对手能力超过OpenAI,或对OpenAI的融资产生影响。

此外,主张开源策略的Meta在今年1月宣布,Meta AI已经开始训练Llama 3,预计将在今年7月正式发布。业内人士预计,在Llama 3发布并开源后,AI行业将受到很大影响,或将会有非常多GPT4级别的产品涌现。

大模型的未来将如何发展?《科创板日报》记者将持续保持关注。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
土耳其为何对中国汽车下手?因为实在打不过了
在土耳其的奇瑞汽车据金融界的报道,土耳其《官方公报》(Official Gazet..
裁员太猛,理想又吃回头草
“前两天HR又找我,想让我回去,由于补偿金还没给,这段时间休假白送我,..
深度关注丨汽车消费向“新”而行
中央纪委国家监委网站 李云舒图为近日,在河北省邯郸市永年区汽车促销活..
奔驰全新C级曝光!明年首发/内饰升级三块大屏
日前爱卡汽车再次获取了一组奔驰全新C级纯电版车型渲染图片,新车预计将..
放松汽车限购虽迟但已至——关于汽车限购政策的来由、现状与经济效益测算..
编者按由于世纪之初的交通拥堵与气候问题,自2010年以来全国多地开始实行..
途岳以空间和发动机见长,但还能持续多久
买车你最在意什么,对于家用车来说,大家在意两点。首先是车子的空间,只..
5月新能源卖爆了!埃安重回4万,理想冲至3万5,蔚来、极氪破纪录……..
鲜花盛开的5月,多地汽车以旧换新政策纷纷出台,新能源汽车下乡再启新程..
特斯拉全新Model Y曝光!用“3”同款外观/内饰翻新
日前爱卡汽车获取了一组特斯拉全新Model Y车型外观渲染图片,新车预计最..
汽车价值战的“问界范式”,九个月从稚嫩走到成熟
王子阳/文从微型电动车市场,到中高端增程车市场,再到混动紧凑型轿车市..
关于作者
婆罗花开(普通会员)
文章
1426
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40408 企业收录2984 印章生成248829 电子证书1107 电子名片64 自媒体77267

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索