神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最后？丨科技观察-脚本导航

> 自媒体 > （AI）人工智能 > 神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最后？丨科技观察

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最后？丨科技观察

来源：封面新闻

2023-12-12 13:16:21

170

管理

封面新闻记者马晓玉边雪

2022年底的人工智能的热潮是OpenAI的ChatGPT带来的，而2023年底，谷歌带着它的Gemini高调杀回人工智能圈。

美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比，雄心勃勃地宣布进入“Gemini时代”，更加剧了两大头部科技公司在大语言模型领域竞争的白热化程度。

谷歌表示，现有的人工智能模型通常只处理一种类型的推理，如图片或文本，而 Gemini 的设计是“多模式”的。这意味着它接受包括多种媒体类型的输入，组合文本、图像、音频、视频和编程代码。未来，谷歌还计划将 Gemini添加到谷歌搜索引擎和 Chrome 网络浏览器等产品中，而全球有数十亿人在使用这些产品。

Gemini的三个版本 Ultra、Pro、 Nano

其中，Gemini Ultra是能力最强大的版本，适用于需要高级处理能力的任务。据介绍，Gemini Ultra是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力。

Gemini Pro专为多任务设计，能够击败GPT-3.5。Gemini Pro在提供迅速响应和理解复杂查询方面表现出色，并被谷歌官方声称在与第三方测试人员的盲测中，搭载 Gemini Pro 的 Bard 是首选的免费聊天机器人，领先于其替代产品。

作为是谷歌最轻量级的人工智能模型，Gemini Nano的主要设计目标是在移动设备上本地离线运行，为设备端任务提供高效的支持。据谷歌介绍，Gemini Nano的出色性能在谷歌的Pixel 8 Pro手机上得到了充分展示，用户已经能够看到它在录音机应用中的语音识别和智能回复等功能表现。值得一提的是，所有的Gemini模型，包括Gemini Nano，都经过了精心地优化，以适应不同的使用场景和需求。

神仙打架！Gemini 和GPT-4谁能笑到最后？

谷歌对 Gemini 模型进行了严格的测试，并评估了它们在各种任务中的表现。从自然图像、音频和视频理解，到数学推理等任务。

数据上看，Gemini Ultra是首个在 MMLU（大规模多任务语言理解数据集）任务表现上优于人类专家的大模型，得分率高达90.0%。作为对比，人类专家的成绩为89.8%，GPT4的成绩为86.4%。MMLU 数据集包含数学、物理、历史、法律、医学和伦理等 57 个科目，用于测试大模型的知识储备和解决问题能力。

Gemini Ultra在 MMLU任务表现上，得分率高达 90.0%

针对 MMLU 测试集的新方法使得 Gemini 能够在回答难题之前利用其推理能力进行更仔细地思考，相比仅仅根据问题的第一印象作答，Gemini 的表现有显著改进。

另一方面，Gemini也在多模态任务上全面超越了GPT-4V，谷歌称Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中，在其中 30 个测试集的性能超过当前 SOTA 结果。

Gemini是谷歌各个团队大规模合作的成果，包括谷歌研究院的研究者，这个模型从发布之初就定位为原生多模态结构，这意味着它能够跨越文本、图像、视频、音频和代码进行无缝推理。这与OpenAI的策略有所不同，后者首先推出了纯文字的GPT-3.5，直到GPT-4才开始加入视觉等多模态能力。

然而，尽管Gemini几乎在所有测试中都领先于GPT-4，但GPT-4本身就是一个巨大的飞跃，Gemini的领先优势似乎并不明显。对此，皮查伊表示，“我们必须意识到，当你试图从85%开始突破时，你已经处于曲线的末端。虽然看起来进展不大，但确实意味着我们仍在取得进展。”

他表示，对于其中一些新的基准，目前的技术水平仍然很低，未来还有很大的提升空间，“比例定律依然有效。随着模型的扩大，我们会看到更多的进展，我真的觉得我们才刚刚开始探索人工智能的潜力。我们还需要开发新的基准测试，这也是我们研究MMLU多模态基准的部分原因。”

而在OpenAI这边才刚刚经历了非常戏剧性的“董事会宫斗”，首席执行官奥尔特曼突遭董事会罢免，但最终迅速回归，给OpenAI未来发展也带来了许多不确定性的同时，也为包括谷歌在内其他行业内竞争者更多追赶的时间和机会。当然，Gemini发布的还是一支预告，真正有能力对标GPT-4的Gemini Ultra还是要到明年年初才会正式上线。

一年前，OpenAI 推出的 ChatGPT 一夜爆火，震动了谷歌和其他科技巨头，引发了整个行业对快速生成人工智能工具的争夺，以及关于人工智能风险和益处的全球辩论。一年后，谷歌推出了反击OpenAI的Gemini，并在很多能力上显示出对GPT-4的全面超越，GPT-5会再次让人眼前一亮吗？史上最强大的大模型“军备竞赛”，让我们拭目以待。

（本文图片来自谷歌官方）

【如果您有新闻线索，欢迎向我们报料，一经采纳有费用酬谢。报料微信关注：ihxdsb，报料QQ：3386405712】

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

Gemini 超越 GPT-4 靠作弊？谷歌承认：是的，演示视频经过了剪辑

4个月前

GPT-4 学会偷懒摸鱼，OpenAI仍未修复！网友吐槽：越更新越差

4个月前