相比 ChatGPT 能力有大进化,多模态上有突破但不多。
作者丨李梅 黄楠
编辑丨岑峰
今日,多模态大模型 GPT-4 震撼登场!
GPT-4 能够接受图像和文本输入,输出文本,在各项测试和基准上的表现已经与人类水平相当。
OpenAI 一次性大放送,发布了 GPT-4 的技术报告、system card,并提供了 ChatGPT Plus 体验、GPT-4 的 API waitlist、demo 视频,以及用于自动评估 AI 模型性能的 OpenAI Eval 框架。
Sam Altman 称,GPT-4 是“我们迄今为止最强大、对齐最好的模型”。
GPT-3.5
(图片来源:知乎网友:@连诗路)
此次更新中,GPT-4 最令人惊喜的能力,是它可接受图片输入,并对图片生成说明、分类和分析。比如输入一张有鸡蛋、面粉和牛奶的图片,询问 GPT-4 可以使用这些原材料做什么,得到的结果如下:
GPT-4 可以实现从图片中提取文字信息并输出到 HTML,比如尝试手绘一个笑话网站模型,让 GPT-4 尝试自动生成网站的原型图(程序员嗅到了危险的味道):
手绘的笑话网站模型图
据 McMillan 介绍,摩根士丹利财富管理在 GPT-4 引入后将分为三个部分进行,第一部分的落脚点在 GPT-4 的“几乎瞬间访问、处理和合成内容的非凡能力”上,即基于互联网大量文本进行训练,并在单词、句子、概念和想法之间建立关系。
第二个落脚点在摩根士丹利的智力资本,摩根士丹利创立有一个独特的内部内容存储库,后续将通过 GPT-4 进行处理和解析,并受公司内部控制的约束。
最后一部分在公司的人员上,摩根士丹利就 GPT-4 进行了培训,每天有200多名员工查询相关系统并提供反馈,尽可能实现由内部聊天机器人完成全面搜索财富管理内容。McMillan 表示,这项工作还将进一步丰富摩根士丹利顾问与其客户之间的关系,使他们能够更快地帮助更多人。
Duolingo 也推出了一种由 GPT-4 提供支持的学习体验 Duolingo Max,新增“Explain My Answer(解释我的答案)”和“Roleplay(角色扮演)”两大功能。
角色扮演
在 Explain My Answer 中,学习者通过在某些练习类型之后点击一个按钮,可以进入与 Duo 的聊天获得答案解释,并要求举例或进一步说明;Roleplay 功能允许学习者与应用程序中的角色进行对话,角色覆盖多个真实场景,包括在巴黎的咖啡馆点咖啡、邀请朋友一起旅行、未来的假期计划等。
参考链接:
https://openai.com/product/gpt-4
https://openai.com/contributions/gpt-4
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
相关文章
猜你喜欢