RAG+GPT-4 Turbo让模型性能飙升！大海捞针实验成本仅4%-脚本导航

> 自媒体 > （AI）人工智能 > RAG+GPT-4 Turbo让模型性能飙升！大海捞针实验成本仅4%

RAG+GPT-4 Turbo让模型性能飙升！大海捞针实验成本仅4%

来源：新智元

2023-12-13 14:25:04

518

管理

编辑：桃子

【新智元导读】RAG或许就是大模型能力飙升下一个未来。

RAG GPT-4，4%的成本，便可拥有卓越的性能。

这是最新的「大海捞针」实验得出的结论。

如上图所示，assistant API （GPT-4 RAG）的性能近乎完美。

注意：这一性能仅适用于搜索式查询。大型上下文窗口还有其他用例（如少样本学习）。

成本

上下文窗口填充仅产生每个token的成本，而RAG产生每个token的成本，以及额外的固定LLM推理成本。

以下是每个token的成本：

延迟

RAG通常是针对离线数据进行的，检索延迟以毫秒为单位，端到端延迟主要由LLM调用决定。

但作者认为，比较一下从文件上传到返回结果的端到端延迟时间，看看RAG是否能与「在线」（而非离线）数据竞争，会很有意思。

以下是对128k token文档进行查询的端到端延迟：

- LlamaIndex RAG最低，平均为12.9秒。

- 其次是GPT4-Turbo，平均用时21.6秒，但差距很大，为7-36秒。

- assistant API RAG检索时间为24.8秒。

此外，大多数应用程序都能从乐观的文档上传中获益，从而最大限度地减少感知延迟。由于RAG索引的成本很低，通常不会有太大损失。

成本

RAG 成本分析有点微妙，因为它只是部分确定性的。RAG 的第一部分是检索，根据一些启发式（通常是矢量搜索）从更广泛的数据集中选择最「有前途」的文档块。

第二部分是生成增强，选择的块被输入到「标准」LLM调用中（并且随着通用性的增加，被输入到智能体LLM循环中）。

原则上，检索可以使用多种技术来实现，从关键字搜索到关系搜索，再到混合技术。

在实践中，大多数当代RAG方法主要使用矢量搜索，这会产生一次性、按token索引的成本。随着生态系统的成熟，混合技术的使用可能会越来越多。

每个token的成本

让我们首先看一下每个token的成本：

- GPT-4-Turbo 以 $0.01/1k token的价格。（与GPT-4和GPT-4-32k相比，价格分别降低了3倍和6倍） - OpenAI 的 ada v2 嵌入模型收费 0.0001 美元/1k token。这比GPT-4-Turbo便宜100倍。

- OpenAI 的助手 API 的检索功能价格更加昂贵。它以「无服务器」方式收费，0.20 美元/GB/助手/天。假设 1 个token ~ 5 个字节，即1×10^-6 美元/1k 个token/助手/天。

固定开销

开销部分很难计算（或者说不可能，在 OpenAI 的情况下），所以作者也只是凭经验测量它。

如结果部分所述，RAG还会产生固定开销，该开销源自LLM推理步骤。对于128k上下文，此固定成本为GPT-4上下文窗口的4%。

延迟

原则上，嵌入计算是高度可并行化的。因此，考虑到市场需求，未来的基础设施改进可能会将延迟降低到单个块嵌入的往返。

在这种情况下，可以看到即使是「在线」RAG管道延迟也会大大减少，以至于「在线」RAG延迟仅由LLM思维链循环的延迟主导。

参考资料：

https://www.reddit.com/r/MachineLearning/comments/18bivxa/d_needle_in_a_haystack_experiment_assistants_api/

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

chatgpt-4 vs 百度文心一言

微软放大招！GPT-4助力Office全家桶，打工人们还能活吗？

相关文章

国乒22岁新星出轨队友！聊天记录曝光球迷现场起哄父亲注销账号..

国乒22岁新星出轨队友！聊天记录曝光球迷现场起哄父亲注销账号！*前女..

侵入他人计算机盗取虚拟币套现2800万，7人因盗窃罪获刑..

澎湃新闻（www.thepaper.cn）5月24日从宁波江北区检察院获悉，日前，由该..

ChatGPT之所以火，是因为我们被“人工智障”折磨太久

ChatGPT之所以大火，是因为它真的做到了智能化，不仅能帮助你进行总结、..

GPT4接口开放意味着什么

GPT-4接口开放意味着什么？KOAYEE。这些营销号就不要再来误导人了。就在..

朋友圈刷屏的ChatGPT究竟是什么？警方紧急提醒！

最近每个人似乎都在谈论ChatGPT这个爆火的软件围绕它的是无数人的好奇心..

一键生成PPT！微软再放大招：GPT-4全面植入Office全家桶..

微软正在将ChatGPT同源技术嵌入办公软件中，在办公场所辅助用户工作。当..

首发|实测阿里版GPT“通义千问”，实力玩家现身了！

ChatGPT （ 3.5 版本，下同）的回答是：从这一轮来看，ChatGPT 对刁钻的..

又一封“警惕AI”公开信！这次ChatGPT之父也签名了

5月30日，又一封“警惕AI、保护人类”的公开信发出——而这一次，“AI三..

OpenAI：将向所有ChatGPT Plus用户开放这一超级功能，人人都能成为数据分析..

每经编辑：杜宇7月8日凌晨，OpenAI在社交平台宣布，下周，将向所有ChatGP..

关于作者

清水大树(普通会员)

文章

365

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

聊天交友软件常用骗局（套路）交友需小心！

10个月前

02

微信聊天时，女人说“哼哼”，10个高情商回复

7个月前

03

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

8个月前

04

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

05

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

10个月前

标签云

成员 网址收录40329 企业收录2981 印章生成186826 电子证书796 电子名片49 自媒体20891

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索