整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
ChatGPT、GPT-3、GPT-4、text-davinci-003......近两年来,大模型层层出不穷,使人眼花缭乱,在不同的场景下,很多研究人员往往不知该作何选择?
为了解决这一难题,微软亚洲研究院和浙江大学的研究团队展开合作,发布了一个大模型协作系统——HuggingGPT,让 ChatGPT 与人工智能社区 HuggingFace 连接起来,将语言作为通用接口,让 LLM 作为控制器,管理行业内现有的所有人工智能模型。
「解决不同领域和模式的复杂人工智能任务是迈向 AGI 的关键一步」,研究团队在最新发布的 HuggingGPT 论文(https://arxiv.org/pdf/2303.17580.pdf)伊始说道。
HuggingGPT 的原理
具体来看,我们使用 ChatGPT 在收到用户请求时进行任务规划,根据机器学习社区 Hugging Face 中的功能描述选择模型,用选定的人工智能模型执行每个子任务,并根据执行结果总结响应。
通过利用 ChatGPT 强大的语言能力和 Hugging Face 中丰富的人工智能模型,HuggingGPT 能够覆盖不同模式和领域的众多复杂的人工智能任务,并在语言、视觉、语音和其他挑战性任务中取得令人印象深刻的结果,为实现高级人工智能铺设了一条新的道路。
根据论文解释,HuggingGPT 的整个过程可以分为四个阶段:
任务规划:使用 ChatGPT 分析用户的请求,了解他们的意图,并将其拆解成可解决任务。
模型选择:为解决计划任务,ChatGPT 根据描述选择托管在 Hugging Face 上的模型。
任务执行:调用并执行每个选定的模型,并将结果返回给 ChatGPT。
响应生成:最后使用 ChatGPT 整合所有模型的预测,进行总结和输出。
HuggingGPT 也可以对音频和视频模式的多模型合作进行定性分析:
为了更好地落地这个愿景,研究团队在 GitHub 上开源了它的基础代码(https://github.com/microsoft/JARVIS),且命名为“Jarvis”(贾维斯),供大家参考学习。
值得注意的是,很多网友直言,它的系统要求可能会直接劝退了不少人:
但是 HuggingGPT 也可以作为通往 AGI 的准入口。
https://github.com/microsoft/JARVIS
https://arxiv.org/pdf/2303.17580.pdf
相关文章
猜你喜欢
成员 网址收录40405 企业收录2984 印章生成242216 电子证书1086 电子名片61 自媒体69011