> 自媒体 > (AI)人工智能 > 国产开源MoE指标炸裂:GPT-4级别能力,API价格仅百分之一
国产开源MoE指标炸裂:GPT-4级别能力,API价格仅百分之一
来源:量子位
2025-02-06 15:22:26
624
管理

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

最新国产开源MoE大模型,刚刚亮相就火了。

DeepSeek-V2性能达GPT-4级别,但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。

因此一经发布,立马引发不小讨论。

从公布的性能指标来看,DeepSeek-V2的中文综合能力超越一众开源模型,并和GPT-4-Turbo、文心4.0等闭源模型同处第一梯队。

英文综合能力也和LLaMA3-70B同处第一梯队,并且超过了同是MoE的Mixtral 8x22B。

在知识、数学、推理、编程等方面也表现出不错性能。并支持128K上下文。

这些能力,普通用户都能直接免费使用。现在内测已开启,注册后立马就能体验。

具体效果如何,我们已抢先体验!

实测一下

目前V2内测版可以体验通用对话和代码助手。

还可以通俗解释什么是量子纠缠。

也能规避掉一些语言逻辑陷阱。

在一些基础Benchmark上,DeepSeek-V2基础模型表现如下:

DeepSeek-V2 采用了创新的架构。

提出MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理显存。

同时自研了Sparse结构,使其计算量进一步降低。

有人就表示,这些升级对于数据中心大型计算可能非常有帮助。

而且在API定价上,DeepSeek-V2几乎低于市面上所有明星大模型。

团队表示,DeepSeek-V2模型和论文也将完全开源。模型权重、技术报告都给出。

现在登录DeepSeek API开放平台,注册即赠送1000万输入/500万输出Tokens。普通试玩则完全免费。

感兴趣的童鞋,可以来薅羊毛了~

体验地址:https://chat.deepseek.comAPI平台:platform.deepseek.com

GitHub:https://github.com/deepseek-ai/DeepSeek-V2?tab=readme-ov-file

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
聚焦每日新资..(普通会员)
文章
1391
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40406 企业收录2984 印章生成244092 电子证书1088 电子名片62 自媒体73595

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索