DeepSeekR2要发布了吗Hugging Face CEO 发帖,暗示 DeepSeek R2 即将发布。目前泄露的信息:
1. 拥有 1.2 万亿参数,活跃参数为 780 亿,采用混合 MoE 架构
2. 成本比 GPT-4o 便宜 97.3%
3. 视觉能力更强,在 COCO 测试集上达到了 92.4%
如果真如爆料所说,低推理费用意味着它可以真正走向C端toB端的规模应用,对国内大模型生态,也是一次降维打击式的冲击。留给只会卷榜单,不会降成本的模型们,时间不多了。
DeepSeekR2要发布了吗Hugging Face CEO 发帖,暗示 DeepSeek R2 即将发布。目前泄露的信息:
1. 拥有 1.2 万亿参数,活跃参数为 780 亿,采用混合 MoE 架构
2. 成本比 GPT-4o 便宜 97.3%
3. 视觉能力更强,在 COCO 测试集上达到了 92.4%
如果真如爆料所说,低推理费用意味着它可以真正走向C端toB端的规模应用,对国内大模型生态,也是一次降维打击式的冲击。留给只会卷榜单,不会降成本的模型们,时间不多了。
猜你喜欢
【8评论】【4点赞】
【2评论】【1点赞】
【610评论】【522点赞】
【13评论】【2点赞】
【56评论】【5点赞】
作者最新文章
热门分类
科技TOP
科技最新文章