DeepSeekR2要发布了吗HuggingFaceCEO发帖,暗示De

基地科技切片 2025-04-27 17:11:29

DeepSeekR2要发布了吗Hugging Face CEO 发帖,暗示 DeepSeek R2 即将发布。目前泄露的信息:

1. 拥有 1.2 万亿参数,活跃参数为 780 亿,采用混合 MoE 架构

2. 成本比 GPT-4o 便宜 97.3%

3. 视觉能力更强,在 COCO 测试集上达到了 92.4%

如果真如爆料所说,低推理费用意味着它可以真正走向C端toB端的规模应用,对国内大模型生态,也是一次降维打击式的冲击。留给只会卷榜单,不会降成本的模型们,时间不多了。

0 阅读:19
基地科技切片

基地科技切片

感谢大家的关注