特首李家超三连问deepseek 目前整个团队不到300人,其中研发人员的占比超过一半。
李家超以「三连问」的形式,开启了他与「杭州六小龙」的对话。
企业代表徐轶凡介绍,基于自研的训练模型、计算集群及万卡算力,团队仅用半年时间便开源了多个百亿参数大模型,在各个榜单上都有不俗的表现,「我们还有个外号叫AI界的拼多多,整个训练成本不到600万美金,是OPEN AI的十分之一左右。」
在徐轶凡看来,深度求索能在短短的时间里取得这样的成绩,是因为企业从诞生的那天起便将「自主研发」放在了十分重要的位置上,「自2023年11月发布第一个百亿参数大模型后,深度求索一直保持着高频的研发节奏,目前整个团队不到300人,其中研发人员的占比超过一半。」