在奥特曼和马斯克都处吹嘘新产品时,DeepSeek低调的又发了新论文,梁文锋也是

听风谈 2025-02-18 23:32:59

在奥特曼和马斯克都处吹嘘新产品时,DeepSeek低调的又发了新论文,梁文锋也是共同作者。新论文公布一项创新成果“原生稀疏注意力”(Native Sparse Attention,NSA)。传统大模型处理长文本占用算力资源很大,而NSA通过类似图片压缩的算法,将64k长文本的处理速度提升了11.6倍。再次用中国模式,革命性的减少算力资源。

0 阅读:70
听风谈

听风谈

感谢大家的关注