美中AI激?中DeepSeek推「稀疏注意力」新功能

商媒|者任/合外
中AI新DeepSeek再度矽谷投下震撼,公司一透Hugging Face出最新模型DeepSeek-V3.2-Exp,在有V3.1-Terminus基上,一步化效率降低算成本,引入名DSA(DeepSeek Sparse Attention,稀疏注意力)的新功能,能AI文本理的成本半。
Hugging Face中社群人Adina Yakefu指出,V3.2的重大突破在於稀疏注意力,能模型更快理文件或,同成本前一代的一半。The Futurum Group副裁Nick Patience,使AI更容易被中小企、研究人者使用,可能推新一波用潮。
大型言模型往往「全考」料,而稀疏注意力主被不重要的,注於最相的部分。以航空公司航例,AI快速剔除不合理,短算省源。
不,BlankPage Capital共同人Almasque提醒,效率提升的同,模型可能失去「度」;若制,排除,果可能偏差甚至危及安全性公平性,Almasque直言:「或不是最安全或最佳的架。」
DeepSeek去年突推出R1模型,以低成本展媲美尖手的性能,明中新在晶片受限情下仍能大模型,一度迫使字跳、阿里等同降。如今再推版本,示公司延「高效低」策略,挑美OpenAIMeta等科技巨的技路。
此同,界也注,DeepSeek次以「架」市,但在安全性、可靠性合性上仍待,尤其在AI被泛用於、金融公共服,任何都可能造成重大。

- 者:商媒
- 更多科技新 »