據報道,DeepSeek公司近日正式發(fā)布了新一代大模型——DeepSeek-V3.1。該模型采用全新設計的“UE8M0 FP8 Scale”精度格式,專為國產AI芯片優(yōu)化,被業(yè)界視為中國大模型在底層算力標準上的一次重要戰(zhàn)略調整。消息一經公布,便在半導體及人工智能領域引發(fā)廣泛關注和討論。
FP8技術是一種8位浮點數計算方法。相比傳統(tǒng)的FP16和FP32,FP8在降低能耗的同時大幅提升計算效率。其優(yōu)勢包括算力密度倍增、能耗顯著下降、推理速度提升超過40%,以及存儲需求減少50%至75%,為構建高效AI算力生態(tài)提供了核心技術支撐。
DeepSeek提出的UE8M0 FP8是FP8技術的一種特殊實現,通過“無符號+長指數”設計,將數值范圍擴大32倍,更適合中文大模型的運算需求。這一創(chuàng)新不僅顯著提升模型性能,還減少了對海外芯片的依賴,為國產芯片提供了更優(yōu)支持。
其中,被點名的潛在合作廠商包括華為、寒武紀、摩爾線程、海光信息及沐曦集成電路。國產芯片如海光深算三號DCU、沐曦曦云C600、摩爾線程MTT S5000等已支持FP8計算。華為昇騰910B和910C預計將在2025年第四季度支持原生FP8,而2026年可能推出的昇騰910D(暫定名)也將具備該能力,實現與DeepSeek大模型的深度協(xié)同。
業(yè)界普遍認為,DeepSeek-V3.1的發(fā)布不僅是一次常規(guī)升級,更標志著中國在AI底層技術領域取得的重要突破。通過建立差異化技術路徑,中國有望在FP8標準上形成自主規(guī)格,推動“芯片—模型—應用”完整生態(tài)建設,為AI算力自主化奠定堅實基礎。這場低調而深遠的算力革命正在悄然展開。