國慶假期前夕,AI行業迎來一場突如其來的“價格風暴”。DeepSeek于9月29日晚間發布實驗性模型DeepSeek-V3.2-Exp,同步啟動API價格大幅下調,輸入百萬Token價格最低降至0.2元,輸出價格直降75%至3元/百萬Tokens。這一激進定價策略迅速引發行業震動,被業界冠以“價格屠夫”的稱號。
價格調整呈現“雙軌制”特征:緩存命中場景下輸入價格從0.5元/百萬Tokens腰斬至0.2元,未命中場景從4元降至2元;輸出端價格從12元暴跌至3元,降幅達75%。橫向對比顯示,Anthropic最新發布的Claude Sonnet 4.5輸入輸出價格分別為3美元和15美元,按當前匯率計算,其輸出價格是DeepSeek新定價的30倍以上。國內廠商如智譜AI的定價體系也面臨顯著壓力。
支撐這場價格革命的是架構層面的技術突破。DeepSeek-V3.2-Exp在V3.1-Terminus基礎上引入稀疏注意力機制,通過細粒度注意力分配實現長文本處理效率的質的飛躍。技術團隊嚴格對齊訓練參數后發現,新模型在數學推理(AIME)、編程競賽(Codeforces)等專項評測中表現持平甚至小幅超越前代,驗證了“效率不降、成本大減”的技術路徑可行性。
這場技術革新與商業策略的雙重變奏,恰逢全球AI市場密集推新期。同日,Anthropic發布Claude Sonnet 4.5,強調在編碼、數學推理等領域的突破;智譜AI則將GLM-4.5標注為“上一代旗艦”,暗示GLM-4.6即將登場。三大廠商選擇在國慶假期前集中發力,形成獨特的“節日競爭效應”。
硬件生態的響應速度令人矚目。寒武紀在模型發布當日即完成適配,開源vLLM-MLU推理引擎代碼,股價次日應聲上漲超4%。華為昇騰通過vLLM/SGLang框架實現“Day 0支持”,華為云上線超節點推理服務。海光信息依托GPGPU架構完成DCU深度調優,強調“零等待”部署能力。這種硬件層的快速跟進,折射出中國AI產業鏈的成熟度。
開發者群體陷入“甜蜜的煩惱”。某技術人員在社區留言:“上周剛完成V3.1遷移,現在又要重新適配,國慶計劃徹底泡湯。”評測人員的工作量呈指數級增長,需同時跟蹤DeepSeek、智譜GLM-4.6和Claude Sonnet 4.5的性能表現。更復雜的是,作為實驗性版本,V3.2-Exp要求開發者在性能提升與系統穩定性間尋找平衡點。
這場技術迭代狂潮正在重塑行業規則。DeepSeek通過架構創新實現“效率躍遷”,證明算法優化可替代部分算力堆砌。當競爭對手還在追求參數規模時,其“小步快跑”策略已推動行業進入效率競爭的新階段。隨著硬件生態的深度適配,中國AI產業正形成從模型到芯片的完整創新閉環。











