國際權威學術期刊《自然》最新一期(第645期)封面文章,聚焦中國團隊在大語言模型領域的突破性進展。由梁文鋒擔任通訊作者的DeepSeek團隊,通過純強化學習路徑顯著提升模型推理能力的研究成果,引發全球科技界關注。該研究證實,無需依賴大規模人工標注數據,模型即可在數學解題、編程競賽等復雜任務中達到研究生水平表現。
研究團隊創新性采用"無監督冷啟動"策略,摒棄傳統監督微調(SFT)方法,轉而通過大規模強化學習(RL)實現模型進化。實驗數據顯示,DeepSeek-R1在解決數學難題時,能自動生成結構化推理鏈,并通過問題解決質量獲得動態獎勵反饋。這種機制使模型學會優化思考路徑,例如在DeepSeek-R1-Zero版本中,觀察到模型主動調整思考時間分配策略,展現出類似人類的認知靈活性。
針對早期外界關于"模型蒸餾"技術的質疑,研究團隊在論文中詳細披露技術路徑。通過對比實驗證明,純強化學習訓練的模型在STEM領域表現超越傳統方法,且人類標注工作量減少達70%。這種技術突破為降低大模型訓練成本提供了新思路,特別在專業領域知識獲取方面具有顯著優勢。
在模型迭代方面,DeepSeek團隊保持快速推進節奏。繼年初開源模型引發行業震動后,8月推出的V3.1版本實現三大技術升級:混合推理架構支持即時響應與深度思考雙模式、思考效率較前代提升40%、智能體工具調用能力增強25%。值得關注的是,該版本專門針對國產芯片架構優化參數精度,采用UE8M0 FP8 Scale技術,直接帶動相關芯片產業鏈股價單日上漲超5%。
資本市場對AI技術突破反應熱烈。Choice數據顯示,科創人工智能ETF華夏單日漲幅達3.8%,東財人工智能指數收漲2.43%。資金流向監測顯示,9月以來超過400億元科創債ETF完成發行,其中13只產品規模突破29億元。私募機構參與定增數據顯示,電子板塊獲配金額達10.98億元,占全年定增總額的27.7%,顯示機構對AI硬件基礎設施的持續看好。
主流投資機構普遍認為,AI產業鏈已進入規模化落地階段。望正資產指出,商業模式成熟、具備盈利增長潛力的AI算力與應用企業將成為重點布局方向。淡水泉投資則強調,在AI科技、創新藥等新興領域,具有持續業績表現的行業龍頭將持續獲得資金青睞。這種技術突破與資本投入的良性互動,正在重塑中國科技產業的競爭格局。