當全球AI領域陷入“參數至上”的激烈競爭時,微博AI團隊以一場顛覆性突破,為行業開辟了全新的發展路徑。近日,微博正式推出自主研發的開源大模型VibeThinker,這款僅含15億參數的“輕量級選手”,在國際權威數學競賽基準測試中,以驚人表現擊敗了參數規模達6710億的DeepSeek R1模型,引發全球AI研究界的廣泛關注。
在傳統認知中,AI模型的參數量被視為衡量其能力的核心指標。行業普遍認為,復雜推理能力需要千億級參數支撐,小模型因參數不足難以應對高難度任務。然而,微博AI團隊通過優化模型架構與訓練范式,創新提出“頻譜到信號原理”(SSP)訓練方法,成功挖掘出小模型的隱藏潛力。VibeThinker在AIME24、AIME25及HMMT25等高難度數學測試中,表現超越參數量超其400倍的DeepSeek-R1-0120版本,與4560億參數的MiniMax-M1效果相當,甚至可媲美Gemini 2.5 flash和Claude Opus 4等頂尖模型。在編程算法測試集LiveCodeBench v6中,其成績也追平了歐洲領先AI企業Minstral.AI的Magistral-Medium-2506版本。
這一突破不僅重新定義了AI模型的評價標準,更以極致的成本效益顛覆了行業格局。據公開數據,2025年主流大模型單次后訓練成本普遍在數十萬美元級別。例如,上海AI企業MiniMax今年6月發布的M1模型,訓練成本約53.5萬美元;DeepSeek的R1模型訓練總成本(含基礎模型開發)約630萬美元。相比之下,VibeThinker的后訓練過程(含SFT和RL階段)僅消耗3900個GPU小時,按市場租賃價格計算,總成本僅7800美元,成本效益比達到30至60倍。這一優勢意味著,前沿AI技術不再為科技巨頭所壟斷,中小型機構和研究團隊也能以極低門檻參與創新,推動行業向更開放、多元的方向發展。
技術突破的最終價值在于落地應用。微博已將AI技術深度融入平臺生態,構建起覆蓋多場景的智能服務體系。2024年,微博自主研發的“知微”大語言模型通過備案,并陸續推出智搜、內容總結、AI互動號等功能。其中,微博智搜通過分析平臺海量內容構建可信知識圖譜,實現精準需求捕捉與情感場景理解,6月月活躍用戶突破5000萬;評論羅伯特作為AI互動賬號,從毒舌風格進化出溫情與聰明版本,全網粉絲近200萬,成為用戶熱議的交流對象。
隨著VibeThinker的發布,微博AI戰略邁入新階段。公司計劃深度融合心理等垂直領域的數據資產,打造更懂公眾情緒、更能服務社會需求的專屬模型。這一模型不僅將優化現有AI產品體驗,更可能裂變出兼具社交屬性與智能服務的全新生態。例如,VibeThinker的技術有望降低微博智搜的算力損耗和實時互動場景的AI響應成本,使平臺在規模化投入AI能力時無需承擔過高資源壓力,進一步釋放生態創新能力。
目前,VibeThinker仍處于實驗性版本階段,其研發重點聚焦于強化小模型在數學與編程領域的能力,尚未針對日常聊天等場景進行優化。但這一探索已為AI產業提供了全新思路:通過算法創新而非單純堆砌參數,小模型同樣能實現高性能與低成本的雙贏,為行業從“規模競賽”轉向“效率革命”奠定基礎。











