馬斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"雙商在線"的定位向GPT-5.1發起挑戰。這款模型分為Thinking(推理版)和標準版兩個版本,現已在Grok官網、X平臺及移動端應用全面開放免費體驗。
在權威評測平臺LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標準版同樣表現亮眼,直接占據榜單次席。更引人注目的是,該模型在情商專項測試EQ-Bench3中延續強勢表現,Thinking版本以1586分刷新紀錄,標準版與國產模型Kimi K2分列二三位。
實測顯示,新模型在交互體驗上實現質的飛躍。相比前代產品,Grok 4.1展現出更強的共情能力,不僅會耐心傾聽用戶訴求,還能在回復結尾添加愛心符號增強情感表達。創作能力方面,其文本生成評分較前代提升600分,生成內容兼具邏輯性與畫面感。通過優化訓練架構,模型幻覺率從12.09%降至4.22%,信息準確性顯著提升。
技術團隊披露,此次突破源于對強化學習框架的深度革新。xAI在既有大規模強化學習基礎設施上,開發出利用智能體推理模型作為獎勵機制的新方法,實現自主評估與迭代響應。后訓練負責人Dustin Tran透露,團隊通過分析數百萬條真實對話數據,結合智能體評分系統,將強化學習規模擴大10倍,同時將RLHF(基于人類反饋的強化學習)技術推向新高度。
值得關注的是,xAI近期因團隊構成引發討論。社交平臺流傳的合影顯示,其核心研發團隊以華裔科學家為主。有消息稱,公司近期調整了人員結構,但官方尚未對此作出回應。這種人才聚集現象,某種程度上反映出全球AI領域的技術競爭格局。
關于備受期待的Grok 5,馬斯克在最新訪談中透露,這款參數規模達6萬億的模型將推遲至明年發布。他解釋稱,作為通向通用人工智能(AGI)的重要里程碑,Grok 5需要更強大的計算資源支持,目前團隊正進行極端嚴格的測試驗證。這一表態與此前報道中提到的"資源限制與測試需求"形成呼應。
行業觀察人士指出,Grok 4.1的發布既是技術迭代成果,也彰顯了馬斯克的AI戰略野心。不過隨著谷歌Gemini 3.0等競品即將入場,今年大模型領域的競爭格局仍存變數。這場由科技巨頭主導的AI競賽,正在不斷刷新人類對智能邊界的認知。











