埃隆?馬斯克旗下的人工智能公司xAI近日宣布,正式面向所有用戶推出其最新大語言模型Grok 4.1。該版本已全面覆蓋grok.com平臺及iOS、安卓移動應用,旨在提升模型在真實場景中的實用性,為用戶提供更智能、更人性化的交互體驗。
官方介紹稱,Grok 4.1在繼承前代模型高可靠性與敏銳智能的基礎上,重點優化了創造性、情感理解及協作互動能力。通過改進算法架構,新模型能夠更精準捕捉用戶意圖,生成更具連貫性和吸引力的對話內容,顯著增強了人機交互的“人情味”。
在性能測試中,Grok 4.1展現出行業領先水平。其具備深度思考能力的版本(代號quasarflux)在大型語言模型競技場(LMArena)文本能力排行榜中以1483的Elo分數登頂,領先第二名31分;而“即時響應”版本也以1465分位列第二,甚至超越其他模型的“全推理”模式。這一成績較前代Grok 4(排名第33位)實現質的飛躍,凸顯其底層技術優勢。
除通用能力外,Grok 4.1在“軟實力”方面同樣表現突出。在衡量情商的EQ-Bench3基準測試中,其推理與非推理模式包攬前兩名,展現出對情感、洞察力及人際交往的深刻理解;在創意寫作領域,Creative Writing v3測試結果顯示,兩種模式分列第二、第三,僅次早期的GPT-5.1模型,證明其既能處理復雜邏輯,也能進行富有想象力的內容創作。
針對大語言模型常見的“幻覺”問題,xAI在訓練后期通過優化信息查詢類提示的算法,顯著降低了事實性錯誤率。評估數據顯示,Grok 4.1在快速響應場景下提供的信息更可靠、更準確,尤其適合需要實時搜索工具支持的任務,進一步提升了實用價值。











