通義千問團隊近日宣布推出全新大模型Qwen3-Max,該模型被定義為團隊迄今為止規模最大、性能最強的語言模型。據技術文檔披露,Qwen3-Max的總參數量突破1萬億,預訓練階段消耗了36萬億個token的數據量,其架構延續了Qwen3系列的設計范式,并引入了團隊自主研發的global-batch負載均衡損失函數。
在權威評測平臺LMArena的文本生成榜單中,Qwen3-Max-Instruct的預覽版本已躋身全球前三,性能表現超越同期版本的GPT-5-Chat。最新發布的正式版本通過架構優化,在代碼生成、智能體交互等專項能力上實現顯著提升,在涵蓋知識儲備、邏輯推理、編程實現、指令響應、價值觀對齊、多任務代理及跨語言理解等維度的綜合評測中,均達到行業領先水準。
專項測試數據顯示,該模型在現實編程場景下的表現尤為突出。在針對軟件工程實際問題的SWE-Bench Verified評測中,Qwen3-Max-Instruct以69.6分的成績穩居全球頂級模型行列。研發團隊特別強調,正式版本通過增強代碼解釋器與并行測試時計算技術的融合,使模型在復雜系統開發中的代碼生成準確性和效率得到質的提升。
值得關注的是,團隊同步推出的推理增強版Qwen3-Max-Thinking展現了突破性的數學推理能力。在AIME 25和HMMT兩項國際數學競賽級基準測試中,該版本均取得滿分成績,標志著模型在符號計算、定理推導等高階認知領域的突破。技術白皮書指出,這種性能躍升得益于代碼解釋器與多路徑推理機制的深度整合。
據開發團隊介紹,Qwen3-Max系列模型在訓練階段就特別注重多模態能力的協同發展。通過創新的數據混合策略,模型在保持文本處理優勢的同時,顯著提升了在結構化數據解析、多語言混合語境理解等場景下的適應能力。目前,該系列模型已開放商業應用接口,開發者可通過指定渠道獲取技術文檔與開發套件。
行業分析師指出,Qwen3-Max的發布標志著國產大模型在萬億參數賽道實現重要突破。其獨特的損失函數設計和推理架構創新,為解決超大規模模型訓練中的梯度消失問題提供了新思路。隨著正式版本的全面上線,預計將在智能客服、代碼開發、科研計算等領域引發新一輪應用變革。
獲取更多人工智能領域前沿資訊,可訪問專業信息平臺:http://www.aipress.com.cn/,實時追蹤全球AI技術發展動態。