阿里云旗下通義團隊近日宣布,其最新研發的旗艦語言模型Qwen3-Max已正式上線官網,并首次引入"深度思考"功能模塊。該技術通過強化推理鏈的邏輯分析能力與復雜問題的多步驟拆解機制,在處理高難度任務時展現出顯著效率提升。
作為通義系列規模最大的語言模型,Qwen3-Max的參數量突破萬億級門檻,預訓練階段使用的數據規模達到36萬億token。這一技術突破使得模型在知識儲備和語義理解層面達到全新高度,為復雜推理任務提供了更強大的底層支撐。
在專項測試中,配備"深度思考"功能的Qwen3-Max-Thinking版本表現尤為突出。通過結合工具調用與動態計算資源分配機制,該模型在AIME 25數學競賽基準測試和HMMT(哈佛-麻省理工數學錦標賽)模擬測試中均取得滿分成績,展現出在數學推理領域的卓越能力。
據公開資料顯示,阿里云于今年第三季度末正式推出Qwen3-Max基礎版本。此次升級的"深度思考"模式,標志著通義團隊在語言模型架構設計上取得重要進展,通過模擬人類思維過程中的分步推導機制,有效提升了模型在邏輯推理、多步驟決策等場景下的表現。
相關技術文檔指出,該模型采用創新的注意力機制優化方案,在保持萬億參數規模的同時,將推理效率提升了40%。這種技術突破不僅體現在測試成績上,更在實際應用中展現出處理復雜商業問題、科研分析等場景的潛力。更多技術細節可通過專業AI資訊平臺獲取。











