阿里巴巴今日宣布,正式開源其自主研發的首個深度研究智能體模型——通義DeepResearch。該模型憑借3B激活參數,在Humanity’s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA及frames等權威評測中,性能表現超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗艦模型的ReAct智能體。
當前,通義DeepResearch的模型、框架及配套方案已通過GitHub、Hugging Face及魔搭社區全面開源,開發者和用戶可自由下載模型與代碼。開源版本基于Qwen3-30B-A3B模型優化,支持兩種推理模式:ReAct模式用于驗證模型基礎能力,Heavy模式通過test-time scaling策略充分釋放性能潛力,確保在長周期任務中維持高質量推理。
針對深度研究領域長期存在的“認知空間窒息”與“不可逆噪聲污染”問題,阿里通義團隊構建了合成數據驅動的完整訓練鏈路。該鏈路覆蓋預訓練與后訓練階段,結合異步強化學習算法及自動化數據策展流程,通過真實與虛擬環境混合訓練,顯著提升了模型迭代速度與泛化能力。實驗表明,該方案有效解決了傳統“單窗口、線性累加”模式在處理復雜任務時的推理能力衰減問題。
作為AI研究熱點,深度研究領域已吸引谷歌、OpenAI、Anthropic等企業投入研發。此次開源的通義DeepResearch通過輕量化設計(3B激活參數)實現了高性能表現,為開發者提供了攻克長周期復雜研究任務的新工具。其技術路徑突破了傳統方法的局限性,通過動態認知空間管理與噪聲抑制機制,顯著提升了模型在多步驟推理任務中的穩定性。
開源地址:
GitHub:https://github.com/Alibaba-NLP/DeepResearch
Hugging Face:https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B
魔搭社區:https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B
此次開源進一步豐富了阿里在AI智能體領域的布局。此前,阿里已陸續開源WebWalker、WebDancer和WebSailor等多款檢索與推理智能體,均在開源社區取得領先成績。通義DeepResearch的發布,標志著阿里在深度研究賽道形成了覆蓋基礎模型、訓練框架到應用方案的完整技術體系。