阿里云旗下通義實驗室近日傳來喜訊,其傾力打造的網絡智能體WebSailor正式宣布開源。這款智能體在OpenAI的高難度評測集BrowseComp中,以卓越的推理與檢索能力,勇奪開源榜單榜首,彰顯了其強大的技術實力。
WebSailor專為應對復雜多變的網絡場景而生,它擅長處理模糊性問題,通過多步驟的推理過程和交叉驗證技術,能夠從浩如煙海的網絡信息中精準抽取出答案。通義實驗室采用了前沿的post-training方法,對模型進行了深度優化,使其在網頁推理任務中的表現有了顯著提升。在BrowseComp評測中,WebSailor的兩個版本——WebSailor-32B和WebSailor-72B,不僅超越了DeepSeek R1、Grok-3等一眾開源模型,還力壓部分非開源系統,僅次于OpenAI的DeepResearch,展現了其非凡的競爭力。
不僅如此,WebSailor在普通任務數據集SimpleQA上的表現同樣令人矚目,這進一步驗證了其強大的泛化能力。阿里云方面表示,WebSailor的通用工作流以及“高難度任務合成+高效RL優化”的策略,為開源社區解決復雜推理、學術發現等領域的難題提供了寶貴的參考和啟示。
此次WebSailor的開源,無疑將為整個AI領域注入新的活力。其構建方案及部分數據集已在GitHub上公開,期待更多開發者能夠基于這一平臺,共同推動AI技術的創新與發展。