月之暗面公司今日震撼發布其備受矚目的Kimi研究功能,正式進軍競爭激烈的AI智能體領域。據悉,該功能在多項嚴格測試中展現出了卓越性能,特別是在“人類終極考驗”(HLE)測試中,以壓倒性優勢超越了谷歌與OpenAI的同類產品,榮登榜首。
Kimi研究功能的核心競爭力在于其自主研發的Kimi-Researcher智能體,這款智能體在多輪搜索與推理方面展現出了非凡的能力。據統計,Kimi-Researcher在執行任務時,平均會執行23個推理步驟,并瀏覽超過200個相關網頁,其強大的信息處理與分析能力令人矚目。
在HLE測試中,Kimi-Researcher基于Kimi k-系列模型的內部版本構建,并通過端到端的智能體強化學習進行訓練。其Pass@1得分率達到了26.9%,Pass@4準確率更是高達40.17%,刷新了業界記錄。尤為Kimi-Researcher的HLE初始得分僅為8.6%,經過強化學習訓練后,成績實現了質的飛躍,這充分證明了端到端智能體強化學習在提升智能體智能水平方面的巨大潛力。
Kimi-Researcher在多個復雜且具有挑戰性的真實世界基準測試中同樣表現出色。在xbench測試的xbench-DeepSearch項目上,Kimi-Researcher取得了69%的Pass@1得分率(四次運行平均值),優于其他配備搜索工具的模型。在涉及多輪搜索推理(如frameS、Seal-0)和事實性信息問答(如SimpleQA)的基準測試中,Kimi-Researcher同樣展現出了卓越的性能。
為了讓更多用戶能夠體驗到Kimi-Researcher的強大功能,月之暗面公司宣布,即日起將逐步向用戶開放內測申請。用戶只需訪問kimi.com即可提交申請。更令人期待的是,月之暗面公司計劃在未來幾個月內開源Kimi-Researcher背后的基礎預訓練模型以及經過強化學習訓練后的模型,這將為AI社區的發展注入新的活力。
感興趣的用戶可以訪問月之暗面公司的GitHub頁面(https://moonshotai.github.io/Kimi-Researcher/),了解更多關于Kimi-Researcher的詳細信息。