日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

阿里通義DeepResearch開(kāi)源來(lái)襲,博士難題輕松解,AI深度研究新典范

   時(shí)間:2025-09-18 17:25:52 來(lái)源:新智元編輯:快訊團(tuán)隊(duì) IP:北京 發(fā)表評(píng)論無(wú)障礙通道
 

阿里旗下首個(gè)深度研究Agent模型——通義DeepResearch正式開(kāi)源,引發(fā)AI圈高度關(guān)注。該模型在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中表現(xiàn)亮眼,不僅在號(hào)稱(chēng)“人類(lèi)最后考試”的HLE榜單中以32.9%的成績(jī)超越DeepSeek-V3.1(29.8%)和OpenAI DeepResearch(26.6%),更在BrowseComp榜單上以43.4%的準(zhǔn)確率領(lǐng)跑開(kāi)源模型。

這款30B參數(shù)(激活3B)的模型之所以能實(shí)現(xiàn)“小體量、大能量”,核心在于其獨(dú)特的訓(xùn)練體系。研究團(tuán)隊(duì)構(gòu)建了“智能體合成數(shù)據(jù)”體系,通過(guò)Agentic CPT(增量預(yù)訓(xùn)練)技術(shù),將海量知識(shí)文檔、網(wǎng)頁(yè)數(shù)據(jù)、知識(shí)圖譜及工具使用記錄整合為開(kāi)放世界記憶庫(kù),自動(dòng)生成高質(zhì)量訓(xùn)練數(shù)據(jù)。這種“機(jī)器生產(chǎn)”模式不僅擺脫了對(duì)人工標(biāo)注的依賴(lài),更通過(guò)動(dòng)作合成技術(shù)生成規(guī)劃、推理、決策三類(lèi)數(shù)據(jù),使模型在離線(xiàn)狀態(tài)下即可探索海量推理路徑。

在數(shù)據(jù)處理層面,團(tuán)隊(duì)開(kāi)發(fā)了WebSailor V2全自動(dòng)合成方案,通過(guò)隨機(jī)游走構(gòu)建知識(shí)圖譜、策略性隱藏關(guān)鍵信息、集合論形式化建模等手段,確保生成的問(wèn)題既貼近真實(shí)場(chǎng)景又具有足夠復(fù)雜度。特別針對(duì)跨學(xué)科難題,該方案能驅(qū)動(dòng)配備網(wǎng)絡(luò)搜索、學(xué)術(shù)檢索工具的Agent,在循環(huán)中深化問(wèn)題,實(shí)現(xiàn)任務(wù)難度的可控升級(jí)。

面對(duì)長(zhǎng)程復(fù)雜任務(wù),通義DeepResearch創(chuàng)新采用雙模式推理架構(gòu)。標(biāo)準(zhǔn)任務(wù)下,模型通過(guò)ReAct模式(思考-行動(dòng)-觀察)憑借128K超長(zhǎng)上下文進(jìn)行多輪次快速交互;極端復(fù)雜任務(wù)則啟動(dòng)Heavy模式,將任務(wù)分解為多個(gè)研究輪次,每輪僅提取精華結(jié)論構(gòu)建新工作空間,通過(guò)“綜合-重構(gòu)”迭代保持認(rèn)知焦點(diǎn)。這種設(shè)計(jì)有效解決了傳統(tǒng)單窗口模式的信息過(guò)載問(wèn)題,使模型在HLE、BrowseComp等基準(zhǔn)上持續(xù)刷新紀(jì)錄。

訓(xùn)練流程方面,團(tuán)隊(duì)打通了“Agentic CPT→SFT→Agentic RL”端到端鏈路,首次提出兩階段增量預(yù)訓(xùn)練范式。在強(qiáng)化學(xué)習(xí)環(huán)節(jié),基于GRPO定制優(yōu)化的算法通過(guò)token級(jí)策略梯度損失函數(shù)、留一法策略降低估計(jì)方差,配合大批量訓(xùn)練維持監(jiān)督信號(hào)穩(wěn)定性。動(dòng)態(tài)指標(biāo)顯示,模型獎(jiǎng)勵(lì)值持續(xù)上升且策略熵保持高位,表明其始終處于探索進(jìn)化狀態(tài)。

基礎(chǔ)設(shè)施層面,團(tuán)隊(duì)構(gòu)建了全棧式訓(xùn)練環(huán)境:利用離線(xiàn)維基百科和自定義工具套件創(chuàng)建的仿真平臺(tái),擺脫了對(duì)實(shí)時(shí)Web API的依賴(lài);工具沙盒通過(guò)緩存結(jié)果、失敗重試等機(jī)制保障交互穩(wěn)定性;自動(dòng)數(shù)據(jù)管理系統(tǒng)形成“生成-訓(xùn)練”正向循環(huán);基于rLLM的異步框架實(shí)現(xiàn)多智能體并行訓(xùn)練。這些創(chuàng)新使模型從基座開(kāi)始,通過(guò)預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)自我進(jìn)化。

實(shí)際應(yīng)用中,通義DeepResearch已賦能高德“小高老師”和“通義法睿”兩大產(chǎn)品。在高德V16版本中,基于Qwen模型微調(diào)的POI推理Agent能處理地理區(qū)域、交通約束、時(shí)間約束等多維度信息,例如用戶(hù)要求“在西湖邊找評(píng)分4.5以上、有兒童餐、距地鐵站1公里內(nèi)的浙菜館”,AI可立即給出最優(yōu)解及路線(xiàn)規(guī)劃。法律領(lǐng)域,“通義法睿”通過(guò)迭代式規(guī)劃執(zhí)行多步查詢(xún),依托真實(shí)判例和法規(guī)提供可追溯分析,在答案要點(diǎn)、案例引用、法條引用質(zhì)量上超越同類(lèi)產(chǎn)品。

目前,開(kāi)發(fā)者可在Hugging Face、GitHub、ModelScope獲取模型及技術(shù)報(bào)告。GitHub項(xiàng)目已獲7.2k星標(biāo),顯示出社區(qū)的高度認(rèn)可。Hugging Face聯(lián)合創(chuàng)始人及斯坦福NLP實(shí)驗(yàn)室等科技大V的轉(zhuǎn)發(fā)關(guān)注,進(jìn)一步印證了該成果的技術(shù)影響力。

 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
欧美区一区二| 在线播放豆国产99亚洲| 国产伦精品一区二区三| 一本大道久久a久久精品综合| 亚洲国产欧美一区二区三区同亚洲 | 国产精品午夜在线| 国产农村妇女精品一二区| 国产精品国产福利国产秒拍| 欧美午夜精品理论片a级大开眼界| 欧美日韩精品免费| 国产视频久久| 99国内精品| 久久久久9999亚洲精品| 欧美日韩高清一区| 国产在线精品自拍| 亚洲伊人一本大道中文字幕| 欧美一区二区免费观在线| 欧美成人激情在线| 欧美亚洲在线观看| 久久婷婷影院| 国产欧美精品日韩| 一区二区三区视频在线| 欧美xx69| 亚洲精品久久久久久久久| 狂野欧美一区| 精品二区视频| 久久蜜桃精品| 亚洲电影毛片| 欧美www视频在线观看| 1024成人网色www| 久久久天天操| 在线观看欧美精品| 裸体一区二区| 国外精品视频| 久久国产主播精品| 国产女主播一区二区三区| 一区二区三区免费观看| 欧美精品性视频| 亚洲第一区在线观看| 久久久久久九九九九| 国内精品免费在线观看| 久久久久久久999精品视频| 91久久精品美女| 国产精品v日韩精品| 久久精品道一区二区三区| 亚洲美女尤物影院| 国产精品一区二区男女羞羞无遮挡 | 欧美精品情趣视频| 欧美在线看片| 日韩一区二区免费高清| 伊人天天综合| 国产日韩精品久久久| 欧美国产日韩一区二区三区| 久久精品国产清自在天天线| 亚洲一区二区三区影院| 亚洲美女视频网| 亚洲精品免费一区二区三区| 国外成人在线| 伊人狠狠色j香婷婷综合| 国产亚洲综合性久久久影院| 国产精品人人爽人人做我的可爱| 欧美日本一道本在线视频| 亚洲免费在线观看| 亚洲一区二区三区中文字幕在线| 国产精品一区视频网站| 国产精自产拍久久久久久| 国产精品视频久久久| 欧美日韩精品在线视频| 亚洲精品一区中文| 亚洲性图久久| 久久国产高清| 欧美激情国产日韩| 国产精品久久999| 国产欧美一区二区色老头| 一区二区三区在线看| 一区二区亚洲精品国产| 亚洲国产精品久久精品怡红院| 能在线观看的日韩av| 欧美色123| 欧美成人三级在线| 国产精品成人免费| 亚洲大胆美女视频| 亚洲一区二区三区免费视频| 久久成人免费| 精品1区2区3区4区| 国产精品亚洲а∨天堂免在线| 国产自产v一区二区三区c| 99热这里只有精品8| 久久综合福利| 国产综合欧美在线看| 亚洲欧美日本国产有色| 欧美交受高潮1| 在线免费观看欧美| 久久久久9999亚洲精品| 国产精品亚洲аv天堂网| 亚洲精品在线免费| 欧美成人高清视频| 国产日本欧美一区二区三区在线| 欧美日韩国产系列| 欧美精品一区二区三区一线天视频| 国产日韩欧美电影在线观看| 亚洲视频图片小说| 国产精品chinese| 亚洲少妇自拍| 国产亚洲在线| 久久久久久伊人| 亚洲二区视频在线| 欧美91精品| 亚洲综合色在线| 欧美色图首页| 亚洲一区日韩| 国产午夜精品理论片a级探花 | 国产一区日韩欧美| 久久婷婷人人澡人人喊人人爽 | 一区二区免费在线观看| 国产精品国产三级国产aⅴ入口| 国产午夜精品理论片a级大结局 | 欧美成人激情在线| 国产亚洲成人一区| 免费高清在线一区| 午夜精品免费视频| 日韩手机在线导航| 国产精品永久免费视频| 欧美日韩hd| 久久xxxx| 午夜一区在线| 欧美日韩直播| 亚洲欧美一区二区三区极速播放| 国产真实乱子伦精品视频| 欧美屁股在线| 欧美一区二区视频在线观看| 在线观看欧美精品| 激情欧美丁香| 国产精品亚洲综合| 免费观看一区| 久久久久久久一区| 久久久午夜精品| 久久精品国产欧美亚洲人人爽| 一区二区日韩欧美| 99精品免费| 亚洲一区二区av电影| 亚洲一区视频在线观看视频| 一区二区三区欧美在线| 日韩视频不卡| 在线观看一区欧美| 亚洲高清毛片| 亚洲二区三区四区| 亚洲第一毛片| 一本色道精品久久一区二区三区| 亚洲美洲欧洲综合国产一区| 99亚洲视频| 久久精品国产欧美激情| 裸体素人女欧美日韩| 国产一区视频在线看| 欧美性感一类影片在线播放 | 另类春色校园亚洲| 欧美精品久久99| 国产精品任我爽爆在线播放| 国产一区二区三区久久精品| 亚洲精品免费观看| 美女视频一区免费观看| 国产欧美一区二区精品忘忧草| 影院欧美亚洲| 久久av资源网站| 国产精品一级久久久| 99爱精品视频| 欧美激情精品| 亚洲国产精品精华液网站| 久久久国产精品一区二区中文 | 欧美区二区三区| 在线观看日韩av先锋影音电影院 | 亚洲免费一区二区| 欧美日韩专区在线| 欧美精品观看| 国产精品嫩草99a| 亚洲精品日本| 欧美日韩一区二区在线| 好吊日精品视频| 久久精品亚洲精品| 狠狠综合久久| 久久亚洲风情| av不卡免费看| 国产在线乱码一区二区三区| 久久综合九九| 亚洲欧美久久久| 在线成人中文字幕| 欧美另类久久久品| 欧美一级二区| 日韩亚洲欧美一区| 国产精品网站在线播放| 快播亚洲色图| 午夜精品久久久| 亚洲区一区二| 一区免费观看视频| 国产精品免费在线| 亚洲人屁股眼子交8| 久久国产精品久久久久久久久久 | 欧美日本国产精品| 欧美成人一二三| 狠狠综合久久av一区二区小说|