日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

為什么Agent總是Demo猛如龍實戰(zhàn)一條蟲?

   時間:2025-12-22 23:04:37 來源:量子位編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

為什么Agent在演示時無所不能,到了實際場景卻頻頻拉胯?

一篇長達51頁的論文研究了自ChatGPT以來的主要智能體,給出參考框架:適應(yīng)性是其中關(guān)鍵。

智能體定義上不是只會被動回答的AI,而是能自己規(guī)劃、用工具(比如搜索引擎、代碼編譯器、數(shù)據(jù)庫)、記東西,一步步完成復雜任務(wù)。

當遇到新任務(wù)、新環(huán)境時,不需要重造一個新的智能體,而是通過 “微調(diào)自己” 或 “優(yōu)化工具”,快速適配需求(比如從寫普通代碼適配到寫垂直行業(yè)代碼)。

這篇論文作者陣容豪華,來自UIUC、斯坦福、普林斯頓、哈佛、UC伯克利等12所高校的三十多位研究者聯(lián)手,由UIUC的韓家煒教授團隊領(lǐng)銜,共同一作Pengcheng Jiang,Jiacheng Lin,Zhiyi Shi為UIUC博士生。

Agent“適應(yīng)性”的四個象限

團隊認為,當前Agent系統(tǒng)的核心瓶頸在于適應(yīng)性:模型如何根據(jù)反饋信號調(diào)整自身行為。

為此,他們提出了一個2×2的分類框架,把現(xiàn)有的適應(yīng)方法切成了四大范式。

第一個維度是“優(yōu)化誰”:是優(yōu)化Agent本身(Agent Adaptation),還是它調(diào)用的工具(Tool Adaptation)。

第二個維度是“信號從哪來”:是來自工具執(zhí)行的結(jié)果,還是來自Agent最終輸出的評估。

據(jù)此分成四類:

A1范式讓Agent根據(jù)工具執(zhí)行的反饋來學習,比如代碼能不能跑通、檢索結(jié)果準不準。

A2范式則是用Agent的最終答案作為優(yōu)化信號,典型代表就是DeepSeek-R1這類用強化學習訓練推理能力的工作。

T1范式是即插即用:工具獨立訓練好,Agent直接調(diào)用,比如SAM、CLIP這些預(yù)訓練模型。

T2范式讓工具反過來根據(jù)Agent的輸出來優(yōu)化自己,形成一種共生適應(yīng)的關(guān)系。

這樣分類之后,有兩個好處:

開發(fā)遇到問題時,不用盲目試錯。想讓AI更擅長工具的使用細”,就選 A1;想讓整體推理更靠譜,就選A2;想讓工具通用好用,就選T1;想讓工具適配特定AI,就選 T2。

另外也明確了trade-off。改AI(A1/A2)靈活但成本更高,需要重新訓練模型。改工具(T1/T2)省錢,但受限于 AI 本身的能力。

論文中還有一個關(guān)鍵發(fā)現(xiàn):T2范式的數(shù)據(jù)效率遠超A2范式。

以檢索增強生成任務(wù)為例,Search-R1采用A2范式端到端訓練Agent,需要約17萬條訓練樣本。

而采用T2范式,只訓練一個輕量級的搜索子智能體來服務(wù)凍結(jié)的主模型,僅用2400條樣本就達到了相當?shù)男Ч?shù)據(jù)量減少了約70倍,訓練速度快了33倍。

更值得注意的是泛化能力的差異。在醫(yī)學問答這種專業(yè)領(lǐng)域測試中,T2訓練的智能體達到了76.6%的準確率,而A2訓練的Search-R1只有71.8%。

論文分析認為,這是因為A2范式要求模型同時學習領(lǐng)域知識、工具使用技能和任務(wù)推理三件事,優(yōu)化空間過于復雜;而T2范式下,凍結(jié)的大模型已經(jīng)具備知識和推理能力,小模型只需要學習“怎么搜”這一項程序性技能。

四大前沿方向指路

論文最后指出了Agent適應(yīng)性研究的四個前沿方向。

協(xié)同適應(yīng)(Co-Adaptation)是最具挑戰(zhàn)性的課題。目前幾乎所有方法都是“凍一個、調(diào)一個”,但未來理想的系統(tǒng)應(yīng)該讓Agent和工具在同一個學習循環(huán)中相互優(yōu)化。這帶來了復雜的信用分配問題:任務(wù)失敗了,到底該怪Agent還是工具?

持續(xù)適應(yīng)(Continual Adaptation)針對的是真實世界的非平穩(wěn)性。任務(wù)分布會隨時間變化,工具會更新,用戶需求會演進。如何讓Agent持續(xù)學習新技能而不遺忘舊能力,是部署層面的核心難題。

安全適應(yīng)(Safe Adaptation)揭示了一個令人擔憂的現(xiàn)象:大模型在強化學習優(yōu)化推理能力的過程中,會逐漸侵蝕掉監(jiān)督微調(diào)階段建立的安全護欄。模型學會了用復雜的“思維鏈”給自己的違規(guī)行為編造理由,反而更容易被越獄攻擊。

高效適應(yīng)(Efficient Adaptation)關(guān)注的是資源受限場景。論文介紹了LoRA在強化學習中的應(yīng)用、FlashRL的量化加速技術(shù),以及端側(cè)設(shè)備的個性化適應(yīng)方案。

這篇綜述的GitHub倉庫已經(jīng)開放,持續(xù)收錄相關(guān)論文和資源。對于正在搭建Agent系統(tǒng)的開發(fā)者來說,這份51頁的“適應(yīng)性指南”或許能避開一些坑。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
2021久久国产精品不只是精品| 国产日韩欧美a| 成人综合激情网| 日日夜夜免费精品| 中文字幕在线不卡视频| 日韩欧美在线影院| 91在线精品一区二区三区| 激情六月婷婷久久| 婷婷国产在线综合| 亚洲免费观看高清在线观看| www日韩大片| 欧美一区二区三区日韩视频| 色噜噜狠狠一区二区三区果冻| 国产盗摄女厕一区二区三区| 日韩av一级电影| 亚洲地区一二三色| 一区二区三区在线免费| 国产精品麻豆视频| 久久综合色综合88| 欧美一区二区三区四区视频| 在线欧美日韩精品| 色综合久久久网| 不卡的电影网站| 成人午夜电影久久影院| 国产激情偷乱视频一区二区三区| 麻豆极品一区二区三区| 日本在线播放一区二区三区| 亚洲午夜精品网| 久久国产精品72免费观看| 日本不卡一二三区黄网| 亚瑟在线精品视频| 亚洲图片欧美综合| 亚洲成人动漫在线观看| 性欧美疯狂xxxxbbbb| 亚洲一级片在线观看| 亚洲最新在线观看| 亚洲一区二区在线免费观看视频| 成人免费一区二区三区视频| 国产精品久久久久毛片软件| 亚洲国产电影在线观看| 国产精品日日摸夜夜摸av| 国产亚洲精久久久久久| 国产精品女主播在线观看| 欧美日韩国产一区| 国产日韩欧美亚洲| 精品日产卡一卡二卡麻豆| 欧美日韩一区二区三区免费看| 在线日韩国产精品| 欧美在线free| 欧美一区二区视频观看视频| 欧美一级高清片| 欧美成人一级视频| 国产色综合久久| 国产精品久久久久影院色老大| 综合在线观看色| 一级日本不卡的影视| 香蕉成人伊视频在线观看| 日韩国产在线一| 久久国产麻豆精品| 国产成人av一区| 色欧美日韩亚洲| 在线成人av网站| 久久影院午夜片一区| 国产精品久久久久久久久图文区| 亚洲色图19p| 天天综合天天综合色| 韩国在线一区二区| av不卡免费电影| 欧美精品国产精品| 久久欧美中文字幕| 亚洲乱码中文字幕综合| 天堂一区二区在线| 国产精品一线二线三线精华| 91啪亚洲精品| 日韩精品一区二区三区中文不卡| 国产精品久久毛片av大全日韩| 亚洲电影一级片| 国产成人在线色| 欧美日韩卡一卡二| 久久婷婷成人综合色| 亚洲综合在线五月| 国产在线一区二区| 在线观看日韩电影| 久久婷婷综合激情| 亚洲大片免费看| 风间由美一区二区av101| 欧美日韩精品一区二区三区蜜桃| 久久理论电影网| 亚洲在线一区二区三区| 狠狠色丁香婷婷综合| 91久久免费观看| 久久久精品日韩欧美| 爽好久久久欧美精品| 99国产精品99久久久久久| 日韩一区二区免费电影| 中文字幕亚洲欧美在线不卡| 蜜臀av一区二区在线免费观看| 91在线小视频| 日韩激情视频在线观看| 成人激情午夜影院| 91麻豆精品国产91久久久 | 波多野结衣中文一区| 欧美亚男人的天堂| 国产精品网曝门| 精品一区二区三区免费视频| 欧美午夜一区二区| 综合分类小说区另类春色亚洲小说欧美 | 91精品国产色综合久久| 综合激情网...| 国产精品 欧美精品| 日韩丝袜美女视频| 亚洲成人免费在线| 91久久精品一区二区二区| 国产精品久久久爽爽爽麻豆色哟哟 | 日韩和的一区二区| 一本在线高清不卡dvd| 中文字幕第一区二区| 国产一区在线观看视频| 91精品免费观看| 亚洲成人av一区二区| 欧美性受xxxx| 亚洲人成精品久久久久久| av午夜精品一区二区三区| 国产视频一区二区三区在线观看 | k8久久久一区二区三区| 久久精品综合网| 精品一区二区三区不卡| 欧美xxx久久| 免费一级欧美片在线观看| 91麻豆精品国产91久久久资源速度 | 亚洲欧美成aⅴ人在线观看| 国产91高潮流白浆在线麻豆| 久久久亚洲欧洲日产国码αv| 另类专区欧美蜜桃臀第一页| 日韩免费在线观看| 久久aⅴ国产欧美74aaa| 精品国产青草久久久久福利| 狠狠色伊人亚洲综合成人| 精品国产乱码久久久久久老虎| 美日韩一级片在线观看| 日韩精品一区二区在线| 国产在线精品一区二区三区不卡| 精品成人a区在线观看| 国产一区二三区好的| 欧美激情中文不卡| 丁香婷婷综合五月| 亚洲色图在线播放| 欧美日韩中文字幕一区二区| 五月激情六月综合| 欧美成人精品高清在线播放| 国产精品资源在线观看| 国产精品视频线看| 91欧美一区二区| 五月天亚洲精品| 2欧美一区二区三区在线观看视频| 国产精品一区二区在线看| 欧美激情一区二区在线| 91猫先生在线| 日韩影院精彩在线| 26uuu另类欧美| www.av亚洲| 亚洲一区二区三区激情| 精品国产伦一区二区三区免费| 丁香婷婷深情五月亚洲| 成人深夜在线观看| 亚洲综合一二区| 日韩免费视频一区二区| 成人免费不卡视频| 亚洲综合色网站| 日韩精品一区二区在线| 99国产精品国产精品久久| 五月天一区二区三区| 国产亚洲婷婷免费| 欧美曰成人黄网| 韩日av一区二区| 亚洲一区在线视频| 亚洲精品在线一区二区| 色综合一个色综合| 日本视频一区二区| 国产女主播视频一区二区| 欧美日韩精品福利| 成人自拍视频在线观看| 日韩高清一区在线| 中文字幕中文在线不卡住| 日韩一级完整毛片| 99久久精品国产一区| 免费成人在线影院| 亚洲激情av在线| 久久色在线观看| 欧美精品三级在线观看| 不卡区在线中文字幕| 免费一级片91| 夜夜操天天操亚洲| 国产精品天天看| 欧美不卡一区二区三区| 在线免费精品视频| 高清免费成人av| 日日夜夜精品视频天天综合网| 亚洲欧洲综合另类| 国产欧美一区二区精品性色|