日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

UCSD與英特爾聯手推出PettingLLMs框架,多智能體強化學習性能顯著提升

   時間:2025-11-09 20:51:35 來源:快訊編輯:快訊 IP:北京 發表評論無障礙通道
 

在人工智能領域,大語言模型(LLM)驅動的多智能體系統正展現出強大的潛力。然而,現有的訓練框架主要聚焦于單智能體場景,多智能體間的協作優化——“群體強化”仍是一個亟待突破的領域。針對這一挑戰,來自UCSD與英特爾的研究團隊提出了一種全新的通用多智能體強化學習框架——PettingLLMs,為多智能體協同訓練提供了創新解決方案。

多智能體系統在醫療、編程、科研、具身智能等領域的應用中,已展現出超越單智能體的顯著優勢。然而,當前主流的強化學習算法(如GRPO)均基于單智能體假設,其核心機制是通過同一輸入(prompt)生成多組候選回答,并在組內進行相對優勢評估。這一機制的有效性依賴于“共同prompt”的前提——即所有候選回答必須基于完全相同的上下文生成。但在多智能體多輪交互場景中,不同智能體在不同輪次接收到的prompt可能包含其他智能體的歷史輸出(如編程任務中,智能體生成的代碼可能被其他智能體用于單元測試),導致“共同prompt”假設被破壞,進而影響優勢計算的公平性與有效性。

為解決這一問題,研究團隊提出了一種基于貪心搜索的樹狀采樣方法。該方法通過每輪為每個智能體生成K個分支,并選擇當前獎勵最高的智能體進行下一輪分支,從而平衡探索與利用的矛盾。同時,每個智能體的獎勵函數被設計為同時考慮自身角色專屬獎勵與全局任務獎勵,確保智能體在提升協作能力的同時保持角色特異性。

針對多智能體訓練中的策略選擇問題(即何時采用“專屬模型”模式,何時采用“共享模型”模式),研究團隊構建了異步分發訓練系統。該系統通過路由模塊收集多智能體交互產生的軌跡數據,并根據訓練模式需求進行差異化處理:在專屬模型模式下,系統將智能體i的數據僅發送至模型資源池i的更新單元,實現獨立模型進化;在共享模型模式下,系統將所有智能體的軌跡數據合并后發送至同一資源池,實現統一模型優化。

基于上述方法,研究團隊開源了PettingLLMs框架,支持不同模型與智能體間的任意映射,并允許每個智能體適配不同的LoRA(低秩適應)參數。開發者僅需定義任務特定的智能體交互邏輯與獎勵函數,即可快速構建多智能體訓練環境。目前,框架已內置數學、編程、游戲等主流任務環境。

實驗結果表明,該框架在復雜任務中表現突出。在推箱子(Sokoban)任務中,通過AT-GRPO算法訓練的兩個智能體將任務完成率從14%提升至96%;在路徑規劃任務中,完成率從47%提升至99.5%。代碼生成任務中,LiveCodeBench、APPS、CodeContests的準確率分別提升6.1%、4.2%和7.0%;數學推理任務中,AIME 24與AIME 25的準確率分別提升9.0%和17.9%。

消融實驗進一步驗證了框架設計的合理性。僅在單智能體環境中訓練規劃或工具子角色時,指標雖從5.0%提升至11.0%/14.5%,但聯合作業時準確率僅達16.0%;而互換已訓練角色的策略會導致準確率驟降至6.0%,證明智能體能力具有互補性與不可替代性。訓練過程中智能體學習回報同步上升,任務平均回合數持續下降,表明協作效率隨訓練進程顯著提升。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
国产精品久久久久久久久免费樱桃| 狠狠色综合色综合网络| 亚洲欧美一区二区不卡| 国模一区二区三区白浆| 香蕉久久一区二区不卡无毒影院 | 亚洲三级久久久| 欧美精品一区二区三区一线天视频 | 欧美日韩国产欧美日美国产精品| www.日韩在线| 成人免费视频caoporn| 久久99精品国产.久久久久| 免费在线看成人av| 丝袜a∨在线一区二区三区不卡| 尤物视频一区二区| 一区二区三区四区视频精品免费| 成人免费在线播放视频| 亚洲婷婷在线视频| 亚洲精品视频在线看| 亚洲欧洲中文日韩久久av乱码| 国产精品区一区二区三区| 国产精品久久午夜夜伦鲁鲁| 国产精品久久久久一区| 日韩毛片视频在线看| 一区二区三区鲁丝不卡| 亚洲成人免费视频| 日本欧美韩国一区三区| 久久99精品一区二区三区三区| 国产精品资源在线看| 粉嫩蜜臀av国产精品网站| 成av人片一区二区| 91女人视频在线观看| 欧美综合一区二区| 成人aaaa免费全部观看| 在线免费不卡电影| 日韩免费观看高清完整版在线观看| 精品国产成人系列| 中文字幕精品一区二区精品绿巨人 | 成人一区二区三区视频| 91视频观看免费| 欧美色精品在线视频| 欧美成人欧美edvon| 国产精品三级视频| 亚洲成av人影院在线观看网| 久久成人麻豆午夜电影| 成人精品国产福利| 欧美日韩精品二区第二页| 欧美大片在线观看| 中文字幕一区二区三区不卡| 亚洲午夜精品在线| 国产成人在线免费观看| 色综合av在线| 欧美日韩激情一区二区三区| 久久精品一区二区三区不卡牛牛| 综合激情成人伊人| 美国一区二区三区在线播放| 国产成人精品一区二区三区网站观看| 91捆绑美女网站| 国产盗摄精品一区二区三区在线| 91麻豆国产精品久久| 久久综合色8888| 亚洲精品写真福利| 激情综合亚洲精品| 欧美三区在线观看| 中文字幕国产精品一区二区| 午夜视频在线观看一区二区| 成人美女在线视频| 日韩精品一区二区三区三区免费| 亚洲男人天堂一区| 国产精品69毛片高清亚洲| 欧美高清你懂得| 亚洲激情图片小说视频| 成人综合激情网| 日韩情涩欧美日韩视频| 一区二区日韩电影| 国产一区激情在线| 亚洲欧美日韩在线| 久久九九久久九九| 一本大道久久精品懂色aⅴ| 亚洲激情图片小说视频| 2022国产精品视频| 从欧美一区二区三区| 夜夜嗨av一区二区三区四季av | 日韩精品亚洲专区| 精品久久久久久最新网址| 国产欧美视频一区二区三区| 午夜精品久久久久| 成人毛片在线观看| 欧美成人精品1314www| 日韩成人午夜精品| 91成人国产精品| 国产精品福利av| 粉嫩绯色av一区二区在线观看| 欧美v亚洲v综合ⅴ国产v| 日韩精品一级中文字幕精品视频免费观看 | 日韩影院免费视频| 欧美剧情电影在线观看完整版免费励志电影 | 亚洲国产综合在线| 欧美在线观看一二区| 樱花草国产18久久久久| 在线欧美日韩国产| 午夜精品久久久久久久蜜桃app| 在线观看精品一区| 亚洲午夜久久久久久久久电影网| 欧美亚一区二区| 午夜婷婷国产麻豆精品| 欧美一区二区三区在线视频| 蜜臀精品一区二区三区在线观看 | 国产99久久久精品| 91福利视频在线| 欧美精品aⅴ在线视频| 欧美一区二区啪啪| 日韩视频免费观看高清完整版| 欧美日韩极品在线观看一区| 91成人免费网站| 91麻豆精品久久久久蜜臀| 久久一区二区三区四区| 国产精品久久久久一区二区三区 | a在线欧美一区| 中文字幕av不卡| 色婷婷精品久久二区二区蜜臀av| 亚洲综合激情另类小说区| 欧美一区二区性放荡片| 国产精品一二三四区| 亚洲伦理在线免费看| 91精品国产综合久久精品图片 | 亚洲欧洲成人精品av97| 欧美日韩成人在线| 国内成人自拍视频| 亚洲女同一区二区| 日韩亚洲电影在线| 97精品超碰一区二区三区| 日韩激情一二三区| 欧美国产成人精品| 欧美精品777| 91蜜桃传媒精品久久久一区二区| 日本免费在线视频不卡一不卡二| 中文字幕第一页久久| 欧美亚洲自拍偷拍| 丁香桃色午夜亚洲一区二区三区| 亚洲一区在线播放| 亚洲国产电影在线观看| 欧美一区二区三区性视频| 色婷婷av久久久久久久| 高清不卡一二三区| 久久国产福利国产秒拍| 婷婷成人激情在线网| 日韩一区在线看| 国产精品久久久久婷婷| 精品捆绑美女sm三区| 欧美在线啊v一区| 成人av在线资源网站| 极品少妇一区二区三区精品视频| 亚洲国产毛片aaaaa无费看| 国产精品麻豆视频| 国产女人18水真多18精品一级做| 欧美成人在线直播| 欧美性大战久久| 日本韩国精品在线| 91福利在线导航| 18欧美乱大交hd1984| 欧美三级韩国三级日本三斤| 成人av资源在线| 日本中文一区二区三区| 国产午夜精品福利| 日本高清免费不卡视频| 日韩电影在线观看一区| 欧美成人三级在线| 午夜精品免费在线观看| jlzzjlzz亚洲日本少妇| 国产精品天干天干在观线| 在线观看亚洲成人| 中文字幕佐山爱一区二区免费| 91国模大尺度私拍在线视频| 国产精品18久久久久久久久 | 国产视频一区二区在线观看| 欧美日韩精品一区二区三区| www.亚洲色图.com| 青娱乐精品在线视频| 亚洲图片欧美色图| 国产精品天干天干在观线| 久久综合久久鬼色中文字| 久久综合九色综合欧美亚洲| 欧美日韩精品一区二区三区蜜桃| 日本韩国欧美一区| 日本高清成人免费播放| 成人美女在线视频| 国产69精品久久久久毛片| 麻豆精品一区二区三区| 日韩中文字幕一区二区三区| 蜜臀av性久久久久蜜臀av麻豆| 日韩高清在线不卡| 日韩高清中文字幕一区| 日本成人在线视频网站| 国产成人亚洲精品狼色在线| 国产一区欧美日韩| 韩国精品在线观看| 国产乱码一区二区三区| 91一区一区三区| 色中色一区二区| 欧美中文字幕不卡|