紅杉資本近期舉辦了一場與OpenAI ChatGPT Agent團隊深度對話的活動,該活動由紅杉資本合伙人索尼婭·黃和勞倫·里德共同主持。OpenAI團隊中參與ChatGPT Agent發(fā)布的伊薩·富爾福德、凱西·楚和孫之清出席了此次對話。
對話中,OpenAI團隊分享了ChatGPT Agent的開發(fā)細節(jié)及其技術(shù)突破。他們闡述了這款AI Agent如何通過結(jié)合Deep Research和Operator的優(yōu)勢,在跨領(lǐng)域任務執(zhí)行上展現(xiàn)出高效能力。同時,還探討了其安全保障措施及廣泛的應用場景。
據(jù)OpenAI團隊介紹,ChatGPT Agent被設(shè)計為能夠執(zhí)行復雜且耗時的多步驟任務,它配備了一個虛擬計算機環(huán)境,集成了文本瀏覽、視覺瀏覽、終端訪問和API集成等功能。這些工具共享狀態(tài),使得ChatGPT Agent能夠像人類使用計算機一樣,靈活處理各種復雜任務。
富爾福德在對話中提到,ChatGPT Agent的開發(fā)源于Deep Research和Operator兩個產(chǎn)品的結(jié)合。這兩個產(chǎn)品分別擅長處理文本信息和視覺交互,用戶反饋顯示他們希望這兩個功能能夠互補。因此,OpenAI團隊通過統(tǒng)一架構(gòu),實現(xiàn)了能力的飛躍。他們還通過強化學習,在數(shù)千個虛擬機上讓模型自行發(fā)現(xiàn)最佳策略,從而極大地擴展了與AI智能體的交互方式。
凱西·楚分享了ChatGPT Agent在具體應用場景中的表現(xiàn)。他表示,這款AI Agent能夠處理從生成詳細報告到在線購物,再到數(shù)據(jù)分析等多種任務。他還舉例說明了如何用ChatGPT Agent處理Google Docs中的數(shù)據(jù),生成展示數(shù)據(jù)的幻燈片,以及研究古DNA領(lǐng)域的新進展等。
孫之清則強調(diào)了ChatGPT Agent在長時間任務執(zhí)行上的能力。他提到,團隊開發(fā)了工具擴展ChatGPT Agent的上下文長度,使其能夠記錄任務進展,逐步完成復雜任務。用戶還可以隨時糾正ChatGPT Agent、提供額外指令或要求狀態(tài)更新。
從技術(shù)角度看,OpenAI團隊采用了強化學習技術(shù)來訓練ChatGPT Agent。他們設(shè)計了復雜任務,讓ChatGPT Agent通過試驗發(fā)現(xiàn)最佳工具使用策略,并根據(jù)任務完成的質(zhì)量和效率給予獎勵。這種共享狀態(tài)的工具設(shè)計使得ChatGPT Agent能夠無縫切換工具,完成多樣化任務。
在安全性方面,OpenAI團隊實施了多層次安全措施,包括內(nèi)部和外部紅隊測試、實時監(jiān)控系統(tǒng)以及快速響應新威脅的協(xié)議。他們特別關(guān)注生物風險等嚴重問題,確保模型不會被用于有害用途。
此次對話還探討了ChatGPT Agent的未來發(fā)展方向。OpenAI團隊表示,他們希望進一步增強ChatGPT Agent的多輪對話能力、個性化和記憶功能。同時,也在探索新的用戶界面和交互模式,以提升用戶體驗。
對于是否會開發(fā)專門的子智能體,OpenAI團隊傾向于打造一個通用的超級智能體。他們認為,如果一個智能體能根據(jù)需求靈活調(diào)用所有工具,這將是一個簡單高效的解決方案。他們希望通過持續(xù)優(yōu)化,讓ChatGPT Agent能夠無縫處理從簡單查詢到復雜工作流的各種任務。