滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

剛剛，OpenAI 發(fā)布 ChatGPT 版 Manus！奧特曼：感受 AGI 時(shí)刻

時(shí)間：2025-07-18 06:56:37 來源：愛范兒編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評論無障礙通道

過去大半年，Agent（智能體）是 AI 行業(yè)最常被提及的概念之一。

幾乎所有廠商都在講 Agent，概念不缺，demo 也不少，但真正做到產(chǎn)品級落地，始終缺一套完整的執(zhí)行系統(tǒng)——既能理解復(fù)雜目標(biāo)，又能調(diào)用多種工具串聯(lián)任務(wù)流程，還要隨時(shí)支持任務(wù)中斷、修改與恢復(fù)，真正貼合用戶工作流。

就在剛剛，OpenAI 正式發(fā)布 ChatGPT Agent 功能。

通過整合 Operator + Deep Research + ChatGPT 本體，用戶只需描述任務(wù)，ChatGPT Agent 就能自主判斷所需工具，自動(dòng)訪問網(wǎng)頁、提取信息、運(yùn)行代碼、生成幻燈片或表格等，并可在執(zhí)行過程中實(shí)時(shí)展示步驟、接受中斷和修改指令。

發(fā)布會(huì)結(jié)束后，OpenAI CEO Sam Altman 在社交媒體上寫道：：

觀看 ChatGPT Agent 使用計(jì)算機(jī)完成復(fù)雜任務(wù)，對我來說是一個(gè)真正的「感受 AGI」時(shí)刻；看到計(jì)算機(jī)思考、計(jì)劃和執(zhí)行，有種與眾不同的感覺。

亮點(diǎn)如下：

ChatGPT Agent 將 Operator、Deep Research 與 ChatGPT 本體三合一，構(gòu)建了一個(gè)統(tǒng)一智能體系統(tǒng)。內(nèi)置圖形/文本瀏覽器、終端和 API 調(diào)用器等工具，支持手機(jī)端使用，任務(wù)完成后可自動(dòng)推送結(jié)果；可連接 Gmail、GitHub 等第三方應(yīng)用，深度嵌入用戶真實(shí)工作流；在多項(xiàng)基準(zhǔn)測試中表現(xiàn)領(lǐng)先，綜合性能位居行業(yè)前列；Pro 用戶每月享有 400 條調(diào)用額度，其他付費(fèi)用戶為 40 條，并支持按需擴(kuò)展配額。

ChatGPT Agent 正式上線，能購物，能寫 PPT，你的瀏覽器要被 AI 接管了

今天開始，你可以在任何對話中，通過聊天界面左下角的「工具」下拉菜單，選擇「Agent 模式」來啟用這一功能。

只需描述你想完成的任務(wù)，ChatGPT 能夠智能地瀏覽網(wǎng)站、篩選結(jié)果、在需要時(shí)安全提示你登錄、運(yùn)行代碼、執(zhí)行分析，甚至輸出可編輯的幻燈片和電子表格，總結(jié)任務(wù)結(jié)果。

整個(gè)執(zhí)行過程是可視的——操作步驟會(huì)實(shí)時(shí)顯示在屏幕上，用戶可以隨時(shí)中斷、修改指令，甚至手動(dòng)「接管瀏覽器」繼續(xù)操作，確保任務(wù)始終符合你的目標(biāo)和需求。

在今天凌晨的演示中，OpenAI 展示了 ChatGPT Agent 在真實(shí)場景中的應(yīng)用能力。

比如，為即將出席的婚禮做準(zhǔn)備，一直是個(gè)難題。現(xiàn)在只需發(fā)出請求，ChatGPT Agent 迅速搭建虛擬環(huán)境，自主判斷應(yīng)調(diào)用瀏覽器、文本解析器還是終端，并開始依次調(diào)取婚禮日期、查詢場地天氣、推薦西裝搭配、篩選酒店。在這個(gè)過程中，模型可以與 OpenAI 研究員進(jìn)行互動(dòng)，并在適當(dāng)節(jié)點(diǎn)請求確認(rèn)需求。

更重要的是，用戶可以隨時(shí)中斷任務(wù)。

比如當(dāng) Agent 在推薦西裝過程中，OpenAI 研究員臨時(shí)插入了「幫我找一雙 9.5 碼黑色正裝鞋」的請求，模型立刻暫停當(dāng)前任務(wù)，轉(zhuǎn)而處理新需求。

同樣地，當(dāng)智能體認(rèn)為有必要時(shí)，也會(huì)主動(dòng)向你請求更多信息，確保任務(wù)始終與你的目標(biāo)保持一致。如果任務(wù)超出預(yù)期時(shí)間或出現(xiàn)卡頓，你可以選擇暫停任務(wù)、請求進(jìn)度摘要，或直接終止任務(wù)并獲取已有的部分結(jié)果。

「這種可打斷、可多輪對話的機(jī)制，是我們這次訓(xùn)練模型的重點(diǎn)之一，」OpenAI 研究員解釋道。

這一能力背后，是 ChatGPT Agent 對三大系統(tǒng)的統(tǒng)一整合：Operator 提供網(wǎng)頁交互能力，支持自動(dòng)滾動(dòng)、點(diǎn)擊、填表；Deep Research 擅長信息整合與分析；ChatGPT 本體則負(fù)責(zé)自然語言理解與智能推理。

ChatGPT Agent 是通過強(qiáng)化學(xué)習(xí)在復(fù)雜的任務(wù)中訓(xùn)練出來的，過去三者各有短板——前者難以深入分析，后者無法操作網(wǎng)頁，而 Agent 將三者優(yōu)勢整合為一體，并輔以瀏覽器、終端、API 調(diào)用器等工具，形成一個(gè)完整的執(zhí)行系統(tǒng)。

用戶不僅可以在桌面端啟動(dòng) Agent 模式，在手機(jī)端也同樣適用。

任務(wù)完成后還將自動(dòng)推送結(jié)果通知。在第二個(gè)演示任務(wù)中，OpenAI 研究員在 ChatGPT App 上傳了團(tuán)隊(duì)吉祥物 Bernie Doodle 的貼紙圖案，Agent 自動(dòng)調(diào)用圖像生成 API 設(shè)計(jì)貼紙樣式，通過瀏覽器訪問電商平臺(tái)完成比價(jià)、樣式選擇、購物車添加，最終整理出定制貼紙的下單明細(xì)。

當(dāng)然，為確保流程安全、靈活且清晰可控，面對涉及金額的支付環(huán)節(jié)，則只會(huì)由用戶手動(dòng)接管瀏覽器完成。

通過連接器，用戶還可將 Gmail、GitHub 等日常應(yīng)用接入 ChatGPT，讓模型讀取郵件、日歷或代碼庫等上下文內(nèi)容，并執(zhí)行諸如總結(jié)今天的郵箱內(nèi)容或查找下周空閑會(huì)議時(shí)間等任務(wù)。

一個(gè)更典型的應(yīng)用場景是，OpenAI 研究員能夠讓 ChatGPT Agent 匯總自己在多項(xiàng)基準(zhǔn)測試中的表現(xiàn)，并制作成幻燈片。收到命令后，Agent 會(huì)調(diào)用 Google Drive 連接器讀取數(shù)據(jù)文件，用終端編寫代碼繪制圖表，并生成完整的 PPT。

這類自動(dòng)化能力，都是 Agent 深度嵌入工作流的體現(xiàn)。

不過，可以看到，ChatGPT Agent 生成的 PPT 在設(shè)計(jì)審美方面表現(xiàn)比較一般，并且，雖然可以上傳電子表格供 ChatGPT 編輯或作為模板使用，但生成的 PPT 暫不支持二次修改。

需要說明的是，OpenAI 并不是讓 Agent 像人一樣打開 PPT或 Excel 文件，通過點(diǎn)擊來插入文本框和公式，而是直接生成代碼來創(chuàng)建文檔。這種做法的好處是可以利用模型在代碼編寫方面的天然優(yōu)勢，避免因模擬點(diǎn)擊操作帶來的效率低下或出錯(cuò)，也降低了對計(jì)算資源的消耗。

The Information 報(bào)道指出，如果 ChatGPT 要直接編輯 PPT 或 Excel 文件，就需要啟動(dòng)一臺(tái)「虛擬機(jī)」（即通過 ChatGPT 運(yùn)行的虛擬計(jì)算機(jī)環(huán)境），這會(huì)占用更多計(jì)算資源。

而直接生成代碼則更輕量、高效。盡管潛力巨大，但就目前來看，這一功能短期內(nèi)很難對微軟的 Office 或者 Google Workspace 造成沖擊。

對于 ChatGPT Agent 功能，Pro 用戶將在今天之內(nèi)獲得訪問權(quán)限；Plus 與 Team 用戶將在接下來的幾天內(nèi)陸續(xù)開放；企業(yè)版（Enterprise）和教育版（Education）將在未來幾周內(nèi)上線

Pro 用戶每月可使用 400 條消息，其他付費(fèi)用戶每月可使用 40 條消息，并可通過彈性積分方案購買更多額度。

全線刷新「跑分」記錄，Agent 戰(zhàn)場迎來最強(qiáng)對手

ChatGPT Agent 能力的提升，也體現(xiàn)在「跑分」環(huán)節(jié)。

在評估 AI 解決跨學(xué)科專家級問題的基準(zhǔn)測試 Humanity’s Last Exam（HLE）中，搭載智能體的 ChatGPT 模型以 41.6 的 pass@1 得分刷新紀(jì)錄。在啟用并行執(zhí)行策略后，該得分進(jìn)一步提升至 44.4。

在目前被認(rèn)為最具挑戰(zhàn)性的數(shù)學(xué)基準(zhǔn) FrontierMath 中，面對難度極高、從未公開的題目，ChatGPT Agent 在具備終端代碼執(zhí)行能力的前提下，取得了 27.4% 的準(zhǔn)確率，遠(yuǎn)高于此前模型。

在這一復(fù)雜且高經(jīng)濟(jì)價(jià)值的知識(shí)型工作任務(wù)的內(nèi)部基準(zhǔn)測試中，ChatGPT Agent 在約一半的任務(wù)中輸出質(zhì)量已達(dá)到甚至超過人類水平，表現(xiàn)也顯著優(yōu)于 o3 和 o4-mini 模型。

在一個(gè)內(nèi)部的投行建模任務(wù)基準(zhǔn)中，ChatGPT 智能體的表現(xiàn)也顯著優(yōu)于 Deep Research 和 o3 模型。每個(gè)任務(wù)都基于數(shù)百項(xiàng)關(guān)于公式正確性、格式規(guī)范等評分標(biāo)準(zhǔn)進(jìn)行評估。

在公開評估模型信息查找能力的 BrowseComp 基準(zhǔn)上，Agent 以 68.9% 的準(zhǔn)確率刷新記錄，較 Deep Research 高出 17.4 個(gè)百分點(diǎn)。在 WebArena 評估中，其網(wǎng)頁任務(wù)執(zhí)行能力也優(yōu)于基于 o3 的 CUA 模型。

從平臺(tái)視角看，Agent 能力的底層接口，正是瀏覽器。

在 Perplexity AI CEO Aravind Srinivas 最近的采訪中，他表示瀏覽器將會(huì)是 AI 的「殺手級應(yīng)用」。在他看來，瀏覽器天然具備讓 AI 真正「動(dòng)起來」的全部條件。

不同于傳統(tǒng)聊天機(jī)器人，AI Agent 的理想形態(tài)不是停留在對話框中生成文本，而是具備實(shí)際行動(dòng)力——從訪問網(wǎng)頁、提取信息、填寫表單，到執(zhí)行跨平臺(tái)操作。而這一切，瀏覽器恰好具備所需的操作權(quán)限和上下文獲取能力。

瀏覽器可以直接讀取頁面、模擬點(diǎn)擊、自動(dòng)執(zhí)行任務(wù)，幾乎無需額外授權(quán)。

在這個(gè)過程中，用戶與 AI 共處于同一個(gè)交互空間：AI 可以自動(dòng)執(zhí)行任務(wù)，用戶也能隨時(shí)中斷或接管，避免黑盒操作帶來的不確定性。這種可控性與透明度，是當(dāng)前許多上下文協(xié)議仍難實(shí)現(xiàn)的能力。

如今，隨著 ChatGPT Agent 能力正式上線，所有聲稱要做 Agent 的廠商，恐怕都要重新審視自己的產(chǎn)品路徑。

當(dāng) ChatGPT 從語言交互工具，轉(zhuǎn)向具備協(xié)作、調(diào)度與承接任務(wù)能力的執(zhí)行系統(tǒng)，開始接入用戶的真實(shí)工作流，Agent 的可用性門檻，也在此刻被實(shí)質(zhì)性地拉高。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

剛剛，奧特曼放出ChatGPT「統(tǒng)一智能體」！驚呼真AGI，最卷打工人來了

07-18

優(yōu)必選Walker S2人形機(jī)器人實(shí)現(xiàn)自主換電 7*24小時(shí)打工

07-18

小牛電動(dòng)新國標(biāo)旗艦車FXT Ultra 2025發(fā)布：11999元

07-18

OpenAI史上最強(qiáng)ChatGPT智能體：逛網(wǎng)站、做PPT樣樣精通

07-18

馬云夜騎西湖被網(wǎng)友偶遇，同款自行車賣1.85萬元

07-18

扎克伯格與Meta股東和解，了結(jié)80億美元臉書隱私案

07-18

上海外灘“新地標(biāo)” 亮相吸引全球互聯(lián)網(wǎng)內(nèi)容創(chuàng)作者

07-18

新能源車電池衰減過快，可以全額退款嗎？上海法院判了

07-18

71路公交乘務(wù)員暖心提醒外地乘客避繞路 “小紅書”上獲點(diǎn)贊

07-18

Lumus與廣達(dá)電腦強(qiáng)強(qiáng)聯(lián)手，加速AR光學(xué)引擎規(guī)模化生產(chǎn)進(jìn)程

為適配Lumus的波導(dǎo)技術(shù)特性，廣達(dá)電腦已成功轉(zhuǎn)型為專用自動(dòng)化生產(chǎn)線。據(jù)Lumus方面透露，截至目前其波導(dǎo)產(chǎn)品累計(jì)向客戶交付量已突破55,000件，其中超八成由廣達(dá)等制造合作伙伴在過去五年內(nèi)完成生產(chǎn)。 L…

07-18

深圳人形機(jī)器人Walker S2：自主換電，24小時(shí)不間斷作業(yè)新紀(jì)元

雙臂協(xié)同精準(zhǔn)換電技術(shù)賦予人形機(jī)器人自主操作能力，其利用高精度的本體定位和先進(jìn)的柔順控制算法，通過雙臂的精密協(xié)同動(dòng)作，精準(zhǔn)實(shí)現(xiàn)電池與電池倉體的對準(zhǔn)與插拔。同時(shí)，雙電池系統(tǒng)構(gòu)成了天然的冗余備份，當(dāng)主電池發(fā)生故障時(shí)…

07-18

鐘南山寄語高一學(xué)子：科研之路，勤奮比天資更重要

7月17日下午，2025年廣東省首期“脫穎訓(xùn)練營”（暑期）在廣州實(shí)驗(yàn)室舉行。有同學(xué)向鐘南山提問：“像我這樣天資一般的學(xué)生，是否也適合做科研？”鐘南山表示，他帶的學(xué)生真正有天才的不太多，但最后真正做出成績的無…

07-18

AWS發(fā)布Bedrock AgentCore：重塑企業(yè)AI智能體構(gòu)建與部署新篇章

07-18

山姆會(huì)員店選品風(fēng)波：口碑商品下架，會(huì)員信任何去何從？

07-18

OpenAI 史上最強(qiáng) ChatGPT 智能體發(fā)布：逛網(wǎng)站、做 PPT 樣樣精通

07-18

點(diǎn)擊查看更多 +

全站最新

OpenAI史上最強(qiáng)ChatGPT智能體：逛網(wǎng)站、做PPT樣樣精通

馬云夜騎西湖被網(wǎng)友偶遇，同款自行車賣1.85萬元

扎克伯格與Meta股東和解，了結(jié)80億美元臉書隱私案

小米汽車加速布局：增程SUV與溜背小車雙管齊下，市場期待值拉滿

猛士M817預(yù)售啟航：智能越野新紀(jì)元，32.99萬起探索無界智野

高端Robotaxi市場風(fēng)云再起，Uber攜Lucid與Nuro共戰(zhàn)特斯拉

熱門內(nèi)容

本欄最新

扎克伯格與Meta股東和解，了結(jié)80億美元臉書隱私案

上海外灘“新地標(biāo)” 亮相吸引全球互聯(lián)網(wǎng)內(nèi)容創(chuàng)作者

新能源車電池衰減過快，可以全額退款嗎？上海法院判了

71路公交乘務(wù)員暖心提醒外地乘客避繞路 “小紅書”上獲點(diǎn)贊

Lumus與廣達(dá)電腦強(qiáng)強(qiáng)聯(lián)手，加速AR光學(xué)引擎規(guī)模化生產(chǎn)進(jìn)程

深圳人形機(jī)器人Walker S2：自主換電，24小時(shí)不間斷作業(yè)新紀(jì)元

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

剛剛，OpenAI 發(fā)布 ChatGPT 版 Manus！奧特曼：感受 AGI 時(shí)刻

日本精品一区二区三区高清久久