近日,科技界迎來(lái)了一項(xiàng)重大突破,OpenAI公司正式推出了其創(chuàng)新性的AI智能體——Operator。這款智能體被設(shè)計(jì)為能夠像人類一樣操作網(wǎng)頁(yè)瀏覽器,為用戶執(zhí)行各類基于網(wǎng)頁(yè)的任務(wù)。
在OpenAI的演示中,Operator展現(xiàn)了其卓越的能力。它能夠精準(zhǔn)理解各種指令,并自主完成一系列復(fù)雜任務(wù)。無(wú)論是打字、點(diǎn)擊、滾動(dòng)等基本操作,還是填寫在線表單、在線購(gòu)物、創(chuàng)建表情包以及處理重復(fù)性瀏覽器任務(wù),Operator都能游刃有余地完成。這種高度自主性和智能化水平,無(wú)疑為用戶帶來(lái)了前所未有的便捷體驗(yàn)。
值得注意的是,從1月23日開始,美國(guó)的ChatGPT Pro用戶已經(jīng)能夠率先體驗(yàn)到Operator的“預(yù)覽版”。據(jù)OpenAI透露,未來(lái)這一智能體將逐步拓展至更多區(qū)域的Pro用戶,并在幾個(gè)月后向ChatGPT Plus用戶開放。這意味著,越來(lái)越多的用戶將有機(jī)會(huì)親身感受到Operator帶來(lái)的革命性變化。
Operator的強(qiáng)大功能得益于其背后的先進(jìn)技術(shù)。據(jù)OpenAI官網(wǎng)介紹,這款智能體由全新的CUA(Computer-Using Agent)模型驅(qū)動(dòng),并結(jié)合了GPT-4的視覺能力。通過強(qiáng)化學(xué)習(xí),Operator實(shí)現(xiàn)了高級(jí)推理功能,能夠“看見”網(wǎng)頁(yè)內(nèi)容,并使用鼠標(biāo)和鍵盤與網(wǎng)頁(yè)進(jìn)行互動(dòng)。當(dāng)遇到復(fù)雜或困難的任務(wù)時(shí),Operator會(huì)調(diào)用其推理能力進(jìn)行自我糾正,如果仍然無(wú)法解決問題,則會(huì)將控制權(quán)交還給用戶,確保用戶始終掌握主動(dòng)權(quán)。