IBM近期宣布,其研發(fā)的通用型企業(yè)級人工智能實體——IBM CUGA,在技術(shù)上取得了重大進(jìn)展。這款智能體被設(shè)計為能夠跨越多種業(yè)務(wù)環(huán)境,整合多樣工具,并執(zhí)行復(fù)雜任務(wù),其功能強(qiáng)大到足以媲美企業(yè)中的資深員工。IBM CUGA不僅能夠理解用戶指令,規(guī)劃工作流程,調(diào)用所需工具,還能協(xié)調(diào)多個系統(tǒng),同時具備持續(xù)學(xué)習(xí)和適應(yīng)新挑戰(zhàn)的能力。
在經(jīng)歷了一系列嚴(yán)格的模擬企業(yè)場景測試后,IBM CUGA展現(xiàn)出了卓越的性能。不僅如此,在2025年7月最新發(fā)布的AppWorld Benchmark排名中,IBM CUGA更是榮登榜首,這一成就無疑是對其技術(shù)實力的有力證明。
IBM CUGA的誕生并非一日之功,而是IBM在架構(gòu)革新、方法創(chuàng)新以及工具整合方面長期努力的結(jié)晶。從最初的簡單“計劃-執(zhí)行-觀察”模型,其任務(wù)完成率僅有15%,到如今的多層級系統(tǒng),IBM CUGA已經(jīng)能夠協(xié)調(diào)多個子智能體,感知網(wǎng)頁環(huán)境,處理更為復(fù)雜的任務(wù),任務(wù)完成率也隨之大幅提升至61.7%及以上。這一轉(zhuǎn)變,標(biāo)志著IBM CUGA在技術(shù)上實現(xiàn)了質(zhì)的飛躍。
IBM CUGA在WebArena等真實瀏覽器任務(wù)中的表現(xiàn)同樣令人矚目。其強(qiáng)大的功能,使其有望成為企業(yè)內(nèi)部的通用調(diào)度平臺,為企業(yè)帶來前所未有的效率提升和智能化變革。