在人工智能領(lǐng)域,關(guān)于模型能力等級的討論持續(xù)升溫。谷歌DeepMind首席執(zhí)行官德米斯·哈薩比斯近日公開質(zhì)疑部分企業(yè)宣稱的“博士級智能”模型,直言此類表述“缺乏科學(xué)依據(jù)”。他在“All In峰會”上強(qiáng)調(diào),當(dāng)前主流AI系統(tǒng)雖具備特定領(lǐng)域的專業(yè)能力,但距離真正的通用智能仍存在顯著差距。
哈薩比斯以數(shù)學(xué)能力為例指出,現(xiàn)有模型在處理基礎(chǔ)計(jì)算或高中數(shù)學(xué)問題時(shí)仍會犯錯(cuò),這與人類博士應(yīng)具備的跨領(lǐng)域綜合能力形成鮮明對比。“真正的通用智能需要像人類專家一樣,在各個(gè)知識領(lǐng)域都達(dá)到高水平表現(xiàn),而當(dāng)前系統(tǒng)僅在特定任務(wù)上表現(xiàn)優(yōu)異。”他進(jìn)一步解釋,這種“碎片化智能”現(xiàn)象暴露了模型在知識整合與遷移學(xué)習(xí)方面的局限性。
此前,OpenAI首席執(zhí)行官山姆·奧爾特曼在GPT-5發(fā)布會上曾宣稱,該模型“具備任何領(lǐng)域的博士級專業(yè)能力”,并強(qiáng)調(diào)其是“迄今為止功能最強(qiáng)大、推理最穩(wěn)健的模型”。然而,這一表述與谷歌團(tuán)隊(duì)的觀察形成矛盾。DeepMind方面認(rèn)為,將單一任務(wù)表現(xiàn)等同于整體智能水平,可能誤導(dǎo)公眾對AI發(fā)展階段的認(rèn)知。
關(guān)于通用人工智能(AGI)的實(shí)現(xiàn)時(shí)間表,哈薩比斯給出謹(jǐn)慎預(yù)測。他表示,要開發(fā)出具備全面博士級能力的系統(tǒng),可能需要5至10年時(shí)間。這一判斷基于兩個(gè)關(guān)鍵瓶頸:一是持續(xù)學(xué)習(xí)能力,即模型能否像人類一樣實(shí)時(shí)吸收新知識并調(diào)整行為;二是跨領(lǐng)域知識遷移能力,目前多數(shù)系統(tǒng)仍依賴大規(guī)模數(shù)據(jù)訓(xùn)練,缺乏自主進(jìn)化機(jī)制。
實(shí)驗(yàn)數(shù)據(jù)顯示,盡管GPT-5、Grok 4等模型在國際數(shù)學(xué)奧林匹克競賽中取得優(yōu)異成績,編程水平也超越多數(shù)人類開發(fā)者,但在處理簡單邏輯推理或常識問題時(shí)仍會出錯(cuò)。例如,部分模型在計(jì)算商品折扣后的實(shí)際價(jià)格時(shí)出現(xiàn)錯(cuò)誤,或在理解隱喻性語言時(shí)產(chǎn)生偏差。這種“高能低效并存”的現(xiàn)象,成為學(xué)界質(zhì)疑“博士級智能”宣稱的重要依據(jù)。
DeepMind團(tuán)隊(duì)強(qiáng)調(diào),真正的智能突破需要解決兩個(gè)核心問題:一是如何讓模型具備“元認(rèn)知”能力,即理解自身知識邊界并主動(dòng)尋求補(bǔ)充;二是如何實(shí)現(xiàn)“少樣本學(xué)習(xí)”,使系統(tǒng)通過極少量示例掌握新技能。目前,這些能力仍停留在理論探索階段,距離工程化應(yīng)用尚有距離。