7 月 5 日消息,據(jù)外媒 iXBT 4 日報道,德國 Helmholtz AI 研究計劃、谷歌 DeepMind、普林斯頓大學(xué)等機構(gòu)的研究團隊近日聯(lián)合發(fā)布了一項重要成果:一款名為 Centaur 的通用型 AI 模型,首次實現(xiàn)了在大規(guī)模認(rèn)知任務(wù)中預(yù)測人類行為的能力。
Centaur 基于 700 億參數(shù)的 Llama 3.1 語言模型,并通過名為 Psych-101 的數(shù)據(jù)集進行了專門訓(xùn)練。該數(shù)據(jù)集匯集了來自 6 萬名參與者、覆蓋 160 個實驗的超過 1000 萬個決策,涵蓋了感知、記憶、邏輯推理、道德判斷及不確定性決策等領(lǐng)域。研究人員將每個實驗轉(zhuǎn)化為自然語言的文本形式,使模型可以像閱讀說明書一樣理解任務(wù)。憑借這一訓(xùn)練方式,Centaur 能夠在未接觸過的新情境下做出精準(zhǔn)預(yù)測。
即使面對完全陌生的測試任務(wù),Centaur 也能精準(zhǔn)預(yù)測行為。例如在一項類似老虎機的實驗中,參與者需在中獎概率不同的兩臺機器間做出選擇,模型的預(yù)測結(jié)果高度貼近真實決策。在邏輯推理和道德難題等更復(fù)雜的認(rèn)知場景中,Centaur 的表現(xiàn)也超過了現(xiàn)有的主流模型。
研究人員特別關(guān)注 Centaur 與人腦運作的相似性。他們將模型的“內(nèi)部表征”與功能性磁共振成像(fMRI)結(jié)果對比,發(fā)現(xiàn) Centaur 在處理任務(wù)時的激活模式,與人類大腦的神經(jīng)活動更為接近,甚至超過了 GPT-4 和 PaLM-2。
Centaur 還能推動認(rèn)知科學(xué)理論的發(fā)展。在一項測試中,模型識別出一種新型決策策略:人類在做選擇時不僅考慮概率,還會預(yù)估未來回報。這一模式此前從未在心理學(xué)研究中被系統(tǒng)描述,但經(jīng)過模型的提示,研究人員再次實驗并確認(rèn)了其存在。
目前,Psych-101 數(shù)據(jù)集和 Centaur 模型已全部開放,未來還計劃拓展應(yīng)用至兒童心理學(xué)、精神病學(xué)等更多領(lǐng)域。
附該成果在《自然》雜志上的論文:https://www.nature.com/articles/s41586-025-09215-4?utm_source=ixbtcom