語言,被古希臘哲學家亞里士多德視為人類區別于其他生物的核心特征。他提出,人類是“擁有語言的動物”。如今,隨著人工智能技術的飛速發展,大語言模型(LLM)在模擬人類語言能力方面取得了顯著進展。然而,一個關鍵問題依然存在:在語言的深層結構中,是否存在某些人類獨有的特質,是AI或其他生物無法復制的?
近期,加州大學伯克利分校與羅格斯大學的聯合研究對多個大語言模型進行了一系列語言學測試,試圖解答這一問題。測試內容包括要求模型歸納虛構語言的規則、解析多重歧義以及處理復雜的遞歸結構。結果顯示,大多數模型未能像人類一樣完成這些任務,但OpenAI的o1模型卻展現出驚人的能力,其表現接近語言學研究生的水平。
研究負責人Ga?per Begu?指出,o1不僅能劃分句子成分、解析歧義,還能運用遞歸等復雜語言學特征。這一發現挑戰了人們對人工智能能力的傳統認知。例如,在處理“中心嵌入”結構時,o1能夠像人類一樣理解并構建多層遞歸的句子。
以句子“The worldview that the prose Nietzsche wrote expressed was unprecedented”為例,其結構包含三層遞歸:最外層是“這個世界觀前所未有”,中間層是“那篇散文所表達的”,最內層是“尼采寫的”。o1不僅能正確解析這種結構,還能在要求下進一步增加遞歸層次,生成更復雜的句子。
這種能力表明,o1不僅具備語言使用能力,還擁有“元語言能力”,即思考語言本身的能力。這與傳統觀點形成鮮明對比——許多語言學家認為,大語言模型只是通過預測下一個單詞來生成文本,并未真正理解語言的深層結構。
研究還發現,o1在處理歧義和音韻學任務時表現優異。例如,在解析句子“Eliza wanted her cast out”時,o1能準確區分“cast”作為動詞(驅逐)和名詞(石膏)的兩種含義。面對30種新創建的迷你語言,o1能在無先驗知識的情況下正確推斷語音規則。
這些結果引發了關于AI語言理解能力的深入討論。2023年,語言學家喬姆斯基曾在《紐約時報》撰文指出,語言的復雜性無法僅通過大數據浸泡來掌握。然而,o1的表現似乎對這一觀點提出了挑戰。
那么,為何只有o1能展現出如此強大的能力?研究認為,o1的優勢可能源于其“思維鏈”機制,使其能像人類語言學家一樣逐步推理、驗證假設并構建抽象規則。相比之下,其他模型在這一方面表現較弱。
另一個值得探討的問題是:隨著模型規模的擴大,AI是否會超越人類的語言理解能力?目前尚無定論。一方面,AI尚未提出原創性語言學觀點或教授新知識;另一方面,增加計算能力和訓練數據可能使其在語言技能上超越人類。
盡管研究尚不足以宣稱“機器理解語言勝于人類”,但它為評估語言模型提供了新的視角:從關注“任務產出”轉向關注“結構解釋”。當可解釋性成為首要指標時,AI研究、教育與應用治理或將迎來統一的標準。









