近期,一項跨學科合作的研究成果在計算機科學與法律領域引起了轟動。斯坦福大學、康奈爾大學以及西弗吉尼亞大學的學者聯手,深入探究了幾款開源大型語言模型對于文本信息的記憶能力。他們特別關注了五款開源權重模型,測試它們能否復述經典文學作品的內容。這五款模型中,meta貢獻了三款,而微軟和EleutherAI則分別提供了一款。
令人矚目的是,meta在2024年推出的Llama3.170B模型,在重現《哈利波特》第一部內容時,展現出了驚人的42%記憶準確率。相比之下,meta于2023年發布的Llama165B模型在這一測試中僅達到了4.4%的準確率。這一顯著的性能提升迅速吸引了學術界的目光。研究還發現,Llama3.170B在熱門書籍如《霍比特人》和喬治·奧威爾的《1984》上的記憶表現尤為突出,遠超其他參與測試的模型。
這項研究不僅揭示了大型語言模型在文本記憶領域的巨大進步,也進一步激發了人們對于未來AI技術文本處理和理解能力的無限遐想。隨著技術的不斷演進,人工智能正日益接近人類的認知界限。