meta AI公司近期攜手美國能源部勞倫斯伯克利國家實驗室,共同推出了一項化學領域的重大突破——Open Molecules 2025(OMol25)數據集與通用原子模型Universal Models for Atoms(UMA)。
OMol25數據集堪稱化學研究的全新“瑞士軍刀”。作為迄今為止規模最大的分子模擬數據集,它包含了超過1億個基于密度泛函理論(DFT)計算的3D分子快照。DFT是一種強大的工具,能夠精確模擬原子間的相互作用,幫助科學家深入探究分子運動和化學反應的規律。然而,傳統的DFT計算對計算資源的需求極高,即便是最先進的計算設備,在面對現實世界中復雜的分子系統時也顯得力不從心。
為了克服這一挑戰,meta AI與勞倫斯伯克利國家實驗室利用OMol25數據集訓練了機器學習原子間勢(MLIPs)。這些MLIPs能夠以快1萬倍的速度提供與DFT同等精度的預測,使得科學家能夠在普通的計算系統上模擬大型原子系統。OMol25作為化學多樣性極高的分子數據集,為MLIPs的訓練提供了寶貴的數據支持。
與此同時,meta AI還推出了UMA模型,這是一個基于過去五年meta FAIR公開數據集構建的通用原子間勢能模型群。UMA覆蓋了分子、材料、觸媒等多個化學領域,利用超過50億個原子組成的3D結構作為訓練數據。UMA分為UMA-small和UMA-medium兩種規模,其中UMA-medium模型擁有14億參數,但單結構計算僅用約5000萬參數,從而加快了推理速度。
UMA模型無需微調,僅通過預訓練即可應對多種化學任務,其性能甚至超越了現有的專用模型。研究表明,UMA在分子特性預測、材料設計、觸媒開發、能量存儲以及半導體制造等多個領域都表現出了卓越的性能。其高精度與快速計算能力為科學研究和工業應用開辟了全新的道路,推動了跨領域的技術革新。
隨著OMol25數據集和UMA模型的推出,化學領域的研究者們將擁有更為強大的工具來探索分子的奧秘,推動化學科學的不斷發展。