meta公司近日正式推出并開源了其首款代碼世界模型(Code World Model, CWM),這一創新架構由圖靈獎得主Yann LeCun親自推動,將世界模型的前沿理念首次應用于代碼生成領域。
該模型的核心突破在于模擬人類程序員的思維模式——在編寫代碼前,先通過內部模擬預判代碼的執行效果。與傳統語言模型“逐詞生成”的機械式輸出不同,CWM通過融合Python與Bash環境的專屬訓練數據,能夠提前預測代碼指令的運行結果,再反向生成符合需求的代碼邏輯,從根源上提升了生成質量。
以“統計字符串‘strawberry’中字母‘r’的數量”這一易錯任務為例,CWM會像調試器(pdb)一樣分步驟推演執行過程,確保代碼邏輯的準確性。這種“先模擬后生成”的機制,使其在復雜任務中表現出顯著優勢。
實測數據顯示,這款參數量僅320億的模型在多項基準測試中表現亮眼:在真實開源項目缺陷修復評測SWE-bench Verified中,CWM以65.8%的準確率與閉源模型Gemini-2.5-Thinking持平,躋身開源模型第一梯隊;在LiveCodeBench、Math-500、AIME 2024等測試中,分別取得68.6%、96.6%、76.0%的高分。目前,meta已開放三個不同用途的模型版本供開發者使用。
值得注意的是,CWM目前仍處于概念驗證階段。meta僅投入有限算力進行開發,核心目標是驗證“世界模型+代碼生成”技術路徑的可行性。這意味著當前版本更接近技術演示(Demo),更大規模的迭代產品或將在后續推出。