在2025百度世界大會的現(xiàn)場,百度公司重磅推出新一代原生全模態(tài)大模型——文心大模型5.0。這款采用統(tǒng)一自回歸架構的模型,通過原生全模態(tài)建模技術實現(xiàn)了文本、圖像、音頻、視頻等多模態(tài)數(shù)據(jù)的深度融合,參數(shù)量達到2.4萬億級別,標志著我國人工智能技術邁入全新發(fā)展階段。
據(jù)技術團隊介紹,文心5.0突破傳統(tǒng)多模態(tài)模型后期融合的技術路徑,從訓練階段便實現(xiàn)語言、視覺、聽覺等多維度數(shù)據(jù)的原生融合。這種創(chuàng)新架構使得模型在理解復雜信息時,能夠同步調動不同模態(tài)的特征進行協(xié)同優(yōu)化,最終形成統(tǒng)一的多模態(tài)表征體系。在權威基準測試中,該模型的語言理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型持平,圖像視頻生成質量達到垂直領域專業(yè)模型水準。
百度首席技術官王海峰在技術解讀環(huán)節(jié)指出,原生全模態(tài)架構的優(yōu)勢在于實現(xiàn)理解與生成的深度耦合。通過統(tǒng)一的自回歸機制,模型不僅能夠精準解析多模態(tài)輸入,更能生成符合邏輯的多模態(tài)輸出,這種技術突破為智能體規(guī)劃、工具調用等復雜應用場景提供了堅實基礎。
在應用層面,文心5.0展現(xiàn)出全方位的能力提升。測試數(shù)據(jù)顯示,模型在指令遵循準確率、創(chuàng)意寫作質量、事實核查精度等40余項核心指標上均有顯著突破。特別是在跨模態(tài)任務處理中,其智能體規(guī)劃能力較前代提升37%,工具調用成功率達到92%,展現(xiàn)出強大的環(huán)境適應與問題解決能力。
百度創(chuàng)始人李彥宏在主題演講中強調,智能技術的進化正在突破傳統(tǒng)邊界。他指出:"當前大模型的發(fā)展已進入智能躍遷期,模型不僅具備更長的思考鏈,更能通過自我迭代實現(xiàn)能力進化。這種持續(xù)突破的創(chuàng)新能力,正是構建技術壁壘的核心要素。"
在生態(tài)建設方面,百度同步推出文心大模型5.0 Preview版本。個人用戶可通過文心App直接體驗最新功能,開發(fā)者和企業(yè)客戶則能借助千帆大模型平臺調用API服務。值得關注的是,在11月8日發(fā)布的LMArena大模型競技場排名中,文心ERNIE-5.0-Preview-1022在文本任務評測中取得全球并列第二、國內第一的優(yōu)異成績,尤其在復雜邏輯推理和創(chuàng)意內容生成領域表現(xiàn)突出。
行業(yè)分析人士認為,文心5.0的推出標志著我國在多模態(tài)大模型領域實現(xiàn)關鍵技術突破。其原生全模態(tài)架構不僅解決了傳統(tǒng)模型的信息割裂問題,更為智能體、數(shù)字人等前沿應用提供了更強大的技術支撐,有望推動人工智能技術向通用智能方向加速演進。





