在2025百度世界大會上,百度宣布推出新一代原生全模態(tài)大模型——文心大模型5.0。這款模型參數(shù)量高達2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術,能夠同時處理文本、圖像、音頻、視頻等多種信息輸入與輸出,實現(xiàn)了全模態(tài)理解與生成能力的突破。
據(jù)介紹,文心大模型5.0在基礎能力上實現(xiàn)了全面升級。在多模態(tài)理解、指令遵循、創(chuàng)意寫作、事實性核查、智能體規(guī)劃與工具應用等多個維度,該模型均展現(xiàn)出卓越性能。在40余項權威基準測試中,其語言與多模態(tài)理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型持平,圖像與視頻生成能力則達到垂直領域專精模型水平,躋身全球領先行列。
百度首席技術官王海峰詳細解釋了技術路線創(chuàng)新。他表示,不同于傳統(tǒng)多模態(tài)模型采用的后期融合方式,文心5.0從訓練階段就通過統(tǒng)一的自回歸架構實現(xiàn)原生全模態(tài)建模,將語言、圖像、視頻、音頻等多模態(tài)數(shù)據(jù)深度融合。這種設計使多模態(tài)特征在統(tǒng)一框架下充分交互優(yōu)化,真正實現(xiàn)了原生的全模態(tài)統(tǒng)一理解與生成。
在架構設計上,文心5.0依托飛槳深度學習框架,采用超稀疏混合專家架構。盡管總參數(shù)規(guī)模超過2.4萬億,但激活參數(shù)比例控制在3%以下,既保證了模型強大能力,又顯著提升了推理效率。同時,通過大規(guī)模工具環(huán)境合成復雜任務軌跡數(shù)據(jù),結合思維鏈與行動鏈的端到端強化學習訓練,模型在智能體交互和工具調用方面的能力得到質的提升。
百度創(chuàng)始人李彥宏在會上強調,大模型技術正經(jīng)歷快速迭代,其智能水平持續(xù)突破極限。他指出:"當前模型不僅思考時間延長,更實現(xiàn)了原生全模態(tài)統(tǒng)一,具備自我學習和迭代創(chuàng)新能力。智能本身已成為最大的應用場景,而技術迭代速度將是決定競爭力的關鍵因素。"百度承諾將持續(xù)投入資源,推動模型技術向更高智能水平發(fā)展。
在應用落地方面,文心大模型5.0 Preview版本已同步上線文心App,普通用戶可直接體驗其強大功能。同時,開發(fā)者和企業(yè)用戶可通過百度千帆大模型平臺調用API服務,快速集成到各類應用場景中。值得關注的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務評測中取得全球并列第二、中國第一的優(yōu)異成績,尤其在創(chuàng)意寫作和復雜問題理解方面表現(xiàn)突出。









