在近日舉辦的2025百度世界大會上,一款備受矚目的原生全模態(tài)大模型——文心大模型5.0正式亮相。這一全新模型憑借其卓越的性能和前沿的技術(shù)架構(gòu),迅速成為全場焦點,標(biāo)志著百度在人工智能領(lǐng)域再次取得重大突破。
文心大模型5.0的參數(shù)量高達2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),實現(xiàn)了對文本、圖像、音頻、視頻等多種信息的全面支持。無論是輸入還是輸出,該模型都能游刃有余地處理,展現(xiàn)出強大的全模態(tài)理解與生成能力。在基礎(chǔ)能力方面,文心5.0實現(xiàn)了全面升級,特別是在多模態(tài)理解、指令遵循、創(chuàng)意寫作、事實性以及智能體規(guī)劃與工具應(yīng)用等領(lǐng)域,表現(xiàn)尤為突出。其理解、邏輯、記憶和說服力均達到了新的高度,為用戶提供了更加智能、高效的服務(wù)體驗。
在權(quán)威基準(zhǔn)的綜合評測中,文心大模型5.0的成績斐然。其語言與多模態(tài)理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型不相上下,圖像與視頻生成能力更是與垂直領(lǐng)域?qū)>P拖喈?dāng),穩(wěn)居全球領(lǐng)先地位。這一成績不僅驗證了原生全模態(tài)大模型的能力和潛力,也為百度在人工智能領(lǐng)域的持續(xù)發(fā)展奠定了堅實基礎(chǔ)。
百度創(chuàng)始人李彥宏在大會上表示,大模型技術(shù)正處于快速迭代階段,其智能水平不斷突破極限。他強調(diào),智能本身是最大的應(yīng)用,而技術(shù)迭代速度則是唯一的護城河。百度將繼續(xù)加大投入,研發(fā)更加前沿的模型,不斷推高智能的天花板,為用戶帶來更加智能、便捷的服務(wù)。
百度首席技術(shù)官王海峰進一步介紹了文心大模型5.0的技術(shù)特點。他指出,與業(yè)界多數(shù)多模態(tài)模型采用的后期融合方式不同,文心5.0采用了統(tǒng)一的自回歸架構(gòu)進行原生全模態(tài)建模,實現(xiàn)了理解與生成的一體化。從訓(xùn)練開始,該模型便融合了語言、圖像、視頻、音頻等多模態(tài)數(shù)據(jù),使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,從而實現(xiàn)了原生的全模態(tài)統(tǒng)一理解與生成。
在技術(shù)實現(xiàn)上,文心大模型5.0依托飛槳深度學(xué)習(xí)框架,采用了超稀疏混合專家架構(gòu)進行龐大的全模態(tài)訓(xùn)練。其總參數(shù)規(guī)模超過2.4萬億,但激活參數(shù)比例低于3%,在保持模型強大能力的同時,有效提升了推理效率。該模型還基于大規(guī)模工具環(huán)境合成長程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動鏈的端到端多輪強化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
為了讓更多用戶能夠親身體驗到文心大模型5.0的卓越性能,百度已經(jīng)同步上線了文心大模型5.0 Preview版本,用戶可以直接在文心App中進行體驗。同時,開發(fā)者和企業(yè)用戶也可以通過百度千帆大模型平臺,調(diào)用文心大模型5.0的API服務(wù),進一步拓展其應(yīng)用場景和商業(yè)價值。
值得一提的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務(wù)評測中位列全球并列第二、中國第一。這一成績充分展示了文心大模型在創(chuàng)意寫作、復(fù)雜問題理解等方面的突出表現(xiàn),也為百度在人工智能領(lǐng)域的國際競爭中贏得了更多的話語權(quán)。











