在2025百度世界大會上,百度正式推出其最新力作——原生全模態(tài)大模型文心大模型5.0。這款模型以其高達(dá)2.4萬億的參數(shù)量和原生全模態(tài)統(tǒng)一建模技術(shù),成為行業(yè)矚目的焦點(diǎn)。它不僅能夠理解文本、圖像、音頻和視頻等多種信息,還能實(shí)現(xiàn)這些模態(tài)的生成,為用戶提供全方位的智能體驗(yàn)。

文心大模型5.0在基礎(chǔ)能力上實(shí)現(xiàn)了全面升級,尤其在多模態(tài)理解、指令遵循、創(chuàng)意寫作、事實(shí)性以及智能體規(guī)劃與工具應(yīng)用方面表現(xiàn)卓越。經(jīng)過40余項(xiàng)權(quán)威基準(zhǔn)的綜合評測,該模型的語言與多模態(tài)理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型不相上下,圖像與視頻生成能力更是與垂直領(lǐng)域的專精模型相當(dāng),展現(xiàn)了其全球領(lǐng)先的技術(shù)水平。
百度創(chuàng)始人李彥宏在大會上強(qiáng)調(diào),大模型技術(shù)正處于快速迭代階段,其智能水平不斷突破極限。他指出,隨著模型思考時(shí)間的延長和原生全模態(tài)的統(tǒng)一,大模型將具備自我學(xué)習(xí)和迭代的能力,甚至能夠創(chuàng)新。李彥宏表示,智能本身是最大的應(yīng)用,而技術(shù)迭代的速度則是百度構(gòu)建護(hù)城河的關(guān)鍵。百度將持續(xù)投入研發(fā),推動智能技術(shù)的不斷進(jìn)步。
百度首席技術(shù)官王海峰進(jìn)一步介紹了文心大模型5.0的技術(shù)特點(diǎn)。他表示,與業(yè)界多數(shù)采用后期融合方式的多模態(tài)模型不同,文心5.0采用了統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,實(shí)現(xiàn)了理解與生成的一體化。這種技術(shù)路線從訓(xùn)練階段便融合了語言、圖像、視頻、音頻等多模態(tài)數(shù)據(jù),使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,從而實(shí)現(xiàn)了原生的全模態(tài)統(tǒng)一理解與生成。

依托飛槳深度學(xué)習(xí)框架,文心大模型5.0采用了超稀疏混合專家架構(gòu)進(jìn)行全模態(tài)訓(xùn)練,總參數(shù)規(guī)模超過2.4萬億,但激活參數(shù)比例低于3%。這一設(shè)計(jì)在保持模型強(qiáng)大能力的同時(shí),有效提升了推理效率。該模型還基于大規(guī)模工具環(huán)境合成長程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
目前,文心大模型5.0 Preview已同步上線文心App,用戶可以直接體驗(yàn)其強(qiáng)大的功能。同時(shí),開發(fā)者和企業(yè)用戶也可以通過百度千帆大模型平臺調(diào)用文心大模型5.0的API服務(wù),進(jìn)一步拓展其應(yīng)用場景。
值得一提的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務(wù)評測中位列全球并列第二、中國第一,尤其在創(chuàng)意寫作和復(fù)雜問題理解方面表現(xiàn)尤為突出,再次證明了百度在大模型領(lǐng)域的領(lǐng)先地位。









