華為開發(fā)者大會2025見證了盤古大模型5.5的震撼發(fā)布,此次發(fā)布由華為常務董事、華為云計算業(yè)務首席執(zhí)行官張平安親自揭曉。此次升級涵蓋了自然語言處理(NLP)、計算機視覺(CV)、多模態(tài)應用、預測能力以及科學計算五大核心領域,為各行業(yè)注入了前所未有的創(chuàng)新動力。
張平安在大會上鄭重推出了盤古NLP大模型的最新版本,這一版本以一個龐大的718B深度思考模型為核心,集結了256個專家模塊構成的MoE大模型。它在知識推理、工具應用及數(shù)學運算等多個維度實現(xiàn)了顯著的性能飛躍,標志著基于昇騰云的軟硬件全棧訓練能力,能夠孕育出世界級的大模型。
盤古大模型5.5在用戶體驗上也取得了顯著進步,尤其是在高效處理長序列信息、減少幻覺現(xiàn)象、快慢思考融合以及智能代理(Agent)功能方面。通過引入自適應快慢思考合一技術,該模型能夠根據(jù)問題的復雜程度智能調(diào)整思考速度,實現(xiàn)簡單問題迅速響應,復雜問題深度剖析,整體推理效率提升了八倍。盤古深度研究工具DeepDiver通過一系列創(chuàng)新技術,如長鏈難題合成和漸進式獎勵機制,極大地提高了網(wǎng)頁搜索和常識問答等應用的執(zhí)行效率。
在預測領域,盤古大模型采用了業(yè)界首屈一指的triplet transformer統(tǒng)一預訓練架構,這一架構能夠高效地將不同行業(yè)數(shù)據(jù)轉化為統(tǒng)一的三元組編碼,并在同一框架內(nèi)進行預訓練,從而顯著提升了預測模型的精度和跨行業(yè)、跨場景的適應能力。
科學計算方面,華為云不斷拓展盤古大模型的應用邊界,與多個科學領域深度融合。例如,深圳氣象局借助盤古大模型升級了“智霽”系統(tǒng),實現(xiàn)了AI集合預報,有效降低了預報誤差。重慶市氣象局則針對成渝地區(qū)的降水特點,開發(fā)了“天資?12h”氣象大模型,顯著提高了災害天氣的日內(nèi)預警能力。深圳能源公司則利用盤古大模型進行中短期風光水發(fā)電量的精準預測,有效減少了能源浪費。
盤古CV大模型同樣迎來了重大升級,華為云推出了全新的300億參數(shù)MoE架構視覺大模型,這是目前業(yè)界規(guī)模最大的視覺模型,支持包括圖像、紅外、激光點云、光譜、雷達在內(nèi)的多維度泛視覺感知與分析。該模型還通過跨維度生成技術,構建了涵蓋油氣、交通、煤礦等工業(yè)場景的稀缺故障樣本庫,大幅提升了業(yè)務場景的識別精度和種類。
在多模態(tài)應用方面,盤古大模型推出了全新的世界模型,這一模型能夠為智能駕駛和具身智能機器人的訓練構建所需的數(shù)字物理空間,實現(xiàn)持續(xù)優(yōu)化和迭代。以智能駕駛為例,僅需輸入初始行車場景、控制信息和路網(wǎng)數(shù)據(jù),盤古世界模型即可生成各攝像頭的行車視頻和激光雷達點云,為智能駕駛提供了大量低成本的高質(zhì)量訓練數(shù)據(jù)。
過去一年中,盤古大模型在30多個行業(yè)、超過500個場景中得到了廣泛應用,尤其在政務、金融、制造、醫(yī)療、煤礦、鋼鐵、鐵路、自動駕駛和氣象等領域展現(xiàn)了巨大價值,正逐步重塑各行各業(yè),引領行業(yè)AI的新風尚。