在華為開發(fā)者大會HDC2025的盛會上,華為云計算迎來了一個重要的里程碑時刻。華為常務董事兼云計算業(yè)務CEO張平安,向全球開發(fā)者隆重推出了盤古大模型的最新版本——5.5版。此次升級涵蓋了自然語言理解NLP、計算機視覺CV、預測、多模態(tài)以及科學計算五大核心領域,為行業(yè)應用注入了全新的活力與價值。
張平安強調,盤古大模型5.5是在昇騰云的全棧軟硬件環(huán)境下精心訓練而成,這一成就標志著昇騰架構在全球大模型競爭中邁出了堅實的一步,具備了打造世界級大模型的能力。
在自然語言理解領域,盤古大模型5.5引入了全新的718B深度思考模型,該模型由256個專家系統(tǒng)組成的MoE架構支撐,尤其在知識推理、工具調用及數(shù)學處理方面展現(xiàn)出了卓越的能力。通過一系列創(chuàng)新算法,如通算掩蓋、全局動態(tài)均衡以及分組混合專家MoGE等,盤古大模型實現(xiàn)了與昇騰平臺的深度整合,訓練效率與單卡推理性能均達到了業(yè)界領先水平。模型親和的詞表設計、三明治架構以及EP-Group負載均衡loss等技術,進一步增強了模型的競爭力,使之與業(yè)界頂尖模型比肩。
在用戶體驗方面,盤古大模型5.5也進行了全面升級。例如,通過自適應快慢思考合一技術,模型能夠根據(jù)問題的難易程度智能切換思考模式,簡單問題迅速響應,復雜問題則進行深入分析,整體推理效率提升了8倍。盤古深度研究工具DeepDiver憑借長鏈難題合成與漸進式獎勵等關鍵技術,在網頁搜索、常識性問答等應用場景中表現(xiàn)出色,能夠在極短時間內完成復雜問答與專業(yè)報告的生成,極大提升了工作效率。
張平安在會上還分享了盤古大模型在計算機視覺CV、預測、多模態(tài)以及科學計算等其他基礎模型上的技術進展。他指出,盤古大模型不僅在技術上取得了突破,更在農業(yè)、工業(yè)、科研等多個領域實現(xiàn)了豐富的創(chuàng)新應用和落地實踐,為行業(yè)難題提供了切實可行的解決方案,成為了推動行業(yè)AI發(fā)展的先鋒力量。