國際數據公司(IDC)最新發布的《中國大模型公有云服務市場分析,2025H1》報告顯示,2025年上半年中國公有云平臺上的大模型調用量達到536.7萬億Tokens,較2024年全年114萬億Tokens的規模增長近400%。火山引擎以49.2%的市場份額領跑行業,阿里云和百度智能云分別以27%和17%的占比位列第二、三位。該統計口徑明確排除云廠商自有業務調用量,例如火山引擎數據不包含抖音、豆包等字節跳動旗下產品的調用數據。
市場增長的核心驅動力來自兩方面:一是泛互聯網和企業級應用場景的持續拓展,客戶群體向三四線城市下沉;二是云廠商不斷豐富的模型體系。IDC特別指出,2025年上半年火山引擎不僅保持市場首位,其份額較2024年的46.4%還有所提升。在模型調用量計算上,中國公有云大模型調用量以月度環比態勢增長,上半年總調用量達5367270億次。
隨著推理模型和多模態模型能力的突破,商業模式日趨成熟。2025年2月DeepSeek-R1的推出加速了國內市場從模型訓練向推理服務的轉型,企業開始更關注資源效率、運營成本和可持續發展。火山引擎的MaaS平臺火山方舟在此背景下表現突出,2025年上半年調用量同比增長398.2%,這一增長既源于客戶群體的擴展,也得益于Agent應用的爆發。
IDC預測,中國生成式AI軟件市場將持續高速增長,預計2028年市場規模將達482.4億元人民幣,未來仍有數百倍增長空間。當前,AI應用特別是智能體(Agent)的爆發已成為驅動模型調用的核心因素,多模態和深度推理大模型成為主要遷移方向。近75%的組織已評估采用多模態基礎模型,這類模型能處理整合文本、圖像、語音等多種數據,顯著提升準確性、效率和用戶體驗。
各大云廠商在多模態領域競爭激烈。火山引擎自2024年推出豆包大模型家族以來,持續迭代多模態能力,2025年相繼發布豆包大模型1.6、視頻生成模型Seedance pro、實時語音模型和圖像創作模型Seedream 4.0。其中,Seedream 4.0在Artificial Analysis和LMArena的文生圖、圖像編輯榜單中多次登頂或位列前茅。這些模型的有效落地,加速了AI應用在各行業的滲透。
面對Agent應用的爆發,火山引擎提供了從算子層到系統層的全鏈路優化,包括PD分離架構、KV-Cache緩存加速、自研推理加速引擎xLLM和vRDMA網絡等技術。其API服務在吞吐、并發、延遲、成本等客戶可感知指標上均處于行業領先水平。火山引擎率先推出以大模型為核心的AI云原生架構,幫助開發者屏蔽底層硬件差異,直接獲取高質量、低成本的Tokens,加速企業Agent落地和業務創新。
AI與泛互聯網的深度融合正在解鎖新場景。2025年6月Force大會披露的數據顯示,AI工具的Tokens消耗在5個月內增長4.4倍,其中AI搜索增長10倍,AI編程增長8.4倍。視覺理解模型(VLM)的助力尤為顯著,K12在線教育的Tokens消耗增長12倍,智能巡檢、視頻檢索等場景日均調用量突破百億Tokens。
從行業應用看,大模型正從泛互聯網向傳統企業滲透。消費電子領域,全球Top10手機廠商中有9家與火山引擎深度合作,應用于語音助手、創作工具等場景;汽車行業,豆包大模型覆蓋智能座艙、自動駕駛標注等全流程,服務奔馳、寶馬、特斯拉等八成主流車企;金融領域,火山引擎為華泰證券、招商銀行等機構提供智能展業、投顧等方案;教育領域,與北京大學、浙江大學等超五成985高校合作,推動教學服務、科研輔助等場景的智能化轉型。