國際數據公司(IDC)最新發布的《中國大模型公有云服務市場分析,2025H1》報告顯示,2025年上半年中國公有云平臺大模型調用量達536.7萬億Tokens,較2024年全年114萬億Tokens增長近4倍。這一數據不僅反映AI技術落地速度,更揭示中國AI云市場正經歷從模型訓練向推理服務的結構性轉變。
在市場格局方面,火山引擎以49.2%的份額占據半壁江山,較2024年46.4%的市場占比進一步擴大領先優勢。阿里云百煉平臺和百度智能院千帆平臺分別以27.0%和17.0%的份額位列二、三位。這種集中化趨勢背后,是云服務商對模型推理服務價值的深度挖掘——IDC指出,當前市場需求已從模型訓練轉向推理場景,企業更關注資源效率、運營成本和可持續發展。
報告特別強調Tokens作為核心統計指標的戰略意義。與傳統IaaS層算力供給統計不同,Tokens直接反映模型實際調用次數,每個Token對應文本生成、圖像分析等具體業務場景。以火山引擎為例,其統計未包含抖音等自有業務的Token消耗,這種"去水分"的統計方式更能體現商業市場的真實需求。數據顯示,某消費電子企業引入視覺理解模型后,5個月內Token消耗增長12倍,日均突破百億Tokens,直接印證應用落地的經濟效益。
市場增長的兩大關鍵拐點印證了這種轉變。2024年7月,豆包大模型通過技術創新將主力模型定價從"分計價"降至"厘計價",降幅達99.3%,推動當月公有云服務YoY增長率超過160%。2025年2月,DeepSeek-R1推理模型的爆紅再次引發市場質變,當月增長幅度達60%,標志著中國AI云市場正式進入"推理時代"。這兩個節點恰好對應Tokens成為核心衡量指標的行業邏輯——當模型成本足夠低、應用場景足夠豐富時,企業才會持續產生大規模Token調用。
從產業價值看,Tokens消耗量呈現三方面特征:其一,與業務落地強綁定,只有模型實用性和場景豐富度提升,才會驅動企業持續調用;其二,形成可持續商業模式,相比傳統"賣算力"的一次性交易,"賣Tokens"的經常性收入倒逼廠商優化模型能力;其三,具備指數級增長潛力,國家數據局數據顯示,中國日均Token消耗量從2024年初的1000億增至2025年6月的30萬億,一年半增長300倍。某ICT企業預測,若價格維持當前水平,火山引擎未來1-2年Token調用收入或達百億元。
火山引擎的突圍路徑凸顯戰略前瞻性。不同于傳統云廠商對IaaS的依賴,該公司從2024年起將MaaS(模型即服務)提升至戰略高度,投入遠超營收規模的資源。技術層面,豆包大模型家族已覆蓋文本、圖像、音頻、視頻等多模態領域,其中圖像創作模型Seedream 4.0的文生圖能力居全球首位,視頻生成模型Seedance 1.0 pro登頂盲測榜單。平臺層面,"火山方舟"MaaS平臺通過PD分離架構、KV-Cache緩存加速等技術,使DeepSeek-R1模型每秒Token輸出量達到行業平均水平的2.6倍。
規模優勢則來自字節跳動的技術體系復用。支撐火山引擎外部客戶的基礎設施團隊,與服務抖音、飛書等內部業務的團隊為同一體系。這種架構使火山引擎在服務外部客戶前,已在日均超萬億Token調用的抖音推薦系統等場景中驗證技術穩定性。目前,其客戶覆蓋全球9家Top10手機廠商、8成主流汽車品牌、70%系統重要性銀行及超五成985高校,跨行業客戶的持續調用進一步鞏固其市場地位。
IDC報告指出,隨著多模態技術和Agent應用的成熟,單個任務消耗的Tokens量將呈幾何級數增長。在這場變革中,模型效果、成本優勢和性能強度成為競爭關鍵。火山引擎憑借戰略定力、技術積累和規模效應,已在MaaS賽道建立顯著優勢,其49.2%的市場份額不僅是數字突破,更預示著在AI應用爆發期將扮演更重要角色。











