硅谷最新發布的AI行業研究報告引發廣泛關注,這份由OpenRouter與a16z聯合撰寫的《AI發展現狀:基于百萬億Token的實證研究》顯示,開源模型與閉源模型正形成互補格局,中國開源力量成為全球增長的重要引擎。報告基于2024年11月至2025年11月期間OpenRouter平臺300余個模型的使用數據,通過分析真實Token消耗量而非傳統基準測試分數,揭示了AI發展的新趨勢。
研究顯示開源模型使用量持續攀升,預計年底將占據總用量的三分之一。中國開源模型表現尤為突出,其周使用量占比從去年底的1.2%躍升至最高30%,平均占比達13%,與全球其他地區開源模型的13.7%基本持平。值得關注的是,開源市場格局正從DeepSeek主導轉向多元化競爭,下半年MiniMax M2、Kimi K2等新模型相繼涌現,預計年底將形成5-7個模型均分市場的局面。
模型形態方面,中型參數模型(150億-700億參數)正取代小型模型成為市場新寵。報告指出,2024年11月前中型模型市場幾乎空白,但隨著Qwen2.5-Coder-32B等模型的發布,該細分領域迅速崛起。數據顯示用戶更傾向于選擇性能強勁的中型模型或頂級大型模型,小型模型主導市場的時代已告終結。
語言模型的功能定位發生根本性轉變,推理執行能力成為核心競爭力。年初推理相關Token用量微乎其微,現已占據總用量的50%以上。馬斯克旗下xAI的Grok Code Fast 1在推理流量中占比領先,Gemini系列和DeepSeek R1緊隨其后。工具調用功能同樣呈現爆發式增長,從年初僅GPT-4o-mini等少數模型支持,到年中超半數模型具備該能力,Claude 4.5 Sonnet等新模型快速搶占市場份額。
編程和角色扮演成為AI兩大核心應用場景。編程任務用量從年初的11%激增至50%以上,雖然Claude系列長期占據主導地位,但OpenAI市場份額已從2%提升至8%,谷歌保持15%份額,MiniMax等開源模型正在快速崛起。角色扮演領域表現同樣亮眼,在開源模型中占比達52%,DeepSeek超過三分之二的流量來自該場景,顯示出強大的用戶粘性。
不同模型呈現差異化發展路徑:Anthropic專注編程技術任務,80%以上流量來自該領域;谷歌模型應用場景最為廣泛,覆蓋法律、科學等多個領域;xAI近期在編程、角色扮演和學術用途方面增長顯著;OpenAI則從娛樂休閑向技術任務轉型;Qwen模型在編程領域持續發力,角色扮演和科學任務占比隨時間波動。
用戶留存呈現獨特的"水晶鞋效應"——前沿模型發布時能精準鎖定核心用戶群體,這些用戶的任務需求與模型新能力高度匹配,形成長期使用習慣。典型案例包括Claude 4 Sonnet和Gemini 2.5 Pro,其用戶五個月后留存率仍保持40%。報告指出,率先突破關鍵能力的模型即使后續被超越,仍能憑借早期優勢守住市場份額。
區域市場格局發生顯著變化,亞洲地區付費使用量占比從13%翻倍至31%,北美市場雖仍居首位但份額降至不足50%。語言使用方面,英語占據82%主導地位,簡體中文以近5%的份額位居第二。價格因素對使用量的影響遠低于預期,模型降價10%僅帶來0.5%-0.7%的使用量增長,反而可能因"杰文斯悖論"導致總支出不降反升。
研究同時指出數據局限性,OpenRouter平臺主要反映開發者API調用行為,未涵蓋ChatGPT等終端用戶直接訪問流量。平臺定價策略也可能影響模型選擇,例如GPT-5.1與Claude的價格差異會導致數據傾斜。盡管存在這些限制,該報告仍為理解AI發展提供了全新視角和重要參考,完整報告可通過指定鏈接獲取。









