高通于近日正式推出AI200與AI250兩款面向數據中心的AI推理芯片,同步發布基于這兩款芯片的加速卡及機架級解決方案。根據規劃,AI200將于2026年投入商用,AI250則定檔2027年。這一動作標志著高通在數據中心領域持續加碼,試圖在AI推理芯片的藍海市場中搶占先機。
資本市場對高通的新品發布反應熱烈。消息公布當日,高通股價盤中一度飆升22%至205美元,創下2024年6月下旬以來的新高,最終收于每股188美元,漲幅達11.09%。摩根大通、美銀證券、TD Cowen等多家投行同步更新評級,維持“買入”建議,部分機構將目標價上調至200美元。與此同時,高通宣布與沙特阿拉伯AI企業HUMAIN達成合作,共同推動AI200和AI250的落地應用。HUMAIN正在開發阿拉伯語多模態大語言模型,雙方計劃將其與高通邊緣設備生態深度整合,構建從芯片到應用的完整技術鏈條。
AI推理芯片的市場需求正隨著AI應用的普及而快速增長。與訓練階段依賴強大并行計算能力不同,推理場景更注重能效、時延和成本控制。高通此次推出的新品在技術設計上聚焦于平衡總擁有成本(TCO)與性能。AI200的機架級解決方案支持每張卡768GB的LPDDR內存,旨在提升內存容量并降低成本;AI250則首次采用近內存計算架構,顯著提高內存帶寬的同時降低功耗。兩種方案均配備直接液冷散熱系統,通過PCIe實現縱向擴展,以太網完成橫向擴展,并采用機密計算技術保障AI工作負載的安全性,單機架功耗控制在160kW。
當前,AI推理市場已成為科技巨頭競逐的焦點。今年9月,AI推理初創公司Groq宣布完成7.5億美元融資,計劃建設全球最大推理數據中心;OpenAI與甲骨文達成合作,未來五年將采購逾3000億美元的推理算力,這一消息直接推動甲骨文股價單日最大漲幅超36%。巴克萊銀行研究機構預測,到2026年,AI推理計算需求將占通用人工智能總需求的70%以上,甚至可能達到訓練需求的4.5倍。為填補這一缺口,芯片資本支出需增加至當前預測的4倍,總額接近3000億美元。
面對激烈競爭,高通并非孤軍奮戰。今年4月,谷歌在Google Cloud Next 25大會上發布TPU芯片“Ironwood”,宣稱其為首個專為大規模AI推理設計的加速器;9月,英偉達推出基于Rubin架構的“RubinCPX” GPU,瞄準AI視頻生成和軟件開發等推理任務,計劃2026年底上市;同月,華為在全聯接大會上發布昇騰950PR,重點提升推理Prefill性能,預計2026年第一季度面世。從2026年起,高通將與這些企業正面交鋒。若按巴克萊預測的3000億美元市場計算,即便僅占據1%的份額,高通也將獲得可觀的營收增長。
高通在數據中心領域的布局早已開始,但成效尚未顯現。盡管自2019年起陸續推出Cloud AI 100、Cloud AI 100 Ultra等推理芯片,但其AI業務對營收的貢獻幾乎可以忽略不計。根據2025年第三財季報告,高通半導體業務營收89.93億美元,主要來自手機芯片、汽車芯片和物聯網業務;技術授權板塊營收13.18億美元。此前,高通曾多次嘗試拓展數據中心市場,但進展不順。2018年,服務器芯片負責人離職,部門裁員50%,市場一度認為其已放棄該領域。直到2024年,高通確認重返數據中心市場,并加速推進產品落地。
2025年5月,高通宣布計劃采用英偉達技術定制生產數據中心CPU,以搭配英偉達GPU使用;6月,其全資子公司以24億美元收購半導體IP企業Alphawave,后者在高端接口IP領域具有優勢,可增強高通在數據中心市場的競爭力,收購預計2026年第一季度完成。高通總裁兼CEO Cristiano Amon在第三財季業績說明會上透露,公司正與一家超大規模云端服務供應商深入洽談,最快將于2028會計年度開始貢獻數據中心相關營收。
除AI領域外,高通還在智慧駕駛和物聯網等場景加速布局。值得注意的是,蘋果與高通的基帶購買協議將于2026年末到期,而蘋果目前占高通營收約20%。如何在蘋果“撤出”后培育新的營收支柱,將成為高通未來需要解決的關鍵問題。











