隨著科技行業的快速發展,ASIC(專用集成電路)市場正經歷著前所未有的增長浪潮。據摩根士丹利的預測,AI ASIC市場規模將在未來幾年內實現顯著飛躍,從2024年的120億美元猛增至2027年的300億美元,年復合增長率高達34%。這一增速遠高于同期高性能計算GPU市場的25%增長率,以及CPU和APU的5%和8%增長率。
驅動這一市場擴張的主要因素之一,是人工智能服務器需求的激增。TrendForce的最新研究報告指出,美國主要的云計算服務提供商(CSP)正在加速內部開發ASIC芯片的步伐,平均每1至2年便推出新一代產品。在中國,面對美國即將實施的新出口管制政策,人工智能服務器市場也在逐步調整,預計進口芯片(如NVIDIA和AMD產品)的市場份額將在2025年降至42%,而中國本土芯片制造商的市場份額則將提升至40%。
定制芯片的選擇,對于許多企業而言,不僅是一種技術上的優化,更是一種經濟上的考量。面對GPU服務器的算力缺口和部分產品的供應限制,許多頭部互聯網企業選擇增大自研ASIC芯片服務器的部署數量,以降低成本并更好地適配自身業務場景。例如,AWS的Trainium 2 ASIC芯片在同等預算下,比英偉達的H100 GPU更快完成推理任務,性價比提高了30%~40%。而即將推出的Trainium 3,計算性能更是提高了2倍,能效提高40%。
在全球范圍內,大型云計算和大模型廠商如谷歌、亞馬遜、meta、OpenAI等,都在加速布局定制化ASIC。谷歌的TPU作為ASIC的典型代表,已經從2016年的首款產品發展到今年的第七代Ironwood。這款AI加速器在大規模部署的情況下,計算能力能達到全球最快超級計算機的24倍以上,每塊芯片的峰值計算能力可達4614 TFLOPs,配備192GB高帶寬內存,內存帶寬達到7.2 terabits/s。
在國內,中昊芯英等企業也在積極布局TPU芯片市場。中昊芯英的創始人及CEO曾透露,公司成功實現了全自研的專為AI訓練而生的中國首枚高性能TPU訓練芯片“剎那”的量產交付。這款芯片在處理大規模AI模型訓練和推理任務時,計算性能超越英偉達A100,系統集群性能更是十倍于傳統GPU,能耗僅為傳統GPU的一半,單位算力成本僅為國外產品的42%。
在市場競爭方面,博通以55%~60%的份額位居ASIC市場第一,Marvell則以13%~15%的份額位列第二。博通的核心優勢在于定制化ASIC芯片和高速數據交換芯片,其AI相關收入在2025財年第一季度同比增長77%,占總營收的28%。博通與meta合作開發的第三代MTIA芯片,以及與OpenAI合作的兩代ASIC芯片項目,都將成為其未來增長的重要動力。Marvell的定制芯片業務也正成為其強勁增長的核心動力之一,主要來自亞馬遜的Trainium 2和谷歌的Axion Arm CPU處理器。
國內企業也在積極研發ASIC。寒武紀科技正在擴展其思元(MLU)芯片系列,以支持云端的AI訓練和推理。阿里巴巴推出了含光800云端AI推理芯片,峰值性能為7.8萬IPS,峰值能效達到500IPS/W。百度則量產了昆侖芯二代,并宣布使用昆侖芯三代P800構建了首個自研萬卡集群,在成本上實現了顯著降低。騰訊則通過自主研發和戰略投資,推出了紫霄推理芯片,并在多個頭部業務中落地應用。
然而,ASIC市場的增長也帶來了新的挑戰。芯片設計成本不斷攀升,尤其是先進芯片設計,已經變得非常昂貴。企業需要認真考慮,是否真的需要自主設計CPU。畢竟,在追求技術自主的同時,也需要權衡成本和效益。