在人工智能算力需求持續攀升的背景下,GPU主導的市場格局正迎來多元化變革。非GPU路線的AI專用芯片憑借獨特優勢,逐漸成為行業關注的焦點。這種趨勢不僅體現在美股市場,國內市場同樣呈現出ASIC定制芯片快速發展的態勢。
博通公司近期百億美元訂單的爆發式增長,折射出云服務廠商對替代英偉達GPU生態的技術需求。以谷歌TPU、Groq LPU為代表的專用芯片,正在構建新的技術路徑。這種轉變背后,是產業界對更高費效比的持續追求。中昊芯英聯合創始人鄭瀚尋指出,隨著專用芯片制造成本下降,自研架構的個性化AI解決方案正獲得更多企業青睞。
定制化ASIC芯片的崛起并非偶然。當傳統漸進式技術迭代難以追趕英偉達時,行業開始探索"彎道超車"的可能性。英偉達的成功源于其深厚的工程化積累,這為后來者設置了難以復制的門檻。相比之下,專用芯片在特定場景下的效率優勢日益凸顯,成為打破GPU壟斷的關鍵突破口。
TPU芯片的快速發展印證了這種判斷。自英偉達在Tesla V100中引入Tensor Core以來,張量計算單元的迭代始終是重點。鄭瀚尋分析稱,在大模型時代,張量運算的規模效應顯著:數據傳輸量每增加N倍,計算量可實現N2級增長。這種特性使得TPU在處理大規模數據時,展現出類似"3D打印"的一體化計算優勢,遠超傳統CPU和GPU的運算模式。
面對大模型發展帶來的算力集群挑戰,芯片互聯能力成為新的競爭焦點。中昊芯英已實現千卡集群內1024片芯片的光模塊高速互聯,并探索OCS全光互聯等新技術。這種技術路線與英偉達的InfiniBand形成差異化競爭,后者雖被視為大規模數據中心的首選方案,但其封閉性促使更多廠商轉向以太網生態。
以太網技術的進化正在改變行業格局。頭部企業組建的以太網聯盟推動了物理介質和帶寬能力的顯著提升,特斯拉基于以太網開發的TTPoE協議已實現低延遲傳輸。鄭瀚尋透露,中昊芯英的互聯延遲指標已優于特斯拉公開數據,顯示出國產芯片在技術追趕中的突破。
軟件生態建設成為國產芯片的另一道門檻。面對英偉達閉源的CUDA生態,國內廠商需自主構建工具鏈和軟件棧。鄭瀚尋比喻稱,這類似于早期安卓系統的發展過程,國產芯片需要通過持續優化實現跨平臺兼容。當前Transformer架構的主導地位雖未動搖,但多模態大模型的發展正在推動底層技術的持續創新。
盡管大模型技術持續迭代,但其核心架構仍源于2017年提出的Transformer范式。鄭瀚尋強調,當前主流語言模型的基礎邏輯框架未發生根本性改變,后續優化多集中在細微環節。這種技術穩定性為專用芯片的發展提供了明確的優化方向,也預示著AI算力領域的競爭將進入更深層次的技術比拼階段。