中國電信研究院攜手中國科學院計算技術研究所、華為昇騰及沐曦等合作伙伴,依托中國電信云網融合技術中試驗證平臺,成功完成了一項具有里程碑意義的技術突破——業界首個面向國產算力的跨架構大模型推理技術驗證。這一成果標志著我國在人工智能算力適配領域邁出了重要一步。
此次技術攻關的核心項目為“Triton統一跨架構推理框架”,由中國電信研究院主導研發。該框架通過自主研發的Triton跨架構編譯器與統一大模型算子庫,實現了同一套算子源碼在英偉達、昇騰、沐曦三類主流芯片上的無縫兼容運行。這一創新解決了不同芯片架構間算子適配的難題,為國產算力生態的統一化發展提供了關鍵技術支撐。
在驗證過程中,團隊完成了10余款主流開源模型在三類芯片上的端到端推理測試。測試數據顯示,該框架在多項核心指標上表現突出:平均遷移時間縮短至3天以內,較傳統適配模式效率提升超過80%;模型推理精度誤差控制在0.5%以下,確保了輸出結果的可靠性;在同等延遲約束條件下,系統吞吐量達到各芯片原生算子庫的90%以上,實現了性能與適配效率的雙重優化。
為進一步提升技術實用性,框架還內置了benchmark與Profiling工具,可一鍵生成跨芯片性能對比報告。這一功能為業務方在芯片選型時提供了直觀的數據參考,有助于根據實際需求選擇最優算力方案,降低技術遷移成本。
作為中國電信集團的核心研發機構,中國電信研究院長期聚焦6G、光網絡、衛星通信等前沿領域的技術攻關。此次跨架構推理框架的成功驗證,不僅展現了其在人工智能算力領域的創新能力,也為國產芯片生態的協同發展提供了可復制的技術路徑。











