在2025 OCP全球峰會上,英特爾推出了一項突破性技術——將自身Gaudi3 AI加速器與英偉達B200 Tensor Core GPU集成于同一計算架構,構建出高效異構AI系統。這一創新打破了傳統單一廠商硬件方案的局限,為AI計算領域開辟了新的技術路徑。
該系統的核心設計理念在于任務分工優化:英偉達B200 GPU專注于AI模型的預填充階段,而計算密集型的解碼任務則由英特爾Gaudi3加速器承擔。這種分工策略充分發揮了不同硬件的架構優勢,實現了計算資源的高效利用。
在Llama開源大模型的實測中,這套異構系統展現出顯著優勢。與純B200構成的同構系統相比,其同TCO(總體擁有成本)下的性能提升最高達70%,意味著在相同成本投入下,系統算力產出接近翻倍。這一數據驗證了異構架構在成本效益方面的突出表現。
技術細節方面,外媒SemiAnalysis披露該系統除搭載雙核心計算芯片外,還集成了英偉達ConnectX-7 400GbE網卡、BlueField-3 DPU以及博通Tomahawk5 51.2Tb/s交換芯片。這些高端網絡組件的加入,顯著擴展了系統的擴展域,確保多芯片協同工作時的數據傳輸效率。
行業分析師指出,這種跨廠商硬件的深度整合不僅需要技術層面的兼容性突破,更涉及生態系統的協同創新。該系統的成功實踐,為AI基礎設施的建設提供了新的技術范式參考。






