在2025 OCP全球峰會上,英特爾公布了一款突破性的異構(gòu)AI計算系統(tǒng),該系統(tǒng)創(chuàng)新性地將英特爾Gaudi3 AI加速器與英偉達B200 Tensor Core GPU進行深度整合,構(gòu)建出混合計算架構(gòu)。這一設(shè)計打破了傳統(tǒng)同構(gòu)計算模式的局限,通過硬件資源的優(yōu)化配置實現(xiàn)了性能與能效的雙重提升。
據(jù)技術(shù)細節(jié)披露,該平臺采用分工協(xié)作模式:英偉達B200 GPU專司AI模型的預填充階段,利用其強大的并行計算能力快速完成初始數(shù)據(jù)處理;英特爾Gaudi3加速器則負責后續(xù)的解碼環(huán)節(jié),憑借其專用架構(gòu)實現(xiàn)高效推理運算。這種異構(gòu)協(xié)同機制在Llama開源模型測試中展現(xiàn)出顯著優(yōu)勢,與純B200方案的同總擁有成本(TCO)相比,系統(tǒng)性能提升幅度最高達70%。
在基礎(chǔ)架構(gòu)層面,該系統(tǒng)集成了多家科技巨頭的核心組件。網(wǎng)絡(luò)連接部分采用英偉達ConnectX-7 400GbE智能網(wǎng)卡與BlueField-3 DPU數(shù)據(jù)處理器,構(gòu)建起超高速數(shù)據(jù)傳輸通道;交換架構(gòu)則選用博通Tomahawk 5芯片組,提供高達51.2Tb/s的交換容量,為大規(guī)模分布式計算提供堅實支撐。這種跨廠商的硬件整合,使得系統(tǒng)具備更強的擴展性和適應(yīng)性。
行業(yè)分析指出,這種異構(gòu)計算模式代表著AI基礎(chǔ)設(shè)施發(fā)展的重要方向。通過將不同廠商的專用硬件進行優(yōu)化組合,既能發(fā)揮各組件的技術(shù)優(yōu)勢,又能避免單一供應(yīng)商方案可能存在的性能瓶頸。特別是在處理復雜AI任務(wù)時,異構(gòu)架構(gòu)展現(xiàn)出的靈活性和效率提升,或?qū)⑼苿訑?shù)據(jù)中心架構(gòu)進入新的發(fā)展階段。











