在人工智能計算領域,NVIDIA憑借CUDA軟件棧長期占據主導地位,其專為AI開發者設計的工具鏈因硬件綁定特性,為AMD等競爭對手設置了較高的技術門檻。如今,AMD正通過新一代軟件生態發起挑戰——ROCm 7.0軟件棧的發布籌備工作已進入關鍵階段。
據技術社區Phoronix披露,AMD已在GitHub平臺部署ROCm 7.0核心組件的發布標簽,涉及ROCm/hip、ROCm/aomp等關鍵倉庫的"rocm-7.0.0"版本標識。同步公開的還有HIP編程接口、AOMP編譯器及核心庫的7.0.0版本標簽,這些技術動作表明項目已進入發布倒計時階段。開發者社區普遍認為,這將是AMD構建AI計算生態的重要轉折點。
在近期舉辦的Advancing AI技術峰會上,AMD詳細闡釋了ROCm 7.0的技術突破。該版本針對AI推理場景進行深度優化,相比前代ROCm 6實現3.5倍的性能提升。更引人注目的是其訓練能力突破——基于Instinct MI355X加速卡的測試顯示,在DeepSeek R1模型訓練中,FP8精度下的吞吐量較NVIDIA Blackwell B200提升30%,展現出更強的訓練效率。
技術升級涵蓋五大核心方向:支持最新AI算法與模型架構、強化大規模部署管理能力、深度適配MI350系列硬件、優化集群調度系統,以及新增企業級安全特性。這些改進直指當前AI計算生態的痛點,特別是針對多節點集群管理和企業級應用場景的優化,顯示出AMD瞄準數據中心市場的戰略意圖。
雖然官方尚未公布具體發布日期,但技術準備與硬件發布節奏的同步暗示,完整版軟件棧可能在數周內正式亮相。行業分析師指出,ROCm 7.0的推出時機與AMD新一代AI加速卡的上市周期高度吻合,這種軟硬件協同策略或將改變現有市場格局。隨著GitHub倉庫的持續更新,開發者社區正密切關注這場可能重塑AI計算生態的技術變革。