2025年7月17日,2025年RISC-V中國峰會正式在中國上海張江召開。人工智能芯片大廠英偉達(NVIDIA)副總裁 Frans Sijstermanns做了題為《在英偉達計算平臺實現RISC-V應用處理器部署》的主題演講,介紹了英偉達在RISC-V CPU上的發展歷程和成果,并宣布其關鍵的CUDA軟件接下來也將支持在RISC-V上的全面部署。
早在2024年10月,英偉達在RISC-V北美峰會上透露,其在2015年就選定將RISC-V選定為其專有Falcon微控制器(MCU)的繼任架構。由于 MCU 內核是通用的,因此可以在英偉達的產品中廣泛使用。根據英偉達當時的預計,2024年英偉達將交付10億個內置于其 GPU、CPU、SoC 和其他產品中的 RISC-V 處理器,這也凸顯了定制 RISC-V 內核在英偉達硬件中的普遍性和重要性。
在此次RISC-V中國峰會上,Frans Sijstermanns也指出,英偉達是RVI和RISE的董事會成員和技術委員會代表,也是相關規范的貢獻者。英偉達產品中的微控制器都是基于RISC-V架構,具有可配置、可擴展和安全保護功能,并且也被集成在30多個IP中,每年出貨量超過10億個RISC-V MCU。
雖然英偉達在其硬件當中加入了RISC-V CPU內核作為微控制器,但是目前英偉達驅動其GPU進行AI高效加速計算的CUDA軟件(基于C語言和C++語言的拓展)只在x86和Arm架構CPU上得以部署。
為了助力RISC-V在高性能計算/AI計算領域的發展,Frans Sijstermanns在此次RISC-V中國峰會上正式宣布,CUDA將會支持RISC-V架構,“我們現在正在做這樣的一個移植工作,我相信這個未來是非常大有可為的”。
據介紹,CUDA主要包含兩個關鍵組成部分:一個Toolkit,一個是驅動器。CUDA的Toolkit像是一個編譯器一樣,擁有非常好的編譯功能,其中也包括了非常多的組件。
比如一個完整的CUDA加速應用示例,包括特定應用模塊、第三方軟件、CUDA庫代碼,所有軟件都需要映射到目標CPU。在下面這個圖表當中,就是用的PyTorch作為例子,還有CUDA KMD、還有CUDA UMD。英偉達正在做下圖中綠色部分的移植。還有第三方的軟件或者是應用軟件,也是需要進行移植到RISC-V。
CUDA庫也是非常重要的,在所有的垂直行業中可能都需要有自己的一個庫。比如說英偉達的FT的庫能夠加速推理,還有相關的數據分析庫、加速芯片制造的庫等等。
“我們在這一行業已經深耕了20年之久,建立了900多個不同的庫,加速不同的行業技術發展就是我們的目標。移植到RISC-V之后,我們就能落地所有的這些庫,能夠讓大家更快的創新方式進行相關的設計及技術迭代。”Frans Sijstermanns解釋道。
Frans Sijstermanns指出,RISC-V在過去幾年中實現了非常長足的進展。自2022年以來,至少有10個新的規范已經得到了RISC-V國際基金會的批準,其中RVA23是非常重要的規范,同時服務器SoC規范也獲批了。在軟件層上,RISC-V也取得了非常多的進展,現在RISC-V國際基金會官網上就有75個不同的軟件包,它們都已經在RISC-V上“運行”了。比如像Linux這樣的一些操作系統程序,甚至一些工具鏈都已經推出,還包括數據庫、網絡虛擬機等都完成了。“還有一些非常重要的基礎性工作,比如編譯器、模擬、工具鏈等方面的工作,只有這些工作做到位了,我們才能夠進一步的發展。為此,我也想感謝整個RISC-V基金會及生態合作伙伴。”
那么將CUDA移植到RISC-V會面臨哪些挑戰呢?
Frans Sijstermanns表示,關鍵的問題在于RISC-V CPU板卡的可用性,因為對于CUDA移植來說,不僅要有CPU,還要有相關的GPU。比如,英偉達就有用到阿里巴巴達摩院的RISC-V CPU C920,這對于英偉達在開發層面雖然已經很好,但是目前還沒有支持已經獲批的RVA23規范的SoC,因為英偉達需要統一的虛擬內存,這樣才也能夠進一步的去分享CPU和GPU內存之間數據,甚至在這兩者之間進行數據的復制和粘貼,并且保證一致性,從而保障用戶體驗。
“我們現在和整個生態系統中的合作伙伴精誠合作,希望能夠把CUDA進行進一步的改善。與此同時,我們也會希望把這樣一個標準文本的CUDA版本推出來同樣兼容RISC-V,這樣我們才能夠更好的符合服務器的平臺規范以及Linux操作系統的RISC-V標準。”Frans Sijstermanns強調:“我們希望把所有的這些問題在整個系統中解決之后再進行發布。”
除了CPU、GPU之外,NVLink 也是英偉達的關鍵組件,其中也集成了相關的軟件,這些與CPU、GPU一起可以看成是一個完整的系統級NVLink Fusion架構設計,能夠讓整個數據中心能夠更好、更快的工作。
Frans Sijstermanns暗示,在NVLink Fusion框架下,未來RISC-V將會是控制路徑的一部分,在整個系統當中承擔重要角色,甚至成為NVIDIA機架架構當中的與NVLink結合的定制加速器和或定制CPU。
“整個英偉達業務正在去加速計算,其實我們不在乎具體是什么CPU。”Frans Sijstermanns指出:“無論是x86、Arm或者是RISC-V,我們其實都希望能夠兼容。所以,關鍵在于要讓用戶、開發者都能夠有自己的選擇。”
“CUDA能夠很好的幫助我們借助英偉達通信處理器去跟RISC-V服務器處理器實現加速,并且更好的提出相關的全套硬件解決方案,這也是我們從CUDA軟件過度到硬件的愿景。當然,在這方面有非常多的工作要做。與此同時,在整個生態系統、以及整個合作伙伴方面,我們也需要看到有好的RISC-V CPU能夠讓它發揮相關的作用。”Frans Sijstermanns總結說道。
編輯:-浪客劍