在人工智能領域,一場新的創新風暴正席卷全球,而這場風暴的源頭之一便是中國初創企業DeepSeek。近日,英偉達公司(Nvidia)首席執行官黃仁勛在業績電話會議上高度評價了DeepSeek及其推出的DeepSeek-R1模型,認為這一創新不僅點燃了全球對AI的熱情,更重要的是,它開源了一個世界級推理AI模型。
黃仁勛表示:“DeepSeek-R1激發了全球的熱情,這是一項杰出的創新。但更為重要的是,它開源了一個世界級的推理AI模型。現在,幾乎所有的AI開發者都在應用R1或思維鏈及強化學習等技術來提升其模型的性能。”
據悉,DeepSeek在今年1月底震驚了華爾街和硅谷,其聲稱其推理模型R1的性能可與OpenAI的GPT等領先產品相媲美,但成本卻大幅降低。DeepSeek僅用558萬美元就訓練出了其V3大型語言模型(LLM)。該公司透露,他們使用了2048個英偉達H800芯片,這是英偉達H100芯片的降級版本,旨在遵守美國的出口限制。
DeepSeek在AI訓練方面的能效對資本支出(CapEx)的熱潮產生了一定沖擊。杰富瑞(Jefferies)評論稱,對于AI建設者來說,這可能帶來潛在的負面影響,因為AI企業面臨越來越大的壓力來證明其不斷增長的CapEx計劃的合理性,這最終可能導致數據中心收入和利潤增長的軌跡降低。
盡管投資者對DeepSeek基于低成本英偉達芯片構建的新模型感到擔憂,但英偉達對AI發展的強勁需求仍保持樂觀。黃仁勛認為,未來的推理模型將消耗更多的計算能力,并指出“我們才剛剛開始推理AI和推理時間擴展”,多模態AI、企業AI、主權AI和物理AI即將來臨。展望未來,數據中心將把大部分的CapEx用于加速計算和AI,AI數據中心將越來越成為AI工廠。
當被問及DeepSeek和其他創新是否改變了他對明年仍能持續強勁需求的信心時,黃仁勛指出,AI初創企業需要大量的計算能力。他表示:“我們對數據中心正在建設的資本投資規模有相當清晰的認識。我們知道,未來絕大多數軟件都將基于機器學習。因此,加速計算和生成式AI、推理AI將成為您數據中心中想要的架構類型。”
黃仁勛還指出,仍有許多創新的初創企業正在上線,為開發AI領域的下一個突破提供新的機會,無論是代理AI、推理AI還是物理AI。“初創企業的數量仍然非常活躍,而且它們每一個都需要相當數量的計算基礎設施。”他說。
英偉達于1月30日宣布,擁有6710億參數的DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版提供。基于Hopper架構(Blackwell的前身),DeepSeek-R1 NIM微服務在單個NVIDIA HGX H200系統上每秒可處理多達3872個令牌。英偉達在周一推出了針對Blackwell的DeepSeek-R1優化,聲稱與四周前的NVIDIA H100相比,其收入可提升25倍,而每令牌的成本卻降低了20倍。
最近的財務結果顯示,英偉達截至1月26日的2025財年第四季度銷售額進一步放緩,但仍超過了華爾街的預期。英偉達的主要業務數據中心收入同比飆升98%,創下356億美元的紀錄。最新一代基于Blackwell架構的AI芯片在交付的第一季度銷售額達到110億美元,超過了公司的預期。首席財務官科萊特·克雷斯表示,Blackwell的銷售由大型云服務提供商主導,約占數據中心收入的50%。
從地理角度來看,克雷斯指出,英偉達數據中心收入的連續增長在美國最為強勁,這得益于Blackwell的初步推廣。她表示,由于美國出口管制的實施,中國數據中心的銷售仍遠低于之前的水平。如果沒有監管政策的變化,英偉達預計對中國的出貨量將保持在當前水平左右,盡管在那里面臨著激烈的競爭。該公司誓言將繼續遵守出口管制規定,同時為中國客戶服務。