近期,據(jù)國際媒體報(bào)道,英偉達(dá)H20芯片在中國內(nèi)地的供應(yīng)問題對DeepSeek-R2 AI模型的研發(fā)進(jìn)程產(chǎn)生了連鎖反應(yīng)。據(jù)悉,這一短缺現(xiàn)象源于美國當(dāng)局的策略調(diào)整,直接影響了DeepSeek團(tuán)隊(duì)的技術(shù)開發(fā)進(jìn)度。
DeepSeek在構(gòu)建其R1模型時(shí),曾動(dòng)用了大量高性能GPU,其中H20芯片占據(jù)了顯著位置。具體來說,為了訓(xùn)練R1模型,DeepSeek共使用了5萬塊Hopper GPU,包括3萬塊H20、1萬塊H800和1萬塊H100,而這些顯卡的采購工作均由其投資方高毅資產(chǎn)負(fù)責(zé)完成。
據(jù)兩位內(nèi)部人士透露,DeepSeek團(tuán)隊(duì)近期一直在緊鑼密鼓地推進(jìn)R2模型的研發(fā)工作。然而,盡管付出了巨大努力,CEO梁文鋒對當(dāng)前模型的表現(xiàn)仍持保留態(tài)度,認(rèn)為性能仍有提升空間。因此,R2模型尚未達(dá)到正式投入使用的標(biāo)準(zhǔn)。
報(bào)道還指出,當(dāng)前多數(shù)用戶都在依賴英偉達(dá)的H20芯片來部署和運(yùn)行DeepSeek-R1模型。然而,隨著H20芯片受到美國出口限制的影響,DeepSeek R2的研發(fā)工作面臨了更大的挑戰(zhàn)。同時(shí),這一限制措施也對現(xiàn)有DeepSeek-R1模型的實(shí)際應(yīng)用造成了一定程度的困擾。