近期,據(jù)國際媒體報(bào)道,英偉達(dá)H20芯片在中國大陸遭遇供應(yīng)困境,這一變化直接影響到DeepSeek公司AI模型開發(fā)的進(jìn)展。據(jù)悉,由于美國相關(guān)政策的限制,DeepSeek-R2模型的研發(fā)工作被迫推遲。
DeepSeek在訓(xùn)練其R1模型時(shí),曾大量使用了Hopper系列GPU,具體包括3萬塊H20芯片、1萬塊H800芯片以及1萬塊H100芯片。這些高性能顯卡均由其投資伙伴高毅資產(chǎn)負(fù)責(zé)采購。特別是H20芯片,在DeepSeek的技術(shù)架構(gòu)中占據(jù)了重要地位。
據(jù)透露,DeepSeek團(tuán)隊(duì)近期正全力推進(jìn)R2模型的研發(fā)工作,但公司CEO梁文鋒對目前的模型性能仍持保留態(tài)度。因此,內(nèi)部團(tuán)隊(duì)仍在持續(xù)優(yōu)化與提升,尚未達(dá)到正式應(yīng)用的標(biāo)準(zhǔn)。
不僅如此,H20芯片的供應(yīng)短缺還波及到了DeepSeek-R1模型的現(xiàn)有部署。眾多用戶習(xí)慣于在H20芯片上運(yùn)行該模型,但隨著出口限制的實(shí)施,不僅給DeepSeek R2的研發(fā)帶來了額外挑戰(zhàn),也對現(xiàn)有模型的廣泛應(yīng)用造成了不利影響。