國(guó)際權(quán)威學(xué)術(shù)期刊《自然》最新一期(第645期)封面文章,聚焦中國(guó)團(tuán)隊(duì)在大語(yǔ)言模型領(lǐng)域的突破性進(jìn)展。由梁文鋒擔(dān)任通訊作者的DeepSeek團(tuán)隊(duì),通過純強(qiáng)化學(xué)習(xí)路徑顯著提升模型推理能力的研究成果,引發(fā)全球科技界關(guān)注。該研究證實(shí),無需依賴大規(guī)模人工標(biāo)注數(shù)據(jù),模型即可在數(shù)學(xué)解題、編程競(jìng)賽等復(fù)雜任務(wù)中達(dá)到研究生水平表現(xiàn)。
研究團(tuán)隊(duì)創(chuàng)新性采用"無監(jiān)督冷啟動(dòng)"策略,摒棄傳統(tǒng)監(jiān)督微調(diào)(SFT)方法,轉(zhuǎn)而通過大規(guī)模強(qiáng)化學(xué)習(xí)(RL)實(shí)現(xiàn)模型進(jìn)化。實(shí)驗(yàn)數(shù)據(jù)顯示,DeepSeek-R1在解決數(shù)學(xué)難題時(shí),能自動(dòng)生成結(jié)構(gòu)化推理鏈,并通過問題解決質(zhì)量獲得動(dòng)態(tài)獎(jiǎng)勵(lì)反饋。這種機(jī)制使模型學(xué)會(huì)優(yōu)化思考路徑,例如在DeepSeek-R1-Zero版本中,觀察到模型主動(dòng)調(diào)整思考時(shí)間分配策略,展現(xiàn)出類似人類的認(rèn)知靈活性。
針對(duì)早期外界關(guān)于"模型蒸餾"技術(shù)的質(zhì)疑,研究團(tuán)隊(duì)在論文中詳細(xì)披露技術(shù)路徑。通過對(duì)比實(shí)驗(yàn)證明,純強(qiáng)化學(xué)習(xí)訓(xùn)練的模型在STEM領(lǐng)域表現(xiàn)超越傳統(tǒng)方法,且人類標(biāo)注工作量減少達(dá)70%。這種技術(shù)突破為降低大模型訓(xùn)練成本提供了新思路,特別在專業(yè)領(lǐng)域知識(shí)獲取方面具有顯著優(yōu)勢(shì)。
在模型迭代方面,DeepSeek團(tuán)隊(duì)保持快速推進(jìn)節(jié)奏。繼年初開源模型引發(fā)行業(yè)震動(dòng)后,8月推出的V3.1版本實(shí)現(xiàn)三大技術(shù)升級(jí):混合推理架構(gòu)支持即時(shí)響應(yīng)與深度思考雙模式、思考效率較前代提升40%、智能體工具調(diào)用能力增強(qiáng)25%。值得關(guān)注的是,該版本專門針對(duì)國(guó)產(chǎn)芯片架構(gòu)優(yōu)化參數(shù)精度,采用UE8M0 FP8 Scale技術(shù),直接帶動(dòng)相關(guān)芯片產(chǎn)業(yè)鏈股價(jià)單日上漲超5%。
資本市場(chǎng)對(duì)AI技術(shù)突破反應(yīng)熱烈。Choice數(shù)據(jù)顯示,科創(chuàng)人工智能ETF華夏單日漲幅達(dá)3.8%,東財(cái)人工智能指數(shù)收漲2.43%。資金流向監(jiān)測(cè)顯示,9月以來超過400億元科創(chuàng)債ETF完成發(fā)行,其中13只產(chǎn)品規(guī)模突破29億元。私募機(jī)構(gòu)參與定增數(shù)據(jù)顯示,電子板塊獲配金額達(dá)10.98億元,占全年定增總額的27.7%,顯示機(jī)構(gòu)對(duì)AI硬件基礎(chǔ)設(shè)施的持續(xù)看好。
主流投資機(jī)構(gòu)普遍認(rèn)為,AI產(chǎn)業(yè)鏈已進(jìn)入規(guī)模化落地階段。望正資產(chǎn)指出,商業(yè)模式成熟、具備盈利增長(zhǎng)潛力的AI算力與應(yīng)用企業(yè)將成為重點(diǎn)布局方向。淡水泉投資則強(qiáng)調(diào),在AI科技、創(chuàng)新藥等新興領(lǐng)域,具有持續(xù)業(yè)績(jī)表現(xiàn)的行業(yè)龍頭將持續(xù)獲得資金青睞。這種技術(shù)突破與資本投入的良性互動(dòng),正在重塑中國(guó)科技產(chǎn)業(yè)的競(jìng)爭(zhēng)格局。











