近日,人工智能領(lǐng)域知名開源模型DeepSeek再次引發(fā)行業(yè)關(guān)注。其線上服務(wù)已完成版本升級,新版本DeepSeek-V3.1-Terminus已全面覆蓋官方App、網(wǎng)頁端、小程序及API接口。此次更新在保持原有性能的基礎(chǔ)上,重點(diǎn)優(yōu)化了語言輸出一致性和智能體執(zhí)行能力。
技術(shù)團(tuán)隊(duì)針對用戶反饋的典型問題展開專項(xiàng)改進(jìn)。在語言處理層面,新版本顯著減少了中英文混雜輸出和異常字符生成的情況,輸出穩(wěn)定性較前代提升明顯。智能體功能方面,代碼處理和搜索執(zhí)行兩大模塊的性能得到重點(diǎn)強(qiáng)化,特別是在復(fù)雜任務(wù)場景下的表現(xiàn)更加可靠。
回溯該模型的發(fā)展歷程,今年初發(fā)布的DeepSeek-R1曾在全球AI社區(qū)引發(fā)開源熱潮。這款模型在數(shù)學(xué)計(jì)算、編程實(shí)現(xiàn)和自然語言理解等核心領(lǐng)域展現(xiàn)出與國際頂尖模型抗衡的實(shí)力。九月中旬,關(guān)于其推理模型訓(xùn)練方法的研究論文登上國際頂級學(xué)術(shù)期刊《自然》封面,詳細(xì)闡述了通過強(qiáng)化學(xué)習(xí)自主構(gòu)建推理路徑的創(chuàng)新訓(xùn)練范式,這種技術(shù)路徑有效降低了模型訓(xùn)練的復(fù)雜度和資源消耗。
在版本迭代進(jìn)程中,八月下旬推出的DeepSeek-V3.1版本已實(shí)現(xiàn)重大技術(shù)突破。該版本創(chuàng)新性地采用混合推理架構(gòu),支持思考模式與非思考模式的動態(tài)切換,在保持高思考效率的同時(shí),大幅提升了智能體工具調(diào)用和任務(wù)執(zhí)行能力。測試數(shù)據(jù)顯示,新模型在代碼修復(fù)基準(zhǔn)測試SWE-bench中的表現(xiàn)較前代提升顯著,搜索智能體在多學(xué)科復(fù)雜問題處理上也展現(xiàn)出明顯優(yōu)勢。
技術(shù)架構(gòu)方面,DeepSeek-V3.1特別針對國產(chǎn)芯片環(huán)境進(jìn)行了優(yōu)化適配,采用UE8M0 FP8 Scale參數(shù)精度設(shè)計(jì),為即將面市的國產(chǎn)新一代AI芯片提供完美支持。這一技術(shù)布局直接帶動了相關(guān)產(chǎn)業(yè)鏈的市場表現(xiàn),版本發(fā)布當(dāng)日,多家國產(chǎn)芯片企業(yè)股價(jià)出現(xiàn)明顯上漲。
資本市場對此反應(yīng)積極,證券機(jī)構(gòu)分析指出,DeepSeek的技術(shù)演進(jìn)路徑正在重塑國產(chǎn)AI生態(tài)。隨著模型訓(xùn)練與推理需求向國產(chǎn)芯片遷移,將加速形成自主可控的算力基礎(chǔ)設(shè)施。特別是在智能體商業(yè)化領(lǐng)域,V3.1版本展現(xiàn)出的任務(wù)處理能力提升,為金融、醫(yī)療、教育等行業(yè)的智能化轉(zhuǎn)型提供了新的技術(shù)解決方案。