人工智能領(lǐng)域迎來(lái)重要進(jìn)展,DeepSeek團(tuán)隊(duì)宣布推出新一代模型DeepSeek-V3.1-Terminus。該版本在繼承前代優(yōu)勢(shì)的基礎(chǔ)上,針對(duì)用戶反饋的核心問(wèn)題展開(kāi)專項(xiàng)優(yōu)化,特別是在編程場(chǎng)景下的輸出穩(wěn)定性方面取得突破性進(jìn)展。
此次升級(jí)最受關(guān)注的改進(jìn)是解決了此前版本中隨機(jī)插入"極"字的異常現(xiàn)象。測(cè)試顯示,在涉及time.Second等關(guān)鍵編程元素的輸出中,新模型能夠準(zhǔn)確保持代碼結(jié)構(gòu)完整性,未出現(xiàn)字符異常替換的情況。這項(xiàng)修復(fù)直接回應(yīng)了開(kāi)發(fā)者社區(qū)對(duì)模型實(shí)用性的核心訴求,為代碼生成等場(chǎng)景掃清了關(guān)鍵障礙。
在語(yǔ)言處理能力方面,研發(fā)團(tuán)隊(duì)通過(guò)算法優(yōu)化顯著降低了中英文混雜出現(xiàn)的頻率。對(duì)比測(cè)試表明,新版本在專業(yè)文檔生成場(chǎng)景下的語(yǔ)言一致性提升達(dá)47%,特別是在技術(shù)文檔、學(xué)術(shù)論文等需要精準(zhǔn)表達(dá)的領(lǐng)域表現(xiàn)突出。不過(guò)開(kāi)發(fā)團(tuán)隊(duì)坦言,完全消除語(yǔ)言混合現(xiàn)象仍是長(zhǎng)期技術(shù)挑戰(zhàn)。
智能體(Agent)能力成為本次升級(jí)的另一大亮點(diǎn)。在工具調(diào)用測(cè)試中,BrowseComp指標(biāo)從30.0提升至38.5,SimpleQA準(zhǔn)確率達(dá)到96.8%,均創(chuàng)下同類模型新高。特別在多語(yǔ)言軟件工程基準(zhǔn)測(cè)試(SWE-bench Multilingual)中,57.8分的成績(jī)較前代提升3.3個(gè)百分點(diǎn),展現(xiàn)出更強(qiáng)的跨語(yǔ)言開(kāi)發(fā)支持能力。
基準(zhǔn)測(cè)試數(shù)據(jù)顯示,新模型在Humanity's Last Exam評(píng)測(cè)中取得36.48%的顯著提升,這項(xiàng)針對(duì)復(fù)雜推理能力的考核結(jié)果,直接反映了模型在邏輯鏈條構(gòu)建方面的進(jìn)步。值得注意的是,LiveCodeBench實(shí)時(shí)編碼測(cè)試顯示,新版本在算法實(shí)現(xiàn)效率上已超越Gemini 2.5 Pro等競(jìng)品。
雖然部分專項(xiàng)測(cè)試出現(xiàn)小幅波動(dòng),如Codeforces競(jìng)賽級(jí)編程測(cè)試下降1.2%,但整體性能曲線呈現(xiàn)明確上升趨勢(shì)。開(kāi)發(fā)團(tuán)隊(duì)特別強(qiáng)調(diào),Terminal-bench終端操作測(cè)試35.7分的成績(jī),證明模型在系統(tǒng)級(jí)交互方面的可靠性得到實(shí)質(zhì)性增強(qiáng)。
技術(shù)社區(qū)對(duì)版本命名展開(kāi)熱烈討論,"Terminus"在計(jì)算機(jī)術(shù)語(yǔ)中特指終端設(shè)備,暗示模型在交互末端的技術(shù)突破。有開(kāi)發(fā)者推測(cè),這可能預(yù)示著更高級(jí)的智能體架構(gòu)正在研發(fā)中,甚至可能與傳聞中的DeepSeek-V4存在技術(shù)關(guān)聯(lián)。
目前用戶可通過(guò)Hugging Face和ModelScope平臺(tái)獲取開(kāi)源版本,官方App及API服務(wù)也已完成同步更新。測(cè)試反饋顯示,新模型在金融分析、科研文獻(xiàn)處理等垂直領(lǐng)域的表現(xiàn)獲得專業(yè)用戶認(rèn)可,代碼審查等場(chǎng)景的誤報(bào)率降低至前代的63%。
開(kāi)發(fā)團(tuán)隊(duì)在技術(shù)文檔中透露,本次升級(jí)采用動(dòng)態(tài)注意力優(yōu)化機(jī)制,通過(guò)強(qiáng)化特定場(chǎng)景下的參數(shù)調(diào)整效率實(shí)現(xiàn)性能躍升。這種技術(shù)路徑的選擇,既保持了模型架構(gòu)的穩(wěn)定性,又為后續(xù)功能擴(kuò)展預(yù)留了技術(shù)空間。
隨著新版模型投入實(shí)際應(yīng)用,開(kāi)發(fā)者社區(qū)開(kāi)始期待下一代產(chǎn)品的技術(shù)突破。有分析人士指出,從版本迭代節(jié)奏判斷,DeepSeek團(tuán)隊(duì)可能正在籌備具有劃時(shí)代意義的重大升級(jí),智能體技術(shù)的商業(yè)化應(yīng)用或?qū)⒂瓉?lái)關(guān)鍵轉(zhuǎn)折點(diǎn)。