近日,DeepSeek官方宣布其線上版本模型已成功升級(jí)至DeepSeek V3.1,此次升級(jí)的一大亮點(diǎn)是上下文窗口從原先的64k擴(kuò)展到了128k,用戶現(xiàn)在可以在網(wǎng)頁(yè)、App以及小程序中體驗(yàn)到這一新版模型。
值得注意的是,DeepSeek在App和網(wǎng)頁(yè)端的界面上也做了一些調(diào)整,將原先的“深度思考(R1)”字樣簡(jiǎn)化為“深度思考”。這一變化引發(fā)了網(wǎng)友們的猜測(cè),認(rèn)為這是DeepSeek可能正在融合推理模型與非推理模型的信號(hào)。然而,截至目前,DeepSeek官方尚未就此發(fā)表任何正式聲明。
新版與舊版界面的對(duì)比圖顯示,左側(cè)為舊版頁(yè)面,右側(cè)則是新版頁(yè)面,變化一目了然。
DeepSeek V3.1模型已經(jīng)上傳至Hugging Face平臺(tái),目前開源的是未經(jīng)指令微調(diào)的Base版本,包括配置文件、腳本代碼和模型權(quán)重等均可供用戶下載。與之前的DeepSeek-V3-0324版本相比,新模型的參數(shù)量和張量類型并未發(fā)生顯著變化。
在實(shí)際體驗(yàn)中,DeepSeek V3.1在多個(gè)方面展現(xiàn)出了能力的提升。例如,在編程領(lǐng)域,尤其是前端開發(fā)方面,新模型能夠生成更長(zhǎng)、更復(fù)雜的代碼,并且在美觀性和完成度上也有了顯著提升。當(dāng)要求設(shè)計(jì)一個(gè)具有科技感的個(gè)人博客網(wǎng)站時(shí),DeepSeek V3.1不僅提供了更為豐富的網(wǎng)站欄目規(guī)劃,還加入了圖片等元素,使得整個(gè)網(wǎng)頁(yè)的布局更為合理,重點(diǎn)更為突出。
DeepSeek V3.1在小游戲開發(fā)方面也表現(xiàn)出了一定的實(shí)力。盡管在復(fù)現(xiàn)Chrome瀏覽器斷網(wǎng)時(shí)的小恐龍游戲時(shí),新模型打造的小恐龍外觀并未完全還原,且游戲可玩性有待提高,但從頁(yè)面的畫風(fēng)和游戲規(guī)則來看,這一小游戲已經(jīng)與原版頗為相似。
在回答小眾歷史問題時(shí),DeepSeek V3.1也展現(xiàn)出了其嚴(yán)謹(jǐn)性。當(dāng)被問及“布須曼人喝牛奶嗎”這一涉及非洲南部少數(shù)民族的問題時(shí),新模型不僅提供了更為詳細(xì)的信息,而且在經(jīng)過事實(shí)核查后,這些細(xì)節(jié)也基本得到了印證,避免了胡編亂造的情況。
在回答關(guān)于馬斯克和OpenAI CEO Sam Altman誰更牛的問題時(shí),DeepSeek V3.1雖然認(rèn)為馬斯克更牛,但也給Altman送上了一番夸贊,避免了非黑即白的結(jié)論,顯得更為客觀和中立。
在詩(shī)歌創(chuàng)作方面,DeepSeek V3.1依然保持著其獨(dú)特的風(fēng)格,充滿了各種比喻和類比,讓人耳目一新。而在數(shù)學(xué)能力上,盡管新模型在解答基礎(chǔ)算術(shù)題時(shí)過程有些曲折,但最終還是給出了正確答案,展現(xiàn)出了其強(qiáng)大的計(jì)算能力。
DeepSeek V3.1的上線也引發(fā)了網(wǎng)友們的熱議。有AI博主表示,新模型打造的小球跳動(dòng)效果更加符合物理定律,且提供了重力、摩擦、旋轉(zhuǎn)速度、彈跳等可調(diào)整的參數(shù),使得效果更為逼真。還有網(wǎng)友讓DeepSeek V3.1為自己打造了一幅自畫像,雖然畫風(fēng)獨(dú)特,但也別有一番風(fēng)味。