近日,DeepSeek在其官方交流渠道宣布,其R1模型已經(jīng)完成了小版本的迭代升級,并邀請用戶通過官方網(wǎng)站、App及小程序進行測試,同時確認API接口及使用方法維持原樣,未做變動。
此次升級后的R1模型,DeepSeek團隊已在Hugging Face開發(fā)者平臺上架了新版本(命名為DeepSeek-R1-0528),參數(shù)規(guī)模從原先的671B增加至685B。值得注意的是,Hugging Face平臺上的存儲庫僅包含了模型的配置文件及權重,而缺少了模型的詳細描述。
盡管DeepSeek官方未透露此次升級的具體細節(jié),但新版本App的更新說明中簡要提及了“修復部分已知問題”。然而,這并未阻擋用戶們對新版本的熱情探索。
眾多用戶在第一時間體驗了升級后的R1模型,并反饋稱其在思維鏈(CoT)方面的表現(xiàn)有了顯著提升,能夠持續(xù)進行長達30至60分鐘的深度思考,且響應速度更快。特別是在代碼生成能力上,用戶們普遍認為DeepSeek R1已經(jīng)躍升至國際領先水平,能夠一次性生成可運行且結構清晰的代碼,甚至在某些方面與Claude 4模型相媲美。
相較于Claude模型,DeepSeek R1的調(diào)用成本更為親民,僅為前者的三分之一,這對于中小開發(fā)者而言無疑是個好消息。使用DeepSeek R1無需翻墻,本地服務器響應穩(wěn)定,極大地簡化了網(wǎng)絡配置過程。
用戶們紛紛展示了使用新版本R1模型完成的各種任務,包括制作天氣卡片、設計世界時鐘面板等,均取得了令人滿意的成果。TechWeb也嘗試了請DeepSeek R1設計一個“端午節(jié)賽龍舟小游戲”,結果令人驚喜,短短兩分鐘內(nèi)便完成了游戲設計。
然而,盡管DeepSeek R1在深度思考和代碼生成方面表現(xiàn)出色,但在寫作方面仍存在一些問題,尤其是AI幻覺現(xiàn)象依舊不容忽視。有用戶在撰寫論文時發(fā)現(xiàn),盡管模型能夠基于真實材料進行分析,并標注引用源,但仍會捏造數(shù)據(jù),導致信息失真。
例如,有用戶在使用新版本R1時發(fā)現(xiàn),盡管信息源明確標注了論文的發(fā)表年份為2024年,但在信息整理過程中卻被錯誤地標注為“2025年”。這可能是由于提示詞對AI產(chǎn)生了誤導,使其傾向于迎合用戶期望,即使這與參考資料相悖。
因此,盡管DeepSeek R1的升級為程序員們帶來了福音,但碼字人員在使用時仍需謹慎核查AI生成的內(nèi)容,以免被其一本正經(jīng)的胡說八道所誤導。