滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

DeepSeek R1模型升級，思維深度躍升，幻覺率大幅下降！

時間：2025-05-30 11:47:24 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

DeepSeek公司近期宣布，其DeepSeek R1模型已經完成了新一輪的小版本升級，新版本命名為DeepSeek-R1-0528。此次升級不僅引起了業界的廣泛關注，還帶來了多項能力的提升。

據了解，在28日晚上，DeepSeek通過官方渠道突然發布消息，稱DeepSeek R1模型的小版本試升級已經完成，并邀請用戶前往官方網站、App及小程序進行測試。這一消息迅速在行業內傳播開來，引發了眾多用戶的試用熱潮。

與此同時，TechWeb也對新版DeepSeek-R1模型進行了親測和用戶試用體驗的報道，指出新版模型在代碼能力方面表現出色，但在寫作幻覺方面仍有待改進。報道還提供了詳細的測試鏈接，供讀者進一步了解。

DeepSeek官方對DeepSeek-R1-0528的能力進行了詳細介紹。新版本依然基于2024年12月發布的DeepSeek V3 Base模型，但在后訓練過程中增加了更多的算力投入，使得模型的思維深度和推理能力得到了顯著提升。

據官方透露，更新后的R1模型在數學、編程及通用邏輯等多個基準測評中取得了優異成績，整體表現已接近國際頂尖模型，如o3和Gemini-2.5-Pro。特別是在AIME 2025測試中，新版模型的準確率從舊版的70%提升至87.5%，這一進步得益于模型在推理過程中思維深度的增強。

DeepSeek團隊還利用DeepSeek-R1-0528的思維鏈后訓練了Qwen3-8B Base，得到了DeepSeek-R1-0528-Qwen3-8B。該8B模型在數學測試AIME 2024中的表現僅次于DeepSeek-R1-0528，超越了Qwen3-8B，與Qwen3-235B相當。DeepSeek團隊認為，這一思維鏈對于學術界推理模型的研究和工業界小模型的開發都具有重要意義。

除了推理能力的提升，新版DeepSeek R1還在其他方面進行了優化。針對“幻覺”問題，新版模型在改寫潤色、總結摘要、閱讀理解等場景中，幻覺率降低了約45%～50%，能夠提供更準確、可靠的結果。同時，在創意寫作方面，新版模型能夠輸出篇幅更長、結構內容更完整的長篇作品，寫作風格也更加貼近人類偏好。

在工具調用方面，DeepSeek-R1-0528支持工具調用，但暫不支持在思考過程中進行工具調用。當前模型的Tau-Bench測評成績與OpenAI o1-high相當，但與o3-High及Claude 4 Sonnet仍有差距。新版R1在前端代碼生成、角色扮演等領域的能力也有所提升。

API方面，新版R1 API已同步更新，接口與調用方式保持不變。同時，新版API增加了Function Calling和JsonOutput的支持，并對max_tokens參數的含義進行了調整。現在，max_tokens用于限制模型單次輸出的總長度（包括思考過程），默認為32K，最大為64K。API用戶需及時調整max_tokens參數，以防輸出被提前截斷。

雖然官方網站、小程序、App端和API中的模型上下文長度仍為64K，但用戶如有更長上下文長度的需求，可通過第三方平臺調用上下文長度為128K的開源版本R1-0528模型。

在模型開源方面，DeepSeek-R1-0528與之前的DeepSeek-R1使用相同的base模型，僅改進了后訓練方法。私有化部署時，用戶只需更新checkpoint和tokenizer_config.json（tool calls相關變動）。模型參數為685B（其中14B為MTP層），開源版本上下文長度為128K（網頁端、App和API提供64K上下文）。

此次開源倉庫（包括模型權重）依然采用MIT License，并允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

華為MWC上海峰會：共謀移動AI發展，“以網興智”GSMA Foundry正式成立

（全球TMT2025年6月27日訊）在2025 MWC上海期間，華為舉辦“移動AI基礎網峰會”。會議達成兩項共識：一是增強上行體驗是移動AI發展的剛需；二是網業協同是移動AI體驗變現的根基。此外，“以網興智”…

06-28

負極材料賽道黑馬逆勢崛起，出貨量增50%卻面臨資金挑戰

06-28

Cyngn攜手英偉達，自動駕駛技術升級，股價連續兩日飆升

06-28

2025款紅旗H6上市：5款配置售17.98-23.98萬，享至高8000元置換補貼

06-28

曼恩商用車大中華區換帥：歐安德接任，哈特回歸德國主導二手車業務

06-28

5G-A通感一體技術測評白皮書發布：構建體系，推動產業化進程

白皮書系統梳理技術原理與典型應用，構建覆蓋實驗室與外場的測評框架。實驗室測試系統以通感基站樣機與無線感知測試儀為核心，可精準控制環境變量，模擬多場景驗證性能；外場測試更貼近真實場景，分單站/單簇技術驗證與規…

06-28

微軟自研AI芯片Maia 100升級版延期至2026年發布

換句話說，這兩款芯片專為微軟的云基礎設施和大語言模型訓練而設計，由微軟內部團隊精心研發，并針對整個云服務器堆棧進行了深度優化，旨在實現性能、功耗與成本的最優平衡。微軟若想在市場中占據優勢，下一代Maia …

06-28

小米AI眼鏡熱潮背后：晶振——不可或缺的隱藏英雄

根據AI眼鏡的功能復雜度和功耗設計需求，晶振選型也呈現多樣化：晶振為AI眼鏡提供穩定、低功耗、抗干擾的時鐘支持，在硬件系統中屬于關鍵支撐器件。未來，晶振產品將繼續朝著更小型、更節能、更高穩定性的方向發展，…

06-28

守護城市供水“最后一公里”：二次供水水質智能監測新方案

二次供水水質監測設備通過實時、連續的在線監測，為供水系統末端水質管理提供可靠的技術保障，確保居民用水安全穩定。隨著物聯網、大數據等技術的發展，水質監測將在智慧水務建設中發揮更加重要的作用，為城市供水安全提供堅…

06-28

八口光纖收發器：構建高效網絡的必備神器

通常指的是一種具備8個端口的光纖傳輸設備，主要用于實現不同網絡介質（如光纖與銅纜）之間的信號轉換和傳輸。企業網絡：在企業網絡中，可用于連接不同樓層的交換機或路由器，實現網絡的高速擴展和互聯。明確需求：在選…

06-28

高效管理網絡行為：監視上網軟件核心功能全解析

通過分析用戶的上網行為數據，軟件能夠生成詳細的時間畫像。這幅畫像以圖表形式展現用戶在不同時間段的活動情況，有助于發現不良作息習慣，優化時間管理。在選擇時，建議根據自己的實際需求，綜合考慮軟件的功能、易用性…

06-28

星星充電江蘇新設科技公司，注冊資本高達1億元！

06-28

蔡瀾內地商業版圖曝光：關聯企業超90家！

06-28

天齊鋰業布局新領域，四川甘孜礦業公司正式成立

06-28

中廣核河北布局新能源，新公司注冊資本高達3億！

06-28

點擊查看更多 +

全站最新

開普勒機器人完成A輪融資，引入三家A股企業強化人形機器人產業鏈協同

廣東發布“機器人+”應用場景，覆蓋11大領域助力產業升級

海爾周云杰論道智慧家居互聯，與小米雷軍私下交流方向明確

華鼎冷鏈雪豹大模型引領冷鏈智能化升級，重塑行業生態

iQOO小屏旗艦新機來襲：驍龍8E2處理器，6.3英寸直屏，預計明年上半年發布

星閃技術引領短距無線連接新紀元，鴻蒙6攜手共創全場景智能生態

熱門內容

本欄最新

華為MWC上海峰會：共謀移動AI發展，“以網興智”GSMA Foundry正式成立

負極材料賽道黑馬逆勢崛起，出貨量增50%卻面臨資金挑戰

Cyngn攜手英偉達，自動駕駛技術升級，股價連續兩日飆升

2025款紅旗H6上市：5款配置售17.98-23.98萬，享至高8000元置換補貼

曼恩商用車大中華區換帥：歐安德接任，哈特回歸德國主導二手車業務

5G-A通感一體技術測評白皮書發布：構建體系，推動產業化進程

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

DeepSeek R1模型升級，思維深度躍升，幻覺率大幅下降！

日本精品一区二区三区高清久久