9 月 18 日,華為全聯接大會 2025 在上海盛大開幕。會上,華為技術有限公司與浙江大學聯合發布了國內首個基于昇騰千卡算力平臺的DeepSeek-R1-Safe基礎大模型。在中國工程院院士陳純、華為昇騰計算業務總裁張迪煊的見證下,浙江大學計算機科學與技術學院院長、區塊鏈與數據安全全國重點實驗室常務副主任任奎攜手華為公司Fellow、計算架構與設計部部長蔣銘共同完成DeepSeek-R1-Safe基礎大模型發布儀式。出席儀式現場的還有浙江大學網絡空間安全學院副院長秦湛、華為計算技術開發部部長楊寶川和計算高校科研與人才生態發展部部長崔玫芳,同時多位浙江大學“百人計劃”研究員出席活動。

(發布儀式)
陳純院士對DeepSeek-R1-Safe基礎大模型發布表示祝賀,感謝華為長期支持。他指出,浙江大學計算機學院已組建起一支涵蓋多位海內外優秀青年人才的科研團隊,并已成功依托昇騰生態,實現了自主全流程后訓練框架,完成了國內首次千卡集群大模型安全訓練。這次DeepSeek-R1-Safe的發布旨在打造安全可信的示范應用,推動大模型安全能力與產業生態協同發展。他表示希望團隊未來與華為展開更深入合作,共同推動我國 AI 技術進步。

中國工程院院士 陳純
張迪煊表示,自2019年以來,華為在應對外部環境變化的過程中持續加大研發投入,突破多項關鍵核心技術,在硬件與產業生態建設方面取得了一系列成果。在華為全聯接大會2025上,華為也正式推出了昇騰新一代AI硬件與全系列軟件開源開放戰略,覆蓋編譯器、運行時驅動等核心組件,致力于通過深度開放協作,聯合高校與產業伙伴共同推動基礎軟件創新與AI安全能力建設。他強調,華為堅信,與浙江大學的緊密合作將有助于進一步增強源頭創新能力,共同筑牢安全、可信、有競爭力的AI產業生態,為我國人工智能的高質量發展保駕護航。

華為昇騰計算業務總裁 張迪煊
隨后,任奎詳細介紹了DeepSeek-R1-Safe-671B基礎大模型的核心創新。研發團隊從底層入手,構建了一套覆蓋“高質量安全語料—平衡優化的安全訓練—全鏈路自主創新軟硬件平臺”的全流程安全后訓練框架。在算力平臺搭建方面,團隊首次實現基于昇騰千卡算力平臺的千億級參數滿血版大模型安全訓練,系統性地解決了訓練環境中的關鍵問題,構建了服務器間環境依賴同步、數據與權重共享、協同訓練推理等一系列開發工具。目前,模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope 等多個社區全面開源。測試結果表明,DeepSeek-R1-Safe針對有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題整體防御成功率近100%,針對情境假設、角色扮演、加密編碼等多個越獄模式整體防御成功率超過40%。其綜合安全防御能力達83%,在同樣測試設置下超過Qwen-235B和DeepSeek-R1-671B等多個同期模型8%至15%。此外,在MMLU、GSM8K、Ceval等通用能力基準測試中,DeepSeek-R1-Safe相比于DeepSeek-R1的性能損耗在1% 以內。這些結果表明 DeepSeek-R1-Safe不僅顯著提升了安全防護能力,也保障了模型的可用性,達成了安全能力與通用性能之間的有效平衡。

浙江大學計算機科學與技術學院院長、區塊鏈與數據安全全國重點實驗室常務副主任
任奎
隨后的交流討論中,全場與會嘉賓圍繞“AI安全治理框架構建”“自主創新生態開發者培育”“校企協同創新機制優化”等話題展開深入探討,一致認為該成果為我國突破AI安全技術壁壘、構建自主的智能生態提供了重要支撐。
據悉,浙江大學鯤鵬昇騰科教創新卓越中心自成立以來,始終聚焦“人才培養、系統架構創新和賦能交叉學科”三大核心任務,通過算力資助及專家支持,舉辦特訓營、研討會和專業競賽,已形成“產教融合、科教融匯”的創新模式。此次DeepSeek-R1-Safe基礎大模型的發布,正是卓越中心模式下的重要成果。未來,雙方將繼續深化合作,在多模態安全模型研發、AI安全測評標準制定等領域持續攻關,為我國人工智能高質量發展提供堅實基礎。