在華為全聯接大會2025期間,華為技術有限公司與浙江大學聯合宣布推出國內首個基于昇騰千卡算力平臺的DeepSeek-R1-Safe基礎大模型。這款模型通過構建全流程安全后訓練框架,實現了安全防護能力與通用性能的雙重突破,標志著我國在AI安全領域邁出關鍵一步。
浙江大學計算機科學與技術學院院長任奎透露,研發團隊從底層架構入手,創新性地設計了覆蓋"高質量安全語料構建-平衡優化安全訓練-全鏈路自主軟硬件平臺"的三階段安全體系。該框架首次在昇騰千卡集群上完成千億級參數大模型的安全訓練,開發出服務器環境同步、數據權重共享等協同工具,系統性解決了訓練環境中的關鍵技術難題。
測試數據顯示,DeepSeek-R1-Safe在14類常規有害內容防御中成功率接近100%,針對情境假設、角色扮演等復雜越獄模式的防御成功率超過40%,綜合安全防御能力達83%。相較于同期Qwen-235B和DeepSeek-R1-671B模型,其安全性能提升8%-15%,同時保持通用能力損耗在1%以內,在MMLU、GSM8K等基準測試中展現出優異表現。
中國工程院院士陳純特別指出,浙江大學已組建由海內外青年專家構成的科研團隊,依托昇騰生態完成國內首次千卡集群大模型安全訓練。此次發布的DeepSeek-R1-Safe不僅具備示范應用價值,更將推動AI安全技術與產業生態的深度融合。他期待校企雙方在后續研發中開展更緊密合作,共同提升我國AI技術核心競爭力。
華為昇騰計算業務總裁張迪煊在發布會上宣布,華為同步推出新一代AI硬件及全系列軟件開源戰略,涵蓋編譯器、運行時驅動等核心組件。通過深度開放協作模式,華為將與高校、產業伙伴共同推進基礎軟件創新和AI安全能力建設,為行業提供更可靠的技術支撐。
據悉,DeepSeek-R1-Safe模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等多個開源社區全面開放。這一舉措將加速安全可信AI技術的普及應用,為構建健康發展的AI產業生態奠定基礎。