在華為全聯接大會2025期間,華為技術有限公司與浙江大學共同宣布推出國內首款基于昇騰千卡算力平臺的DeepSeek-R1-Safe基礎大模型。該成果由浙江大學計算機科學與技術學院主導研發,其核心創新在于構建了覆蓋安全語料構建、訓練優化到軟硬件協同的全流程安全后訓練體系。
項目負責人、浙江大學計算機學院院長任奎教授介紹,研發團隊從底層架構突破,首次在昇騰千卡集群上實現千億參數大模型的完整安全訓練。通過開發服務器環境同步、數據權重共享等工具鏈,系統性解決了大規模訓練中的環境依賴難題,為模型安全能力提供了硬件級支撐。
安全性能測試顯示,該模型在14類常規有害內容(包括敏感言論、違法誘導等)防御中實現近100%的攔截率,在角色扮演、加密混淆等復雜越獄場景下防御成功率超過40%,綜合安全指標達83%。相較于同期Qwen-235B和DeepSeek-R1-671B模型,其安全優勢提升8%-15%,同時保持通用能力損耗在1%以內,在MMLU等基準測試中與原始模型性能持平。
中國工程院院士陳純特別指出,浙大團隊依托昇騰生態構建的自主訓練框架具有產業示范意義。該成果不僅驗證了國產算力平臺承載大規模安全訓練的可行性,更為AI產業安全發展提供了可復制的技術路徑。他透露,研究團隊已形成由多位海外引進人才領銜的創新梯隊,未來將深化與華為的產學研合作。
華為昇騰計算業務總裁張迪煊在發布現場宣布,伴隨新模型推出,昇騰將全面開放編譯器、驅動等核心軟件組件,通過開源生態建設推動AI安全技術共研。目前DeepSeek-R1-Safe已在ModelZoo、GitCode、Gitee等平臺開源,其中Gitee項目地址為https://gitee.com/ZJUsafe/deep-seek-r1-safe,GitHub地址為https://github.com/ZJUAISafety/DeepSeek-R1-Safe。