中國圖象圖形學學會(CSIG)近日揭曉2025年度科學技術獎評選結果,由網易(杭州)網絡有限公司聯合天津大學、中國科學技術大學及中國航天科工集團第四研究院十七所共同研發的《基于強化學習的智能決策關鍵技術及應用》項目,榮獲“科技進步獎一等獎”。這一成果標志著產學研協同創新在數字技術領域的又一次突破,也為數字文娛產業的跨界融合提供了新范式。
作為圖像圖形學領域的國家級權威組織,CSIG的獎項評選向來以嚴格著稱。該學科通過賦予計算機“視覺理解”與“動態描繪”能力,支撐著從人臉識別到航天導航、從智能醫療到國防裝備的廣泛應用。此次獲獎項目聚焦強化學習技術的三大核心難題——獎勵信號質量不足、經驗復用效率低下、環境適應性差,提出了三項突破性解決方案:通過時空分解優化獎勵生成機制,利用自監督學習提升經驗表征能力,并結合演化算法與強化學習構建策略優化模型。這些技術使系統在策略性能、學習速度和跨場景泛化能力上達到國際領先水平。
項目團隊基于技術創新搭建的智能決策平臺,已在多個關鍵領域實現規模化應用。在工業領域,該平臺助力海思完成14納米工藝全鏈條EDA工具國產化替代,打破國外技術壟斷;在國防軍事方面,支撐完成多項智能化任務系統開發;在文娛產業,則與網易旗下《逆水寒》等游戲深度結合,實現強化學習技術在大型商業游戲中的首次自動化測試應用。平臺還為華為天籌求解器提供核心技術支持,使其性能超越國際標桿產品Gurobi,彰顯中國自主技術的競爭力。
以《逆水寒》手游為例,網易伏羲實驗室將智能捏臉、角色生成、群演調度等AI技術嵌入游戲生態,推出“劇組模式”功能。玩家可自由擔任導演、編劇角色,通過自然語言指令生成劇情腳本,利用AI工具快速制作動畫短片。這一創新使數百萬普通玩家從內容消費者轉變為創作者,形成“人人可創作”的數字文娛新生態。在2024年云棲大會上,該模式作為AI賦能內容生產的典型案例,引發行業廣泛關注。
項目技術負責人表示,游戲場景因其復雜多變的交互特性,成為前沿技術驗證的理想試驗場。通過將強化學習與圖形渲染、自然語言處理等技術融合,團隊不僅提升了游戲AI的決策能力,更探索出一條“以虛促實”的技術轉化路徑。目前,相關成果已延伸至生命健康、智慧城市等領域,例如通過模擬生物系統行為優化藥物研發流程,利用虛擬環境訓練城市交通調度模型等。
此次獲獎項目的技術報告顯示,其構建的智能決策平臺已形成完整的技術體系,包含23項發明專利、17篇國際頂級會議論文及3項軟件著作權。經第三方機構評估,該平臺在工業軟件國產化替代、國防裝備智能化升級等方面創造直接經濟效益超5億元,同時帶動相關產業鏈技術迭代,形成顯著的社會效益。隨著平臺開放接口的逐步推出,未來將有更多行業能夠接入這一“數字大腦”,加速智能化轉型進程。











