在人工智能領域,當機器人從“感知世界”邁向“理解并適應世界”,具身智能正開啟全新的技術篇章。清華大學人工智能研究院智能機器人中心主任孫富春教授在2025浦江創新論壇具身智能前沿技術論壇上提出,未來智能機器人將突破傳統工具屬性,成為能在真實物理環境中自主決策、學習與進化的“類生命體”。
傳統機器人往往依賴預設指令執行任務,如同機械記憶的學生,一旦環境參數變化便難以應對。孫富春以泡茶場景為例:具身智能機器人不僅需要完成燒水、取茶、注水等流程,更需具備邏輯推理能力——當檢測到茶葉不足時,能自主規劃路徑從儲物柜尋找替代品。這種能力源于“策略泛化”與“場景泛化”的雙重突破,即通過智能魯棒性擺脫對特定數據的過度依賴,實現從“開上海的門”到“開北京的門”的跨場景適應。
機器人的“發育”過程被類比為人類成長:通過持續與環境交互,將感知與行為深度融合,構建對物理世界的動態認知模型。孫富春指出,傳統強化學習僅依賴數據訓練已無法支撐高級智能,必須轉向“具身強化學習”框架。這種模式使機器人能像人類一樣調用知識庫、記憶和經驗,通過類比遷移解決未知問題,例如從抓握蘋果的動作中推導出抓取杯子的策略。
在技術路徑上,孫富春強調“大模型+小模型”的協同架構將成為主流。云端大模型承擔高階認知任務,如任務分解、邏輯推理和知識調用,為機器人提供戰略層面的“認知高度”;部署在本體的小模型則專注毫秒級實時控制,如力反饋調節和軌跡優化,確保執行層面的“操作精度”。這種分布式架構已在工業領域驗證可行性,例如通過“云端大模型規劃路徑+邊緣小模型控制機械臂”實現精密裝配。
關于本體形態,孫富春明確提出人形機器人是具身智能的最佳載體。他列舉四大優勢:人類神經系統的可塑性支持長期技能學習;四肢協調性為動作控制提供天然基準;雙足行走對平衡感知的要求遠超輪式結構;靈巧雙手的結構設計適合復雜工具操作。其團隊研發的主動握力靈巧手已實現單臂15公斤負載能力,可完成穿針引線等精細任務,并在國際機器人操作挑戰賽中多次獲獎。
對于具身智能的未來突破,孫富春提出四大核心方向:優化人形本體設計以提升環境適應性;構建融入物理規律的“世界模型”數據庫;開發能快速適配不同任務的個性化智能體;完善基于經驗積累的自主進化機制。這些要素共同構成從實驗室到實用場景的關鍵橋梁。