在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上,宇樹科技創始人兼CEO王興興圍繞具身智能與機器人大模型的發展前景發表了深度見解。他通過對比技術演進路徑指出,當前機器人大模型所處的階段,類似于ChatGPT問世前1至3年的探索期——行業已明確技術方向,但距離突破性應用仍存在顯著瓶頸。
王興興分析稱,盡管生成式AI在語言理解和視覺識別領域取得顯著突破,但機器人實現“具身智能”仍面臨多重挑戰。他強調,真正的具身智能需要機器人在物理世界中具備感知環境、精準運動控制以及理解人類交互意圖的綜合能力,這涉及機械設計、傳感器技術、算法優化等多維度的系統創新。
對于“具身智能的ChatGPT時刻”判定標準,王興興提出明確量化指標:當機器人能在未經過訓練的陌生場景中,僅通過語音或文字指令完成80%以上的任務時,方可視為技術成熟的關鍵節點。他以家庭服務場景為例說明,機器人需同時理解“把水果從廚房拿到客廳”這類指令背后的空間關系、物體識別和路徑規劃需求。
在技術實現路徑上,王興興特別指出,單純依賴大模型的推理生成能力遠不足以支撐具身智能發展。他提出三大核心支撐要素:構建高精度的物理世界數字模型、建立實時數據反饋閉環系統,以及開發能夠動態調整策略的強化學習框架。這些要素共同構成機器人適應復雜環境的“認知-行動”循環機制。
針對行業普遍關注的落地周期問題,王興興坦言技術突破需要跨學科協同創新。他透露,宇樹科技正在研發具備多模態感知能力的下一代機器人平臺,通過融合視覺、觸覺、力覺傳感器,結合動態環境建模算法,嘗試突破現有運動控制與場景理解的局限。






