在人工智能與機器人技術高速發展的當下,AI大模型的能力邊界成為行業焦點。宇樹科技創始人王興興在2025外灘大會圓桌論壇上直言,當前機器人硬件已足夠成熟,但AI大模型在多模態融合與復雜場景應用中的表現仍存在顯著短板,這一觀點引發科技界對AI落地具身智能領域的深度思考。
王興興以機器人靈巧手控制為例,指出當前模型難以實現語言指令與精細動作的精準匹配。盡管純文本或視覺模型已具備較高性能,但將兩者融合時仍面臨技術瓶頸。他比喻稱,AI在信息處理領域已長出"參天大樹",但在物理世界交互領域仍是"荒漠中零星的小草",距離真正替代人類完成復雜任務仍有巨大差距。
這種能力局限在家庭服務場景中尤為突出。當用戶要求機器人尋找"昨天收到的可能放在鞋柜或沙發下的快遞"時,系統需同時處理時間記憶、空間推理、物體識別等多維度信息。現有模型雖能完成"播放音樂"等簡單指令,但在模糊指令解析和跨模態決策方面仍顯乏力,暴露出對真實世界不確定性的適應不足。
技術層面,多數大模型仍處于邏輯推理的初級階段。以自然語言處理為例,模型能生成流暢文本,卻常誤解隱喻、雙關語等文化相關表達。這種基于統計規律的模式匹配,缺乏人類直覺與創造力,導致在處理非常規任務時效率驟降。某工業機器人雖能精準完成裝配,但面對生產線上突發的零件變形時,仍需人工干預調整參數。
具身智能的發展困境更凸顯模型與硬件的協同問題。當前機器人雖具備先進傳感器和執行器,但"大腦"與"身體"的配合仍停留在表面。例如,會扭秧歌的表演機器人與能真正理解家庭成員習慣、處理突發狀況的家務機器人之間,存在從"工具"到"智能體"的本質跨越。這要求模型具備生活常識、情感理解和跨領域知識整合能力。
行業對模型發展方向的反思逐漸深入。單純擴大參數規模已觸及邊際效益遞減點,高昂的訓練成本與緩慢的推理速度成為制約因素。專家指出,未來突破需聚焦兩大方向:一是優化訓練算法,提升數據利用效率;二是加強軟硬件協同,通過實時傳感器反饋構建環境感知閉環。某研究團隊正嘗試將機器人視覺數據直接輸入模型訓練,使系統能動態調整抓取策略。
王興興鼓勵年輕人以更開放的姿態擁抱AI,將其視為"全能型工具"而非簡單輔助。這種認知轉變或許能加速技術迭代,但行業共識是,大模型需從"參數競賽"轉向"實用智能"開發,真正解決物理世界中的復雜問題,才能推動機器人技術從實驗室走向千家萬戶。