在人工智能與機器人技術迅猛發展的當下,行業對AI大模型的期待與現實應用之間的落差引發了廣泛討論。宇樹科技創始人王興興在近期一場科技論壇上直言,當前機器人領域的核心瓶頸并非硬件,而是AI大模型的能力尚未達到實際需求,尤其在多模態交互與復雜任務執行層面仍存在顯著短板。
王興興指出,盡管機器人硬件技術已足夠成熟,甚至“未來一兩年內無需重大升級”,但AI模型的局限性導致硬件潛力難以充分釋放。例如,在控制機器人靈巧手完成精細操作時,現有模型仍無法實現語言指令與動作的精準匹配;在家庭服務場景中,機器人對“尋找昨天收到的快遞”這類模糊指令的處理能力也遠未達標。這類任務需要模型同時理解時間、空間、物體屬性等多維度信息,并具備跨模態推理能力,而當前模型仍依賴大量標注數據和預設規則,難以應對真實世界的復雜性。
這一觀點并非孤例。網絡上曾流傳一個調侃:“我們期待AI幫忙洗碗,自己專注藝術創作;結果卻是AI在創作,而我們還在洗碗。”這一矛盾折射出公眾對AI技術落地的迫切需求與現實能力之間的差距。王興興認為,AI時代為年輕人提供了公平的機遇,但前提是突破現有模型的工具化局限,將其視為“全能型伙伴”而非簡單工具。
從技術層面看,大模型的發展仍處于初級階段。盡管參數規模持續膨脹,但多數模型仍依賴統計規律進行模式匹配,缺乏對事物本質的理解。例如,在自然語言處理中,模型可能準確回答標準問題,卻難以捕捉隱喻、雙關語或文化背景的深層含義;在圖像識別領域,對罕見物體或特殊場景的識別仍需大量訓練數據。這種“淺層智能”導致模型在面對動態環境或跨領域任務時表現乏力。
機器人領域的挑戰尤為突出。具身智能(Embodied AI)要求模型不僅處理信息,還需通過身體感知環境并自主決策。然而,當前模型與人類思維的差異顯著:人類能憑借直覺和經驗快速判斷,而模型需通過海量數據訓練才能完成簡單任務。例如,家庭機器人雖能執行“播放音樂”等指令,卻難以理解“根據家人喜好調整房間布置”這類涉及情感與常識的需求。這種差距使得機器人仍停留在“工具化”階段,遠未達到“智能體”水平。
行業普遍認為,單純擴大模型參數已非最優路徑。高參數模型雖能提升性能,但伴隨訓練成本激增、推理速度下降等問題。更關鍵的是,參數規模與實際應用能力并非線性相關。例如,某些模型在特定任務中表現優異,卻無法遷移至其他場景。因此,優化訓練算法、提升數據效率、加強模型與硬件的協同,成為突破瓶頸的關鍵。
王興興強調,AI的進化需聚焦具身智能的落地。這要求模型從“被動響應”轉向“主動感知”,通過實時環境反饋動態調整策略。例如,服務機器人在清掃時需識別障礙物類型,判斷是否需要移動;工業機器人在裝配時需根據零件變形調整力度。這些能力依賴模型對物理世界的深度理解,而當前技術仍無法滿足需求。
盡管挑戰重重,但行業對AI的潛力仍持樂觀態度。王興興鼓勵年輕人積極擁抱AI,將其作為重新定義職業路徑的契機。他預言,隨著模型與硬件的深度融合,機器人將逐步從“執行者”轉變為“協作者”,真正融入人類生活。而這一目標的實現,仍需跨學科協作與持續技術創新。