在2025世界機器人大會上,自變量機器人公司展出的兩款機器人引發行業關注。輪式雙臂機器人“小量”以靈巧的雙手完成香囊制作,仿人形機器人“量子2號”則通過7自由度手臂設計,實現了捏薯片不碎、360°清潔等精細操作。這些突破性表現背后,是該公司自主研發的通用具身大模型WALL-A,其“一腦多用”的端到端技術使機器人具備零樣本泛化能力,標志著機器人技術從演示階段向實用化邁進。
自變量機器人創始人王潛指出,當前人形機器人已從“動彈不了”的階段,發展到能走路、跑步、打拳甚至踢球。但真正制約其進入工廠和家庭的核心障礙,并非機械結構的完善程度,而是缺乏能深刻理解物理世界、自主決策的“更強大腦”。“沒有大腦驅動的機器人就像失去靈魂的鐵木,只能表演無法實干?!彼扔鞯馈?/p>
針對機器人大腦技術路線的爭議,王潛明確表示,現有大語言模型、多模態模型或視覺語言大模型均屬于虛擬世界的基礎模型,無法直接應用于物理世界。他以推門動作為例:手的接觸點位置、接觸時長、力的方向等參數差異,會導致完全不同的結果,這種隨機性是虛擬模型難以處理的。物理世界的0.1%誤差可能引發10%-20%的操作偏差,這是當前機器人泛化能力不足的根本原因。
與傳統分層模型相比,自變量采用的端到端通用具身智能模型具有顯著優勢。該模型將視覺、語言、觸覺、動作等所有模態信息統一處理,形成從信號輸入到動作輸出的完整閉環。實驗顯示,搭載該模型的“小量”機器人在削蘋果時,能根據“有小孩的家庭”這一指令,主動從更高處的抽屜尋找水果刀以避免危險。而在穿衣服任務中,面對拉鏈變形等突發狀況,模型僅需少量樣本即可完成策略調整,無需重新編程。
在數據積累方面,自變量構建了全球最大的具身智能數據集,涵蓋數萬小時的機器人操作視頻、觸覺反饋和空間定位數據。為提升數據效率,公司研發了物理準確性最高的視頻生成大模型,通過切換背景、環境和接觸物理過程,將一條真實數據擴展為成百上千條模擬數據。王潛強調:“數據質量比數量更重要,擴大數據多元性是提升模型泛化能力的關鍵。”
關于機器人能力與實際需求的匹配度,王潛坦言,當前跑步、跳舞等運動能力與工業、家庭場景所需的復雜操作能力存在較大差距。他以通用能力框架分析,機器人的核心競爭力在于操作維度,而非運動或導航。不過他也指出,在技術尚未完全成熟的階段,開發娛樂能力能為機器人提供情緒價值,幫助企業維持發展。
對于硬件與軟件的協同關系,王潛認為具身智能是典型的“軟件定義硬件”領域。他透露,自變量正根據模型進化需求重新定義硬件標準,確保機械結構能充分釋放大腦潛力。這種軟硬協同的研發模式,或將成為未來機器人產業的核心競爭力。