人形機器人無疑是當下科技領域的焦點,但伴隨熱度而來的,是同樣激烈的爭議。自春晚舞臺上機器人以秧歌表演引發關注后,這一領域便開啟了加速發展模式:從4月機器人參與馬拉松,到8月機器人運動會開幕,行業活動密集涌現。往年以大模型展示為主的WAIC展會,今年也大幅增加了機器人展區,足見其熱度。
然而,表面的繁榮下,質疑聲始終未斷。金沙江創投朱嘯虎年初直言“人形機器人是泡沫”,網友的調侃也暗含類似邏輯——視頻中機器人似乎無所不能,現實中卻連開門這種基礎動作都難以完成。
作為具身智能的支持者,筆者在探究爭議根源時發現,行業現狀確實存在諸多難點。技術路線尚未統一便是首要問題:強化學習與世界模型孰優孰劣?數據與模型孰輕孰重?這些關鍵問題缺乏共識,導致企業各自為戰,難以形成合力。
若拋開技術路線分歧,行業面臨更迫切的挑戰是數據匱乏。據業內人士透露,大模型實現智能涌現至少需要100億至1萬億個Token的數據,約為模型參數的10倍以上。但當前多數研究的數據量僅數億,最大公開數據集也不過10億。這種“訓練量不足”直接導致機器人任務種類有限、泛化能力差,如同實驗室中的“胖寶寶”,一旦進入真實場景便束手無策。
數據瓶頸已成為機器人從實驗室走向實際應用的關鍵阻礙。外灘大會上,宇樹創始人王興興明確指出,數據問題是當前具身智能發展的主要挑戰之一。以VLA模型為例,其與真實世界交互的數據嚴重不足,限制了模型性能的提升。
不過,將行業問題簡單歸結為“泡沫”未免過于武斷。華為云具身智能團隊負責人表示,新技術的發展必然伴隨新問題,而解決這些問題需要新方法論和平臺支持。云端解決方案便是其中之一。
以數據問題為例,云端生成合成數據已成為行業趨勢。英偉達的Cosmos基礎模型通過云端模擬物理環境生成訓練數據,華為云的CloudRobo平臺則更進一步:其自研的metaEngine引擎可將真實物理場景數字化,構建與現實完全一致的虛擬世界,并在此環境中生成海量第一視角數據,包括RGB圖像、深度信息、時序數據等,且自動完成標注。
這種“云端訓練”模式大幅降低了數據采集成本。銀河通用創始人王鶴曾預測,合成數據將占據訓練數據的絕大部分,且這一領域需要長期技術積累和核心能力。通過調整真實數據與合成數據的比例,機器人訓練效率可顯著提升,解決“沒米下鍋”的困境。
在訓練環節,云端同樣展現出優勢。CloudRobo平臺支持機器人在虛擬環境中通過模仿學習進行“虛擬勞動”,大幅降低試錯成本,加速技能學習。這種模式突破了物理環境的限制——云端的訓練進度僅取決于算力和電量,而非現實中的時間成本。例如,某云廠商可在一天內完成傳統方式需要兩年半的訓練量。
云端訓練的成果可直接應用于實體機器人。華為云展示的雙臂機器人已在分光盒操作中實現90%以上的成功率,埃夫特的工業噴涂臂通過云端訓練快速掌握新零件噴涂技術,樂聚的人形機器人也具備汽車產線搬運能力。
除數據問題外,云端解決方案還可應對行業標準混亂的挑戰。當前,各廠商機器人系統、接口差異巨大,類似早期手機行業的“諸侯割據”。華為云提出的R2C協議旨在建立機器人領域的“Type-C”標準,支持“即插即用”。國家地方共建人形機器人創新中心、拓斯達、優艾智合等企業已加入該協議,推動行業標準化進程。
當然,云端解決方案并非萬能。對實時性、安全性要求極高的場景,本地計算仍具優勢。但云計算的核心價值在于處理復雜任務——如場景識別、任務規劃、模型調用等,這些工作可交由云端完成,使機器人本體更輕便、成本更低,實現“云本體化”。
這一理念已得到行業認可。王興興在WRC演講中提到,人形機器人本體難以直接部署大規模算力,未來需依賴分布式集群算力,即云端算力支持。華為近期發布的Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點產品,分別支持8192及15488張昇騰卡,算力規模領先全球,其發布的超節點集群最大可達百萬卡,為具身智能行業提供算力保障。
技術爭議的背后,是行業從實驗室走向社會的必然過程。無論是云端還是本地計算,其核心目標都是推動機器人參與勞動、提升生產力。那些質疑“炒作”的聲音雖指出了現實困難,但若僅聚焦于問題,難免得出悲觀結論。技術的價值終需在真實場景中驗證——無論是擰緊螺絲、搬運物料還是焊接縫隙,都是機器人證明自身的舞臺。
具身智能的發展需要先行者構建基礎設施。與其在岸邊爭論路徑可行性,不如先鋪就道路。畢竟,道路拓寬后,行業才能跑得更快、更遠。