在近期舉辦的青年科學家成果轉化與具身智能高質量發展研討會上,北京大學助理教授及銀河通用機器人創始人王鶴博士分享了他的獨到見解。他指出,自動駕駛技術的飛速進步得益于海量的真實數據支撐,然而具身智能的發展路徑卻截然不同,合成數據將成為其突破的關鍵。
銀河通用機器人在技術創新上邁出了重要一步。今年年初,公司推出了全球首個端到端具身抓取基礎大模型GraspVLA,這一模型無需依賴大規模的真實數據,僅憑合成數據即可完成預訓練過程,為具身智能的發展開辟了新的道路。緊接著,在6月份,銀河通用又發布了面向零售商業化的端到端大模型GroceryVLA以及產品級端到端導航大模型TrackVLA,進一步豐富了其技術矩陣。
王鶴博士強調,自動駕駛領域的數據采集相對容易,因為車輛在路上行駛時就能不斷產生數據。然而,具身智能的數據采集卻面臨巨大挑戰。目前,全球最大的具身智能數據采集量僅能達到百萬條級別,遠遠無法滿足模型訓練的需求。以銀河通用為例,盡管今年的量產目標超過1000臺人形機器人,但要達到1億條真實數據的采集量仍然遙不可及。
針對這一難題,王鶴博士提出了利用大規模合成仿真數據來彌補真實數據不足的策略。他認為,這是當前破局的關鍵所在。當然,他也展望了未來,當人形機器人的市場占有率達到類似汽車的規模時,采集成本將大幅下降,真實數據將成為不可或缺的重要資源。
在機器人的規?;瘧梅矫?,銀河通用取得了顯著的進展。特別是在智慧零售領域,公司推出了全球首個人形機器人智慧零售解決方案。該方案由輪式雙臂機器人Galbot全天候在無人店鋪內執行自動化全流程,包括盤點、補貨、取送、打包等,極大地提高了零售效率。目前,銀河通用已在北京常態化運營了約10家24小時無人值守智慧藥房,并計劃在國內布局100家智慧零售店。
王鶴博士還透露,銀河通用正在將GraspVLA(專注于上半身操作)、TrackVLA(專注于下半身導航)以及人機交互等技術融合成一個基座大模型——GALBOT VLA。這一模型將很快在零售、工業、康養、迎賓接待等一系列場景中實現應用落地,為具身智能的未來發展注入新的活力。