在人工智能與具身智能技術加速迭代的背景下,具身智能與人形機器人產業(yè)正面臨從技術突破到場景落地的關鍵跨越。9月17日,天津舉辦的“2025具身智能全球硬科技發(fā)展大會”上,全球頂尖學者、企業(yè)代表聚焦“技術攻堅”與“場景實踐”兩大議題,共謀具身智能生態(tài)化發(fā)展路徑。天娛數(shù)科首席數(shù)據(jù)官吳邦毅在會上發(fā)表《Behavision:通用具身智能與物理世界的交互基座》主題演講,系統(tǒng)解析了行業(yè)“四缺”痛點,并展示了天娛數(shù)科以數(shù)據(jù)、算法、平臺為核心的技術布局。
吳邦毅指出,當前人形機器人產業(yè)存在四大瓶頸:算法開發(fā)平臺缺失導致重復研發(fā),3D數(shù)據(jù)平臺不足制約訓練效率,標準認證體系不完善阻礙生態(tài)協(xié)同,場景測試與人才平臺缺乏延緩技術落地。為破解這些難題,天娛數(shù)科推出Behavision空間智能MaaS平臺,構建“世界感知—時空推理—泛化執(zhí)行”的閉環(huán)體系。該平臺通過整合“傳感”“大腦”“小腦”三大模塊,形成通用支撐架構,推動人形機器人實現(xiàn)“腦體協(xié)同”的突破。
數(shù)據(jù)是具身智能的基石。天娛數(shù)科已建成國內領先的3D與多模態(tài)數(shù)據(jù)體系,通過自建3D動捕基地與多模態(tài)采集系統(tǒng),累計沉淀150萬條3D數(shù)據(jù)、65萬條多模態(tài)數(shù)據(jù),其中包含20萬條機器人任務訓練數(shù)據(jù),覆蓋生活服務、高端制造、智慧醫(yī)療等場景。吳邦毅強調:“物理AI的落地需以理解物理世界為前提,機器必須掌握物體的幾何結構、材質特性及運動規(guī)律。”為此,公司以3D鉸接數(shù)據(jù)為核心,遵循“物理真實性、語義可理解性、場景泛化性”標準,通過毫米級光學動捕與三維掃描技術,精準還原物體動態(tài)交互規(guī)則,賦予數(shù)據(jù)“物理骨架”與“語義靈魂”。目前,其3D鉸接數(shù)據(jù)已入選《北京市行業(yè)高質量數(shù)據(jù)集典型案例》,并在全國多地數(shù)據(jù)交易平臺上線。
算法層面,天娛數(shù)科依托自研大模型矩陣驅動技術落地。其天星基座大模型、“智者千問”3D智能行業(yè)大模型與智慧廣告大模型形成協(xié)同,結合Embodied Chain-of-Thought Reasoning (ECoT) for VLA算法,使人形機器人能夠快速學習復雜動作序列。這一設計解決了傳統(tǒng)算法“通用性不足”與“精準度受限”的矛盾:通用大模型保障場景理解與決策能力,VLA算法則聚焦操作細節(jié)控制,使機器人既能“看懂”環(huán)境需求,又能“做好”精細動作。
作為數(shù)據(jù)與算法的整合載體,Behavision平臺創(chuàng)新性搭建原子技能庫,針對輪式、腿足式人形機器人及機械臂等設備,梳理“移動、抓取、旋轉”等基礎技能,形成可復用的動作模板庫。當面臨新任務時,傳感模塊完成環(huán)境感知與語義理解,“大腦”結合大模型生成決策方案,“小腦”從技能庫調用適配模塊,實現(xiàn)多場景任務的快速執(zhí)行。這一閉環(huán)體系推動人形機器人從“程序演示”向“自主決策+高效執(zhí)行”的3.0階段躍遷。吳邦毅特別提到,平臺通過3D鉸接數(shù)據(jù)的深度應用,填補了傳統(tǒng)數(shù)據(jù)缺乏物理屬性與功能語義的空白,使AI能夠理解“椅子可坐、門可推開”等物理邏輯。
從數(shù)據(jù)積累到算法創(chuàng)新,再到平臺落地,天娛數(shù)科構建了“數(shù)據(jù)-算法-平臺-場景”的完整產業(yè)閉環(huán)。其Behavision體系不僅為企業(yè)自身打造了技術與生態(tài)優(yōu)勢,更為“人工智能+”戰(zhàn)略的落地提供了可復制的路徑,加速具身智能技術從實驗室走向千行百業(yè)。