國(guó)內(nèi)具身智能領(lǐng)域近日取得里程碑式進(jìn)展——北京人形機(jī)器人創(chuàng)新中心正式開(kāi)源國(guó)內(nèi)首個(gè)通過(guò)具身智能?chē)?guó)家標(biāo)準(zhǔn)測(cè)試的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)大模型XR-1。這一突破性成果標(biāo)志著我國(guó)人形機(jī)器人技術(shù)從實(shí)驗(yàn)室驗(yàn)證階段邁向真實(shí)場(chǎng)景應(yīng)用的關(guān)鍵轉(zhuǎn)折點(diǎn),為機(jī)器人產(chǎn)業(yè)規(guī)模化落地提供了核心支撐。
作為具身智能系統(tǒng)的"小腦"模塊,XR-1大模型展現(xiàn)出強(qiáng)大的跨平臺(tái)適配能力。基于超百萬(wàn)量級(jí)的自研多本體數(shù)據(jù)訓(xùn)練,該模型可在天工2.0、UR、Franka等不同構(gòu)型機(jī)器人平臺(tái)上無(wú)縫遷移通用操作知識(shí)。在七大泛化維度測(cè)試中,XR-1對(duì)物體顏色、空間位置、背景干擾等復(fù)雜場(chǎng)景表現(xiàn)出優(yōu)異適應(yīng)性,能夠精準(zhǔn)完成取放、推拉、旋轉(zhuǎn)等雙臂協(xié)同操作任務(wù),動(dòng)作精度達(dá)到行業(yè)領(lǐng)先水平。
與XR-1同步開(kāi)源的還有兩大核心基礎(chǔ)設(shè)施:新一代數(shù)據(jù)底座RoboMIND2.0和高保真數(shù)字資產(chǎn)庫(kù)ArtVIP最新版。這套組合方案構(gòu)建起完整的"數(shù)據(jù)采集-模型訓(xùn)練-場(chǎng)景驗(yàn)證"閉環(huán)體系,其中RoboMIND2.0支持多模態(tài)數(shù)據(jù)實(shí)時(shí)處理,ArtVIP則提供超過(guò)50萬(wàn)幀的精細(xì)化場(chǎng)景數(shù)據(jù),涵蓋工業(yè)制造、物流搬運(yùn)、家庭服務(wù)等20余個(gè)典型應(yīng)用場(chǎng)景。
在系統(tǒng)架構(gòu)層面,創(chuàng)新中心已形成"大腦+小腦+本體"的完整生態(tài)布局。物理本體層依托"具身天工"平臺(tái),已迭代出天工2.0、天軼2.0等系列化機(jī)器人產(chǎn)品;具身大腦層通過(guò)"慧思開(kāi)物"平臺(tái)先后開(kāi)源WoW世界模型和Pelican-VL大模型,承擔(dān)環(huán)境感知、任務(wù)規(guī)劃等高層認(rèn)知功能;此次發(fā)布的XR-1小腦模型則專(zhuān)注于運(yùn)動(dòng)控制,實(shí)現(xiàn)從決策到執(zhí)行的精準(zhǔn)轉(zhuǎn)化。










