北京商報(bào)訊(記者 魏蔚)7月22日,字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)推出全新VLA(視覺(jué)語(yǔ)言動(dòng)作模型)模型,具備泛化到新物體和新環(huán)境的能力,能理解包含抽象概念的語(yǔ)言指令、精細(xì)地操作柔性物體。與此前需要大量機(jī)器人軌跡訓(xùn)練的 VLA 模型不同,GR-3 通過(guò)少量的人類(lèi)數(shù)據(jù)即可實(shí)現(xiàn)高效微調(diào),從而快速且低成本地遷移至新任務(wù),以及認(rèn)識(shí)新物體。GR-3 能有效處理長(zhǎng)程任務(wù)并能進(jìn)行高靈巧度的操作,包括雙手協(xié)同操作、柔性物體操作,以及融合底盤(pán)移動(dòng)的全身操作等。
同時(shí),字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)還開(kāi)發(fā)了一款具備高靈活性、高可靠性的通用雙臂移動(dòng)機(jī)器人 ByteMini。作為機(jī)器人本體,ByteMini搭載GR-3 模型,具有22 個(gè)全身自由度以及手腕球角設(shè)計(jì),可在狹小空間中完成各種精細(xì)操作。