在人工智能機器人領域,認知、感知與規劃層面的技術突破日新月異,但讓機器人像人類一樣完成精細手部操控、執行復雜靈巧操作,始終是橫亙在產業面前的關鍵挑戰。這一難題的核心在于,現有技術難以精準捕捉人手操作中的微力覺、高精度幾何關系及復雜接觸動態,同時缺乏能處理超高維度狀態與控制復雜度的智能系統。近日,靈巧智能科技有限公司(以下簡稱“靈巧智能”)通過發布DexCanvas大規模人手操作動作數據集,為破解這一瓶頸提供了基礎設施級解決方案。
作為靈巧操作技術領域的創新企業,靈巧智能提出“硬件體系持續演進、算法平臺開源共享、數據基建生態共建”的三維創新框架,并以此為指導開發了DexCanvas數據集。該數據集通過系統化采集與物理增強技術,將人類長期進化形成的操作模式轉化為機器學習可用的結構化知識,為機器人實現“物理智能”提供了關鍵支撐。
DexCanvas的核心優勢體現在三方面:其一,數據集的系統性與精度達到行業領先水平。基于22類人手操作模式,數據采集涵蓋超1000小時真人多模態演示數據與10萬小時物理仿真合成數據,同步記錄亞毫米級位置軌跡、物理一致的接觸力信息,以及RGB、深度、運動捕捉、力/力矩4種模態數據,為模型訓練提供了高維度、低噪聲的輸入。其二,物理真實性得到嚴格保障。通過獨創的物理信息完備操作軌跡復刻流程,確保手-物交互的幾何接觸與力學特性完全符合真實物理規律,同時提供力閉合、形閉合等關鍵物理屬性的多維度抓取語義標注,使模型能理解操作背后的物理邏輯。其三,數據集具備強泛化與擴展能力。由于數據源于純人類演示,不依賴特定機器人形態,可支持跨平臺技能遷移;通過提供HuggingFace標準接口、開源數據加載器及使用示例,研究者可在模仿學習、強化學習、大規模預訓練等多種范式下開展創新應用。
“我們的使命是讓機器智能勝任物理世界的工作,從而解放人類去從事更具創造性的活動。”靈巧智能具身智能科學家表示,“DexCanvas數據集是這一使命的核心基石。它不僅解決了大規模、高質量、多模態靈巧操作數據缺失的問題,更通過物理增強技術,將人類操作中的隱性知識顯性化,為機器人學習提供了可復用的結構化框架。”