機器人領域迎來一項突破性進展——由Dexmal原力靈機與Hugging Face聯合開發的RoboChallenge基準測試平臺正式上線。該平臺聚焦真實物理場景下的機器人操作任務,首次構建了覆蓋多任務、大規模測試的標準化評估體系,為行業提供了可公開訪問的機器人性能驗證解決方案。
針對現有機器人基準測試的三大痛點,RoboChallenge實現了關鍵突破:其一,通過真實物理環境部署,解決了模擬環境與現實場景的性能斷層問題;其二,制定了涵蓋任務類型、環境變量、執行標準的統一測試框架;其三,打造了全球首個開放共享的機器人測試平臺,支持多機構協同驗證。這種創新模式使不同實驗室的機器人系統首次能在相同條件下進行橫向對比。
平臺特別針對視覺語言動作模型(VLAs)的落地應用設計了評估方案。通過整合視覺感知、自然語言理解和運動控制三大模塊,RoboChallenge構建了包含物品抓取、空間導航、復雜操作等20余類真實任務的測試矩陣。每個任務均設置多維度評估指標,涵蓋成功率、效率、魯棒性等核心參數,確保能全面反映模型在真實場景中的綜合能力。
這項突破性成果將顯著加速機器人智能系統的實用化進程。研究人員可通過平臺數據快速定位模型短板,企業能基于標準化評估優化產品性能,學術界則獲得了研究真實世界機器人交互的珍貴數據集。目前已有12個國家的37家科研機構申請使用該平臺,首批測試數據預計將在三個月內公開,或將引發機器人評估體系的范式變革。








