在萬(wàn)眾矚目的2025世界人工智能大會(huì)上,備受期待的SAIL獎(jiǎng)(Super AI Leader,卓越人工智能引領(lǐng)者獎(jiǎng))最終榜單隆重揭曉。此次,智元機(jī)器人憑借自主研發(fā)的“啟元通用具身大模型”,在眾多佼佼者中脫穎而出,榮獲了分量極重的SAIL之星獎(jiǎng)。尤為智元機(jī)器人是本次6家SAIL之星獲獎(jiǎng)企業(yè)中,唯一的機(jī)器人領(lǐng)域代表。
自2018年設(shè)立以來(lái),SAIL獎(jiǎng)始終由全球頂尖的數(shù)十位權(quán)威專家組成評(píng)審團(tuán),其中包括中國(guó)科學(xué)院院士、中國(guó)工程院院士以及國(guó)內(nèi)外知名科研機(jī)構(gòu)的學(xué)者。該獎(jiǎng)項(xiàng)旨在表彰在全球范圍內(nèi),實(shí)現(xiàn)方向性技術(shù)突破、應(yīng)用創(chuàng)新并深刻改變?nèi)祟惿畹娜斯ぶ悄茼?xiàng)目。智元機(jī)器人此番獲獎(jiǎng),無(wú)疑是對(duì)其在具身智能領(lǐng)域深厚積累的高度認(rèn)可,同時(shí)也是對(duì)其推動(dòng)整個(gè)行業(yè)邁向新高度、引領(lǐng)未來(lái)發(fā)展方向的充分肯定。
“啟元通用具身大模型”基于前沿的Vision-Language-Latent-Action(ViLLA)架構(gòu),創(chuàng)造性地提出了預(yù)測(cè)Latent Action Tokens的方法,成功跨越了圖像文本輸入與機(jī)器人動(dòng)作執(zhí)行之間的語(yǔ)義障礙。這一技術(shù)上的重大突破,使得機(jī)器人在應(yīng)對(duì)復(fù)雜多變的環(huán)境時(shí),能夠更精準(zhǔn)地理解指令、高效執(zhí)行任務(wù),從而極大提升了其自主作業(yè)能力。ViLLA架構(gòu)的引入,不僅為具身智能的研究開(kāi)辟了新的理論路徑,更為實(shí)際應(yīng)用場(chǎng)景中的機(jī)器人智能化水平帶來(lái)了顯著提升。啟元大模型的商業(yè)化應(yīng)用,標(biāo)志著機(jī)器人正由專用任務(wù)工具向通用智能體轉(zhuǎn)變,為工業(yè)生產(chǎn)、商業(yè)服務(wù)、家庭生活等多個(gè)領(lǐng)域帶來(lái)了前所未有的變革。
在工業(yè)生產(chǎn)領(lǐng)域,啟元大模型賦能的機(jī)器人能夠靈活適應(yīng)不同產(chǎn)線的需求,實(shí)現(xiàn)高效、精準(zhǔn)的作業(yè);在商業(yè)服務(wù)場(chǎng)景中,機(jī)器人通過(guò)自然語(yǔ)言交互,能夠?yàn)橛脩籼峁﹤€(gè)性化、智能化的服務(wù)體驗(yàn);而在家庭環(huán)境中,啟元大模型則讓機(jī)器人成為用戶的得力助手,輕松應(yīng)對(duì)家務(wù)、陪伴、教育等多重任務(wù)。這種跨領(lǐng)域、多場(chǎng)景的通用性,為機(jī)器人技術(shù)的廣泛應(yīng)用和產(chǎn)業(yè)升級(jí)注入了強(qiáng)勁動(dòng)力。
面對(duì)具身數(shù)據(jù)稀缺的挑戰(zhàn),智元機(jī)器人構(gòu)建了完備的數(shù)據(jù)閉環(huán)體系,通過(guò)持續(xù)的數(shù)據(jù)收集、分析、優(yōu)化,不斷提升模型的性能和適應(yīng)性。更為難能可貴的是,智元還開(kāi)源了全球首個(gè)基于全域真實(shí)場(chǎng)景、全能硬件平臺(tái)、全程質(zhì)量把控的百萬(wàn)真機(jī)數(shù)據(jù)集AgiBot World,為全球開(kāi)發(fā)者提供了寶貴的研究資源,有力推動(dòng)了具身智能技術(shù)的創(chuàng)新與發(fā)展。在模型評(píng)測(cè)方面,智元機(jī)器人提出了融合仿真評(píng)測(cè)與世界模型的綜合評(píng)測(cè)方案,這一創(chuàng)新方法不僅提高了評(píng)測(cè)效率,更增強(qiáng)了評(píng)測(cè)結(jié)果的準(zhǔn)確性和可靠性,為具身智能技術(shù)的持續(xù)進(jìn)步奠定了堅(jiān)實(shí)基礎(chǔ)。
為了進(jìn)一步降低具身大模型的開(kāi)發(fā)門(mén)檻,智元機(jī)器人還精心打造了Genie Studio一站式開(kāi)發(fā)與應(yīng)用平臺(tái)。該平臺(tái)集成了數(shù)據(jù)采集、模型訓(xùn)練、仿真評(píng)測(cè)、模型推理等全鏈條功能,為開(kāi)發(fā)者提供了便捷、高效的開(kāi)發(fā)環(huán)境,有力促進(jìn)了行業(yè)技術(shù)的快速發(fā)展與創(chuàng)新。