白交 一凡 發自 凹非寺量子位 | 公眾號 QbitAI
這也太驚人了吧?!
注意看,這是一個機器人在跳舞,動作流暢,還是Breaking這種力量協調性要求很高的類型。
但它不光能動,靜下來“干活”也有模有樣:
無論是疊衣服、撕紙巾、拉窗簾、用筷子這種日常生活的精細化操作,還是工廠里的搬運、分揀、掃碼等工業任務,都跟科幻電影里的一模一樣,甚至實現了機器人的群體協作。
而且這還是個大尺寸雙足人形機器人,它身高足足有171cm、體重65kg。在具身智能機器人領域,直接就是全尺寸里一步到位標準。
四肢發達,卻還能粗中有細,能動能靜。
放在機器人領域,背后一定還有個聰明大腦。
這就是來自星動L7機器人秀出的最新能力,打造者是清華叉院背景的明星團隊——星動紀元。在不久前,他們還以近5億新融資引發行業內外熱議,沒想到烈火烹油,隨即就甩出上述驚艷新進展。
這些能力也直接創下多項紀錄:
首個完成360°旋轉跳的;首個會跳街舞breaking的;首個跑得比人快的,也是首個同時具備精細化操作的全尺寸人形機器人。
如此紀錄和能力背后,除了可以推測的AI大腦,也離不開機器人運動控制上的領先,據說它全身多達55個自由度——遠超特斯拉擎天柱等人形機器人標桿。
國產具身TOP,果然亮相就是新高度。
中國首個!全尺寸人形機器人“既能整活,又能干活”
具體來說,星動L7是一款全尺寸人形機器人,身高171cm,體重65公斤,全身自由度達到了55個,然后僅依靠一個端到端具身大模型ERA-42,就能驅動全身靈活運動,這也是這次亮相里最令人驚嘆的地方。
機器人領域的專家,則重點從幾個“大動作”來看門道。
首先是360°旋轉跳躍,默默起勢,穩穩站住。
跑速同樣刷新了行業紀錄,可達4m/s。
而它除了能上舞臺表演,還能下車間干活,而且“粗中有細”。
比如能干重活累活,雙臂負重可達40斤。
同樣也能展現出輕輕撕下一片紙巾的控制感。
最后還可以進一步走進工廠擰螺絲,手持工具槍、食指控制開關鍵,精細作業:
甚至之前代表硅谷機器人最前沿技術水準的“疊衣服”,也不在話下:
當然,你可能發現了,視頻有“bug”……因為不同場景下,星動紀元的產品形態并不一致。
這是因為,星動紀元首創了全尺寸和半身形態可選,用戶可以根據場景需求靈活選擇方案,降低綜合使用成本,解鎖更多更廣闊的市場。
總的來看,星動L7既有大個頭的力量與爆發,也有小個子的靈活。相比自身過去的產品,手臂更纖細,手腕靈活度更高,結合大臂展,操作范圍更有優勢。
對比行業來看,此前能打拳和跳舞的產品屢見不鮮,進車間打螺絲的機器人也并非沒有。
但能做到干活整活兩相宜的,少之又少。
這也是為什么星動L7一經亮相,就引發了行業熱議。
為什么值得關注?
具身智能,作為技術發展自然衍生出的新概念,本質上就是以模型為大腦、以機器人為本體,通過本體與環境的交互來實現智能行為。
雖然大思路是通的,但具體如何做?怎么做?大家就各有各的解法。
此次星動L7之所以值得關注,不僅在于它打破了那么多行業紀錄,更在于打破這些紀錄背后所展現的技術方案,值得參考。
為什么這么說?得從具身智能的發展來衡量,以終為始來看,應該有這三個維度:
動態能力,任務執行能力以及場景泛化能力。
動態能力:高爆發力動作如何實現?
機器人的動態能力是其穩定性和可靠性的基礎。而像空翻、旋轉跳、舞蹈這樣的高爆發力動作,對機器人關節響應速度和平衡控制算法提出了極高要求,已成為衡量行業玩家技術實力的重要標桿。一旦成功實現,就說明實力還不賴。
以往這些案例已經有過不少,但要么是聚焦于小尺寸人形機器人,要么就是實時響應不夠,連貫性跟不上來。
此次星動L7所展現的動態性能之所以驚艷眾人,核心在于其作為一款大尺寸人形機器人,成功攻克了高動態運動中的幾個關鍵難題,包括動力系統不足和平衡控制復雜等問題。
比如像360°旋轉跳這個動作,小尺寸機器人因體重輕,關節電機只需提供幾十N·m扭矩即可完成旋轉動作。
但是試想一下,一個130斤的大尺寸機器人,在旋轉起跳瞬間可能需要承受其本體2-3倍體重的沖擊,扭矩稍微不足就會失敗、響應滯后一點就會失去平衡。
目前業內知名玩家的峰值扭矩一般為360N·m、20rad/s的響應水平,而星動L7配置的400N·m扭矩,直接打破了紀錄,它能夠支撐起瞬間爆發力量并完成動作;25rad/s毫秒級響應能讓關節在0.1秒內完成姿態調整,避免失衡,就解決了這個問題。
而連續跳舞更考驗機器人的平衡控制問題,當重心持續發生劇烈偏移,就需要全身關節實時協同來實現平衡控制。小尺寸機器人實現就比較容易,個頭矮重心低,但大尺寸難度就比較高了。
據介紹,星動L7是通過兩項技術創新來解決這一難題的。
首先,是高達55個自由度的超冗余設計。值得說明的是,自由度數量越多,機器人活動就越靈活,能執行的動作也就越復雜,但同時控制難度也顯著增加。
通常,人形機器人的自由度在40-50個之間,而星動L7將這一數字提升到了55個,這些自由度構成一個高效的協同網絡,借助先進算法實現毫秒級的關節實時聯動。
另一項技術創新則是基于運動數據訓練的端到端強化學習。這種方法直接在傳感器數據與關節動作之間建立映射關系,無需依賴人工設計的平衡規則。它能根據實時動作要求,動態調整55個關節的輸出力度與角度,并通過持續與環境交互來優化動作策略,從而實現精準的實時平衡姿態控制。
除此之外,它采用關節準直驅方案配合全棧自研模塊化骨架,以保證長尺寸機器人足夠輕量化并抗沖擊。
任務執行能力:手速堪比電競選手,看視頻學習百種技能
其次,就是任務執行的能力,換句話說,這就是干活的能力。如果干活能力不強,更何談應用落地。
一言以蔽之,這不僅要看本體是否夠靈活,還得看大腦聰不聰明。
在本體側,手部能力其實是重要的一環。星動L7的手部自由度已經達到了12個,并且每只手指獨立驅動。相比于特斯拉擎天柱的11個自由度,星動L7能復現人類90%的手部動作,從而適配更多細分領域的工作場景。
而且每根手指能夠實現10次/秒的點擊響應,堪比電競選手的操作速度。這樣一來,像電子裝配中“擰螺絲-掃碼-貼標”這種連貫性高的工序也能順利完成。
除此之外,還有十軸手腕的設計(側擺±45°、前后±90°),這樣在裝配一些非標零件時候,可以靈活調整姿態,不需要頻繁轉動機身。
再來看大腦側。以往關于大腦如何訓練,也有很多思路。比如在虛擬環境中進行強化學習,這種方式雖有效,但會導致計算成本大幅增加,而落地到真實環境還需要做大量的適配工作;
還有像動作捕捉(通過人類手把手教學完成高精度任務)也存在局限性——既依賴專業動捕設備,又需要針對每項任務執行大量重復示范教學,過程費時費力,且難以實現能力泛化。
目前行業公認最理想的方式之一是視頻訓練,但僅有少數企業真正將其應用落地,星動紀元就是其中之一。
星動L7背后的具身大模型ERA-42,其“世界模型”能力能讓機器人觀看人類操作視頻,直接學習技能。
這種基于視頻學習的方式具有高度擴展性,它依賴處理海量視頻數據來推斷動作執行邏輯。從某種意義上說,機器人必須發展出“自我意識”。這樣一來,其顯著優勢在于大幅降低數據采集成本,并能快速部署至各類新場景。
支撐復雜場景適應的另一關鍵,是其“長序列任務預判與抗干擾”能力:
高頻實時抗干擾:依靠ERA-42(30Hz以上)高頻的模型推理,機器人完成實時反饋來抗干擾;前瞻性動作規劃:利用視頻預測能力,提前規劃最優動作序列,確保操作“穩準狠”。
再配合靈活的四肢,感覺任一領域、任一場景都給包圓了。
場景泛化能力:全尺寸/半身形態隨意選
最后也是對于商業化來說最關鍵的:場景泛化能力。“既能整活,又能干活”就已經囊括了廣泛的應用場景。
除了大腦本身帶來的泛化性,它的本體也進行了模塊化設計的適配。
星動紀元首創了「全尺寸和半身形態」可選方案,機器人能根據場景靈活切換,進一步擴大了可適用的場景。
比如在工廠里,物流分揀、電子裝配選用半身形態,可以減少空間占用,提升作業效率;而在商場、展會等需要全身動態表現的場景,就能切換至全尺寸形態。
也就是說,以后你在工廠里看到的,跟在商場里看到的,雖然形態各異,但可能都出自于同一個機器人。
星動L7極大地拓展了人形機器人的應用邊界,其靈活的四肢和聰明的大腦,正在勾勒出真正意義上通用人形機器人的雛形。
支撐這一能力持續進化與邊界拓展的,是星動紀元在行業率先跑通的“模型-本體-場景數據”閉環飛輪。
問題是,為什么一定是星動紀元?
率先跑通物理AI閉環飛輪的玩家
如果了解星動紀元的創辦背景和獲得的行業認可,或許就會很意外。
星動紀元成立于2023年8月,是清華大學唯一持股的具身智能企業,創始人兼CEO陳建宇是清華大學學士,加州大學伯克利大學博士,現任清華大學交叉信息研究院助理教授博士生導師,擁有10+年機器人和AI研發經驗。
硬核團隊深耕底層技術研發,引發資本看好,成立兩年不到就完成多輪融資,投資者包括聯想創投、阿里巴巴、海爾資本等。
充足的彈藥能夠持續不斷支撐星動紀元的技術研發。其產品在科研和商用等場景落地,商業化成果顯著。
星動紀元今年已交付超200臺產品,另有上百訂單還在交付中。全球TOP10市值科技巨頭里,已有9家是星動紀元的客戶。在科研方面,星動紀元產品已成為全球開發者市場首選,包括字節跳動機器人實驗室、麻省理工大學、斯坦福、加州大學伯克利分校的頂尖人才都在用。
所以說星動紀元不僅在國內知名,而且海外馳名。出海業務發展迅猛,年初布局僅半年,海外市場收入占比已超過50%。今年的CES上,老黃曬出的14款人形機器人,里面就有星動L7的前身星動STAR 1。
輔助科研,落地商用,走出國門,這也為星動紀元提供了豐富的場景數據,成為其先發優勢之一。
一家創新企業,為何能迅速出圈?歸根結底,是源自于星動紀元的技術實力。從成立之日起,星動紀元便決定走一條難而正確的道路——軟硬結合,打造物理世界的通用機器人。
通用機器人包括兩個層面:通用大腦和通用本體。
星動紀元在通用大腦的最新成果是端到端原生機器人大模型ERA-42,這是業界首次:僅通過同一個具身大模型驅動全身靈巧——不但能做大動作,還實現了五指靈巧手的類人手操作能力,可靈活運用多種多樣、形態各異的工具完成上百種復雜任務。
ERA-42主要有三大亮點,首先是架構創新,降低了數據成本和真機數據依賴。
對比此前Figure AI出品的VLA模型Helix,ERA-42的優勢很大。對比來看,Helix利用500個小時的遠程操作數據,學會的任務數尚且還不到100個;而星動紀元的ERA-42,只需要約10個小時的真機數據,就能學會上百種任務,堪稱業內領先。
背后的秘訣在于,星動紀元是從第一性原理出發,其人形機器人學習數據時,并非直接模仿行為,而是學習行為背后的因果關系——即做出該行為后,會導致什么樣的結果。這樣就能理解背后統一的物理規律,實現完全泛化。
第二是可跨任務學習,因為ERA-42的泛化能力很強,通過單一策略就能執行新的操作任務。只要輸入一句文本或語音,加上感知硬件數據,就能直接端到端輸出操作,泛化到從未見過的環境或任務。
比如此前星動紀元曾采集簡單的紅黃藍方塊抓取數據,就能抓取任務泛化到從未見過的多樣化物體,比如胡蘿卜和茄子等,相比其他模型算法在泛化任務上顯著提升了成功率。
最后是跨本體遷移,一個VLA大模型,打通單機械臂、雙機械臂、上半身。這意味著L7能實行形態定制,背后依靠的不僅僅是硬件優勢,還體現了其模型的泛化能力。
這同時也體現了星動紀元的硬件能力,實現了通用化和模塊化,就像搭建樂高一樣打造通用本體。自研五款關節模組,包括無框力矩電機、高性能空心杯電機、高功率驅動器及控制單元和低減速比減速器。因為自身掌握著關鍵技術,所以本體能快速更新,2年迭8代。
實現通用模型和通用本體后,這兩大核心部件還面臨著一個共同的問題——數據瓶頸。高質量數據的缺乏,長期困擾著行業,但獲取真機數據成本高,選擇仿真模擬難度又大,數據類型比較單一。
星動紀元解決的策略是,采用海量無標注互聯網視頻數據,結合少量獨家真機數據,全量提取,無損傳輸,讓機器人更高效且低成本地理解物理世界。
低成本獲取場景數據,強化模型大腦,驅動硬核本體。總結來看,星動紀元在具身智能行業,率先跑通了「物理AI時代的閉環飛輪」,即“模型-本體-場景數據”,就像跑通了AI模型時代的“算力、算法、數據”三要素。
這樣的玩家在其他賽道并非沒有先例,比如上一波物理AI浪潮中,最火熱的創業賽道Robotaxi。特斯拉自研FSD模型,打造Model系列為本體,為FSD獲取了海量的場景數據,如今已成為Robotaxi賽道的超級明星。
現在,具身智能取Robotaxi而代之,成為物理AI最性感、最前沿的賽道,而星動紀元率先跑通物理AI的閉環飛輪,成為具身智能領域,代表國產最先進水平、乃至全球最先進水平的新明星。
果然,江山代有才人出。