在2025中國國際信息通信展覽會(PT展)的展臺上,具身智能機器人正以全新姿態打破人們對傳統機器人的認知。點擊屏幕輸入祝福語,機器人便能即興彈奏樂曲;當非遺文化邂逅人工智能,手持雙槌的機器人以剛勁舞姿演繹潮汕英歌舞的豪邁。這些場景不再是科技秀場的噱頭,而是具身智能從實驗室走向生產、文旅、服務領域的真實寫照。
相較于展區的熱鬧表演,9月24日舉辦的“具身智能前沿”論壇上,產業界與學術界專家展開了更深刻的思考。中國信息通信研究院人工智能研究所所長魏凱指出,具身智能的本質是人工智能從虛擬世界向物理世界的延伸,“不僅要處理信息,更要搬運原子”。這種轉變意味著,機器人必須在環境不確定、交互復雜的現實場景中完成學習與執行。
為突破這一瓶頸,全國今年新增11個具身智能訓練場,這些封閉測試區如同自動駕駛的“模擬考場”,讓機器人通過反復試錯積累數據。與此同時,國內首個具身智能國際標準已在ITU立項,其意義不僅在于技術規范,更關乎產業國際話語權的爭奪。標準決定數據能否復用、產品能否對接、市場能否形成規模,若缺乏統一體系,具身智能可能重蹈早期AI“碎片化、不可規模化”的覆轍。
技術突破是具身智能落地的另一大挑戰。中國科學院計算技術研究所研究員闞美娜以視障人士導盲場景為例,傳統設備存在提示負擔重、信息單一的問題。她團隊研發的可穿戴系統通過頭盔視覺采集、耳機語音提示、腰帶觸覺反饋的多模態感知,使盲人出行速度提升40%,提示頻率大幅降低。這一案例證明,具身智能不僅能完成任務,更能在交互中傳遞技術溫度。
在更宏觀的技術架構上,中國電信人工智能研究院白辰甲提出“大小腦協同”模式:大腦負責感知、規劃與推理,小腦承擔高速控制與運動執行。這種分工借鑒人類神經系統,既能保證復雜任務的智能決策,又能解決高頻控制對延遲和能耗的嚴格要求。相比單一大模型驅動機器人存在的延遲高、成本大、場景依賴重等問題,大小腦協同通過“思維框架”與“技能落地”的分離,提供了更可行的路徑。
國際上,特斯拉人形機器人、OpenAI機械臂均在此方向探索,但中國產業界更強調“訓練場+標準+架構”的三重結合。這種模式旨在通過可控成本實現規模化復制,避免陷入資本驅動的研發陷阱。
生態共建與算力支撐是具身智能走遠的兩大基石。中國信通院張明鐘介紹,開放社區“鯨智”已匯聚300余家企業和多模態數據集,通過開源降低開發門檻。對于硬件昂貴、數據稀缺的具身智能而言,開源不僅是技術共享,更是降低試錯成本、加速場景普及的關鍵。這如同互聯網早期的開源運動,只有更多參與者加入,生態才能真正壯大。
算力則是具身智能的“隱形地基”。以中國電信“智能云”為例,其通過“算力+平臺+數據+模型+應用”的一體化能力,為機器人提供實時感知與決策的支撐。未來,邊緣算力將扮演更關鍵角色——只有將算力下沉到機器人端,才能實現低時延控制,確保機器人在復雜環境下的實時反應。