在上海智能工業中心的璀璨舞臺上,一場聚焦于智能科技未來的盛會——“具賦新能,智驅未來”青年科學家成果轉化暨具身智能高質量發展研修會拉開帷幕。
此次活動吸引了眾多青年科學家與業界領袖的參與,共同見證了智能科技領域的最新突破。其中,復旦大學信息科學與工程學院教授、博士生導師陳濤的演講尤為引人注目。他以《超越VLA:新一代生成式人形機器人運動大模型的探索》為題,為與會者帶來了一場思想的盛宴。
陳濤教授在演講中深刻剖析了當前智能科技研究的現狀,指出主流研究大多局限于視覺語言模型(VLA)的框架內。而他的團隊則敢于突破常規,將人體運動生成巧妙地比喻為語言翻譯過程,將復雜動作序列視為由“動作基元”構成的句子。這一新穎的視角為團隊的研究開辟了全新的道路。
經過不懈的努力和技術迭代,陳濤團隊成功研發出具有三大核心突破的動作生成大模型。該模型不僅能夠實現對海量多樣化動作的精準控制,還能僅憑自然語言指令生成復雜的肢體動作。更令人矚目的是,該模型已被成功部署于實體機器人平臺,展現出驚人的運動能力。
為了解決機器人動作與環境脫節的問題,陳濤團隊再次展現出創新思維,研發出三維點云多模態模型。這一技術使機器人能夠真正“理解”空間結構,實現具身問答、路徑規劃等智能交互功能。同時,針對端側算力瓶頸,團隊還研發出獨特的模型壓縮框架,大幅降低了算力需求,為機器人智能化降低了技術門檻。
基于這些突破性成果,陳濤團隊創立了眸深智能科技企業。該企業憑借全球首創的生成式Motion系列技術,在真機部署和模型壓縮領域取得了顯著成就,引起了行業巨頭的廣泛關注和高度認可。這一創新實踐不僅為中國科研力量贏得了國際聲譽,更為全球具身智能產業的發展開辟了新的道路。
在全球人工智能競爭日益激烈的今天,陳濤團隊的探索無疑為具身智能的發展注入了新的活力。他們的研究成果標志著具身智能正從理論探索走向實際應用,為全球智能科技的未來發展注入了無限可能。