近日,阿里巴巴內部傳出消息,其通義千問項目技術負責人林俊旸在社交平臺透露,公司已悄然組建專注于機器人研發與具身智能技術的小型創新團隊。這一動作被視為阿里從純AI軟件服務向硬件實體應用領域拓展的關鍵一步,恰逢全球科技企業競相布局機器人產業的熱潮。
據知情人士介紹,該團隊的核心目標在于探索多模態基礎模型與物理世界的交互可能。林俊旸指出,當前AI技術正從單一模態向具備工具調用能力的智能體(agents)演進,這類系統可通過強化學習實現跨時間維度的復雜推理。"虛擬世界的智能必須突破次元壁",他在公開分享中強調,"真正的價值在于讓AI理解并操作物理環境"。
這位年僅32歲的技術領軍者,目前可能是阿里巴巴集團最年輕的P10級專家。公開資料顯示,林俊旸2015年畢業于北京大學計算機系,同年加入阿里達摩院后,先后主導了M6、OFA、CogView等跨模態預訓練框架的研發。2022年起,他帶領團隊打造的Qwen3-Max和QwQ-32B模型,使通義千問在視覺理解、空間推理等維度達到行業領先水平。
業內人士分析,阿里此次組建硬件團隊具有戰略轉型意義。過去三年間,該公司通過通義千問積累了多模態大模型的核心能力,而機器人與具身智能的研發將推動這些技術從數據空間走向現實場景。值得注意的是,林俊旸團隊此前在CogView項目中展示的圖像生成與理解一體化方案,已為AI與物理設備交互奠定了技術基礎。
據技術文檔披露,新團隊正在攻關的課題包括:如何讓智能體通過攝像頭、傳感器等設備感知三維空間,以及如何建立虛擬訓練環境與真實操作之間的映射關系。這些突破或將重新定義電商物流、智能客服等場景的服務形態。











