阿里巴巴近日在大模型領域邁出關鍵一步——其旗下通義千問團隊正式成立“機器人與具身智能小組”,目標是將AI從語言交互推向物理世界操作。這一動向并非通過官方聲明披露,而是由通義千問技術負責人林俊旸在社交平臺X上的一句言論引發關注:“多模態模型正在進化為能處理長時序任務的基礎智能體,而它們的終極形態必然是連接虛擬與現實的橋梁。”
32歲的林俊旸是阿里內部具身智能研究的核心人物,這位北大畢業的年輕技術領袖,曾主導M6、OFA等多模態預訓練項目,并帶領團隊開發出Qwen3-Max和QwQ-32B等旗艦模型。如今他掛帥的這支新團隊,核心任務并非制造實體機器人,而是為通義千問賦予“行動力”——使其能通過視覺感知、空間推理和動作規劃,實現對物理設備的精準操控。這標志著阿里的大模型戰略從“語言理解”向“環境交互”的深度轉型。
全球科技巨頭正競相布局具身智能領域。軟銀集團本周宣布以54億美元收購ABB工業機器人業務,英偉達CEO黃仁勛則公開強調“AI+機器人”是數萬億美元級的市場機遇。與傳統機器人研發路徑不同,阿里選擇將具身智能直接嵌入Qwen大模型體系,通過統一的智能底座實現語言與動作能力的協同進化。這種“軟件定義硬件”的模式,已在倉儲自動化領域初顯成效——上個月,阿里領投了自變量機器人1億美元融資,這家專注工業場景的創業公司,正為阿里提供現實世界的驗證場景。
阿里CEO吳泳銘近期指出,未來五年全球AI投資規模將突破4萬億美元。作為回應,阿里云已宣布投入3800億元建設AI基礎設施,而具身智能團隊的成立,正是其將智能能力從云端延伸至物理終端的關鍵布局。從智能家電到工廠協作臂,阿里正利用自身在云計算、物流、IoT等領域的場景優勢,構建“感知-決策-執行”的完整閉環。
這場變革背后,是阿里對AI本質的重新定義。當行業還在比拼模型參數時,阿里已將目光投向“改變世界”的能力——讓AI不僅能回答問題,更能操作設備、優化流程、創造價值。在倉儲機器人自動分揀包裹、智能機械臂精準裝配零件的場景中,通義千問正從“對話者”蛻變為“行動者”。這種轉型不僅關乎技術突破,更可能重塑未來十年的AI產業格局。











