螞蟻集團近日正式推出全模態通用AI助手“靈光”,這款創新產品首次在移動端實現“自然語言30秒生成小應用”功能,用戶可對生成內容進行編輯、交互與分享。作為行業首個具備全代碼生成多模態內容能力的AI助手,“靈光”首批上線三大核心功能模塊,覆蓋對話交互、應用生成與視覺創作領域,現已同步登陸安卓與iOS應用商店。
在對話交互層面,“靈光對話”突破傳統問答模式,通過結構化思維引擎將復雜信息轉化為邏輯清晰的呈現方案。該功能支持動態生成3D模型、交互式地圖、音視頻等多元內容,使知識傳遞更具視覺沖擊力。例如教育場景中,用戶詢問物理原理時,系統不僅會分解知識點層次,還會自動生成3D實驗動圖與可操作數據表格,將抽象概念轉化為直觀體驗。這種設計理念源于產品團隊“化繁為簡”的核心理念,通過優化信息組織方式提升認知效率。
應用生成領域,“靈光閃應用”功能開創了全民AI編程的新范式。用戶通過自然語言描述需求,系統可在30秒至1分鐘內構建完整應用,涵蓋健身計劃、旅行規劃、健康管理等生活場景。以烹飪場景為例,用戶詢問“溏心蛋烹飪時間”時,系統會生成參數可調的計算器,允許自定義雞蛋大小與熟度等級;養車咨詢場景中,則能創建成本計算模型,根據里程、油耗等變量生成個性化方案。這些應用并非靜態頁面,而是集成后端模型能力的動態工具,支持實時數據交互與場景延伸。
視覺創作方面,“靈光開眼”功能搭載AGI相機技術,實現物理世界的智能解析與內容再創作。該模塊支持視頻流實時分析,可識別建筑、景觀等物體并提供專業講解,同時具備文生圖、圖生視頻等跨模態創作能力。旅游場景中,用戶拍攝古建筑時,系統能即時生成結構解析圖與歷史背景說明;創作場景下,可將文字描述轉化為動態視頻素材,為內容創作者提供智能化輔助工具。
技術架構層面,“靈光”構建了多智能體協作的Agentic系統,通過動態調度圖像、3D、動畫等專用模塊,實現多模態內容的協同生成。這種架構使系統能根據對話情境實時組合最佳呈現方案,確保輸出結果的完整性與沉浸感。例如在生成旅行規劃應用時,系統會同步調用地圖Agent、日程Agent與預算Agent,確保方案兼具路線合理性與成本可控性。
作為螞蟻集團AGI戰略的重要實踐,“靈光”的推出標志著通用人工智能從技術突破向場景落地的關鍵跨越。該產品精準捕捉2025年AI工具向生產力方向演進的趨勢,通過將開發能力嵌入日常對話流程,重新定義了智能助手的應用邊界。此前螞蟻集團已陸續發布AI醫療管家AQ、布局具身智能領域,其百靈大模型更躋身萬億參數陣營,此次“靈光”的上線進一步完善了其在通用人工智能領域的技術矩陣與生態布局。








