螞蟻集團近日推出了一款名為“靈光”的全模態通用AI助手,這款產品憑借其創新的多模態交互能力,迅速成為科技領域的焦點。作為行業內首個實現全代碼生成多模態內容的AI工具,“靈光”不僅支持3D、音視頻、圖表、動畫、地圖等多種形式的信息輸出,還通過移動端應用為用戶帶來了前所未有的交互體驗。

“靈光”的核心優勢在于其突破性的對話模式。與傳統文字問答不同,它通過結構化思維將復雜信息轉化為邏輯清晰、表達簡練的回答,并輔以動態3D模型、可交互地圖等可視化內容,使用戶能夠快速理解知識要點。例如,在教育場景中,當用戶詢問某個知識點時,“靈光”不僅能提煉關鍵信息,還能生成3D實物動圖或互動表格,讓抽象概念變得直觀易懂。
這種高效的信息呈現方式背后,是“靈光”基于全代碼生成的多模態輸出能力。所有呈現的圖表、動畫甚至小應用組件,均由模型根據對話情境即時生成,而非依賴預設模板。同時,其多智能體協作的Agentic架構能夠動態調度圖像、3D、動畫等專用模塊,實時協作完成復雜任務,為用戶提供沉浸式體驗。
針對普通用戶需求,“靈光”推出了“閃應用”功能。用戶只需在對話中輸入一句話,即可在1分鐘內、最快30秒生成定制化AI應用。無論是健身計劃工具、旅行規劃器還是健康食譜生成器,均可通過參數自定義實現個性化需求,并支持即用即分享。例如,用戶詢問“溏心蛋要煮多久”時,“靈光”會生成一個時間計算器,用戶可根據雞蛋大小和熟度調整參數;若想了解養車成本,則可生成交互式計算器,自由組合里程、油費等變量得出最優方案。
值得注意的是,“靈光”生成的閃應用并非靜態頁面,而是直接調用大模型等后端能力,實現與外部環境的實時交互。這一特性顯著拓寬了應用場景邊界,使其從單純的信息展示工具升級為具備生產力的智能助手。
另一項創新功能“靈光開眼”則搭載了AGI相機技術,通過實時視頻流解析實現對物理世界的觀察與理解。該功能支持文生圖/視頻、圖生圖/視頻等多種創作模式,在旅游場景中表現尤為突出。用戶只需用手機對準目標建筑,“靈光”即可識別并講解其歷史背景或文化意義,將虛擬信息與現實場景無縫融合。

作為螞蟻集團AGI戰略的重要產品,“靈光”精準捕捉了2025年AI應用向場景化生產力工具轉型的趨勢。其核心理念“讓復雜變簡單”通過將應用開發嵌入日常對話得以實現,重新定義了通用型AI助手的能力邊界。目前,“靈光”已同步登陸安卓與蘋果應用商店,用戶可免費體驗這一革命性工具。
螞蟻集團近年來在AGI領域持續發力,除“靈光”外,還推出了AI醫療管家AQ、布局具身智能靈波科技,其百靈大模型也已躋身萬億參數模型陣營。這一系列舉措標志著螞蟻集團正加速構建以通用人工智能為核心的生態體系。








