螞蟻集團近日正式推出全模態(tài)通用AI助手“靈光”,在移動端實現(xiàn)“30秒生成小應(yīng)用”的突破性功能,支持用戶編輯、交互與分享。這款產(chǎn)品不僅成為業(yè)內(nèi)首個具備全代碼生成多模態(tài)內(nèi)容能力的AI助手,更通過三大核心功能重新定義了通用型AI的生產(chǎn)力邊界。
“靈光對話”功能通過結(jié)構(gòu)化思維引擎,將復(fù)雜信息轉(zhuǎn)化為邏輯清晰的分層展示。例如在教育場景中,用戶詢問科學(xué)原理時,系統(tǒng)不僅能提煉核心知識點,還能自動生成3D動態(tài)模型、交互式圖表等可視化內(nèi)容。這種呈現(xiàn)方式使知識傳遞效率提升數(shù)倍,尤其在需要空間理解的學(xué)科領(lǐng)域表現(xiàn)突出。
產(chǎn)品架構(gòu)層面,靈光采用多智能體協(xié)作的Agentic系統(tǒng),動態(tài)調(diào)度圖像生成、3D建模、動畫渲染等專用模塊。當(dāng)用戶發(fā)起請求時,系統(tǒng)會實時組合多個專業(yè)Agent的能力,確保輸出結(jié)果既包含精準信息又具備沉浸式體驗。這種設(shè)計突破了傳統(tǒng)AI助手單一模態(tài)輸出的局限,實現(xiàn)了從文本到三維空間的完整覆蓋。
最具創(chuàng)新性的“閃應(yīng)用”功能,讓普通用戶通過自然語言對話即可創(chuàng)建個性化工具。用戶輸入“計算溏心蛋烹飪時間”后,系統(tǒng)能在30秒內(nèi)生成包含雞蛋大小、熟度選擇等參數(shù)的交互式計算器。養(yǎng)車成本、健身計劃等場景同樣適用,所有應(yīng)用均支持實時調(diào)用后端模型,實現(xiàn)數(shù)據(jù)動態(tài)更新與外部系統(tǒng)交互。
“靈光開眼”功能搭載的AGI相機技術(shù),將物理世界觀察能力推向新高度。在旅游場景中,用戶對準古建筑拍攝時,系統(tǒng)能實時識別結(jié)構(gòu)特征并疊加歷史信息解說;創(chuàng)作模式下支持文生視頻、圖生3D等跨模態(tài)轉(zhuǎn)換,為內(nèi)容創(chuàng)作者提供全鏈路工具鏈。這種實時解析能力,標志著AI從數(shù)字世界向物理空間的滲透取得關(guān)鍵進展。
作為螞蟻集團AGI戰(zhàn)略的重要落地產(chǎn)品,靈光的研發(fā)團隊突破了多模態(tài)代碼生成、智能體協(xié)作等核心技術(shù)瓶頸。該產(chǎn)品已同步上線安卓與iOS平臺,其“讓復(fù)雜變簡單”的設(shè)計理念,正在重塑人機交互的底層邏輯。此前螞蟻集團已發(fā)布AI醫(yī)療管家、布局具身智能領(lǐng)域,此次靈光的推出,進一步驗證了其在通用人工智能領(lǐng)域從基礎(chǔ)研究到場景落地的完整能力鏈。












