阿里旗下千問APP近日完成重大技術升級,正式接入萬相系列最新模型Wan2.5,在移動端AI視頻創作領域實現突破性進展。該模型不僅成為首個支持音視頻同步輸出的移動端解決方案,更在動作精度、肢體協調性等核心指標上達到行業領先水平,標志著多模態生成技術進入全新發展階段。
技術評測數據顯示,萬相2.5在LMArena權威榜單中以顯著優勢領跑國內市場,其圖生視頻能力位居全球第三。該模型突破傳統單模態限制,實現文本、圖像、視頻、音頻的跨模態理解與生成,用戶輸入任意組合的多媒體素材均可獲得高質量輸出。特別在音畫同步技術上,通過自研的動態對齊算法,使生成內容的口型匹配準確度提升至98.7%,動作流暢度達到專業級水準。
實際應用層面,千問APP推出"一鍵唱跳"功能引發創作熱潮。用戶僅需上傳單張照片并輸入描述文字,系統即可自動生成1080P高清視頻,最長支持10秒動態呈現。測試覆蓋人物、寵物、卡通、文物等20余類主體,均能保持高度自然的肢體表現。更值得關注的是,該功能突破模板化限制,支持用戶自定義融合多張圖片生成特色形象,再通過文字指令實現合唱、群舞等復雜場景的動態演繹。
技術團隊透露,此次升級重點優化了三個維度:首先通過3D骨骼重建技術提升動作精度,使肢體運動軌跡誤差控制在0.5像素以內;其次采用分層渲染引擎增強畫面質感,確保高速運動場景下的細節保留;最后開發智能剪輯模塊,自動匹配鏡頭運動與音樂節奏。這些創新使普通用戶無需專業設備即可創作電影級動態內容。
市場反響超出預期,公測首周下載量突破千萬次,在多個應用商店登頂工具類榜單。社交平臺涌現大量創意作品,從歷史人物現代舞到虛擬偶像演唱會,用戶開發出圖片融合、場景切換、多角色互動等進階玩法。技術觀察家指出,這種"低門檻、高自由度"的創作模式,正在重新定義數字內容生產范式。
據內部人士透露,研發團隊正持續優化模型效率,未來計劃將生成時長擴展至30秒,并增加實時互動功能。隨著多模態技術的普及,AI視頻創作有望從專業領域走向大眾市場,為短視頻、數字營銷、在線教育等行業帶來變革性影響。當前千問APP已開放企業級API接口,為開發者提供定制化解決方案。











