近日,智象未來團隊兩項創新性技術論文被CVPR 2025收錄,為視頻生成與虛擬換裝領域帶來雙重突破。
MotionPro:微動作精準生成
該技術顛覆傳統視頻生成模式,創新采用局部稀疏光流采樣精準捕捉如眨眼、轉頭等微動作,結合運動掩碼嚴格區分物體與相機運動。實驗顯示其視頻-軌跡對齊精度提升19%,用戶滿意度(自然度/動作符合性)分別領先 22% 和 18%,真正實現“所畫即所動”。
論文地址:https://arxiv.org/abs/2505.20287
DPIDM:視頻虛擬換裝新標桿
該方案采用雙分支擴散框架,結合動態姿勢交互模塊(DPI),有效解決了服裝細節保持與視頻一致性的技術難題,顯著提升了虛擬試衣的真實感和時空連貫性。在VVT測試集上,其VFID分數達0.506,較現有方法大幅提升60.5%,為營銷場景提供真實動態試穿體驗。
論文地址:https://arxiv.org/abs/2505.16980