阿里巴巴旗下AI應用夸克近日推出全新AI創作平臺“造點”,以AI生圖與AI生視頻雙引擎驅動,成為國內首個實現音畫同步視頻生成的技術平臺。該平臺率先接入通義萬相Wan2.5模型,支持10秒時長、24幀/秒的1080P高清視頻輸出,其音頻生成功能可自動匹配畫面內容生成人聲、音效及背景音樂,單次生成即可構建完整敘事場景。
在視頻生成技術層面,“造點”平臺通過模型優化實現了復雜運鏡控制能力。創作者可精準調控鏡頭移動、縮放等動態效果,生成的電影級畫面質量已滿足影視制作需求。測試數據顯示,該平臺在人物口型同步、動作連貫性及神態表現上達到行業領先水平,配樂與畫面的融合度較傳統工具提升40%以上。
圖像生成領域,“造點”深度整合Midjourney V7模型核心技術,開發出支持多圖參考、風格代碼輸入及精細化參數調節的創作系統。針對亞洲用戶需求,平臺特別優化了人像生成算法,在中文文字呈現、傳統國風元素渲染等方面形成技術壁壘。電商場景測試表明,商品圖生成效率較傳統方式提升3倍,平面設計師可快速完成多風格創意輸出。
內測階段,平臺涌現出大量現象級作品。其中“中世紀油畫大合唱”系列通過AI重構歷史場景,實現油畫質感與動態人物的完美融合;“文物吃月餅”創意視頻則突破靜態展示局限,讓青銅器、陶瓷等文物以擬人化形態呈現節日場景。專業創作者反饋顯示,跨模型協作流程(Midjourney生圖+Wan2.5制視頻)使單項目制作周期縮短60%,畫質穩定性提升顯著。
用戶體驗設計方面,夸克構建了全終端創作生態。PC端提供專業級工作臺,支持高清素材處理與復雜指令輸入;移動端則主打輕量化操作,開發出“一句話P圖”“AI創意視頻”等快捷功能。日常修圖場景中,濾鏡、美顏、去路人等基礎功能響應速度達毫秒級,3D手辦生成、風格遷移等進階功能完成度超過90%。
技術團隊透露,平臺正在開發多語言音頻生成模塊,未來將支持方言、小語種配音服務。當前用戶可通過zaodian.quark.cn或夸克APP“AI生圖”入口訪問平臺,專業創作者與普通用戶將獲得差異化功能權限。市場分析認為,該平臺的音畫同步技術可能重塑短視頻創作產業鏈,推動AIGC工具從輔助生產向獨立創作演進。