阿里巴巴旗下智能搜索應(yīng)用夸克近日推出全新AI創(chuàng)作平臺“造點”,標(biāo)志著國內(nèi)首個支持音畫同步視頻生成的AI創(chuàng)作工具正式上線。該平臺整合了AI圖像生成與AI視頻生成兩大核心功能,通過接入通義萬相Wan2.5模型,實現(xiàn)了從單幀畫面到完整劇情視頻的跨越式發(fā)展。
技術(shù)層面,“造點”平臺實現(xiàn)了三項關(guān)鍵突破:其一,依托通義萬相Wan2.5的升級能力,支持單次生成10秒時長、24幀/秒的1080P高清視頻,畫面質(zhì)量達(dá)到電影級標(biāo)準(zhǔn);其二,創(chuàng)新開發(fā)音畫同步功能,可自動生成與畫面匹配的人聲、音效及背景音樂,使視頻內(nèi)容呈現(xiàn)更完整的敘事邏輯;其三,通過強(qiáng)化指令遵循能力,實現(xiàn)鏡頭運動、場景轉(zhuǎn)換等復(fù)雜視覺效果的精準(zhǔn)控制。在圖像生成方面,平臺引入國際領(lǐng)先的Midjourney V7模型,結(jié)合夸克自主研發(fā)的優(yōu)化算法,為用戶提供高質(zhì)量的靜態(tài)圖像創(chuàng)作支持。
內(nèi)測階段的數(shù)據(jù)顯示,該平臺已吸引超過萬名專業(yè)AIGC創(chuàng)作者參與體驗。期間涌現(xiàn)出多部現(xiàn)象級作品,如“中世紀(jì)油畫大合唱”通過古典繪畫風(fēng)格與現(xiàn)代音樂融合,“文物吃月餅”將歷史文物擬人化呈現(xiàn),“巨物貓咪去旅行”則創(chuàng)造超現(xiàn)實主義視覺奇觀。這些作品普遍具備人物口型精準(zhǔn)同步、動作自然流暢、配樂氛圍契合等特征。參與測試的創(chuàng)作者反饋稱,平臺將Midjourney的圖像生成能力與Wan2.5的視頻生成技術(shù)無縫銜接,特別是音頻視頻同步輸出功能,使創(chuàng)作效率提升近60%。
用戶可通過兩種方式體驗“造點”平臺:PC端用戶訪問zaodian.quark.cn或通過夸克瀏覽器“AI生圖”入口進(jìn)入,可調(diào)用完整版創(chuàng)作工具;移動端用戶通過夸克APP,可體驗“一句話P圖”“AI創(chuàng)意視頻”等輕量化功能。平臺設(shè)計團(tuán)隊表示,未來將持續(xù)優(yōu)化多模態(tài)交互體驗,逐步開放更長時長視頻生成、多鏡頭剪輯等進(jìn)階功能。