滾動(dòng)資訊

大消費(fèi)板塊集體走強(qiáng)，“老登股”投資價(jià)值能否借此重?zé)ü獠剩?/a>11-11

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

Vidu Q2月底登場(chǎng)：參考生功能升級(jí)，與Sora 2正面交鋒展實(shí)力

時(shí)間：2025-10-11 03:39:00 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

國(guó)慶假期期間，視頻生成領(lǐng)域迎來新一輪技術(shù)熱潮，各大科技公司紛紛推出創(chuàng)新產(chǎn)品，推動(dòng)行業(yè)進(jìn)入全新發(fā)展階段。OpenAI率先發(fā)布旗艦視頻生成模型Sora 2，并同步推出Sora應(yīng)用程序，其"Cameo（引用角色功能）"在上線首周下載量便超越ChatGPT，引發(fā)市場(chǎng)廣泛關(guān)注。緊隨其后，馬斯克旗下xAI推出Imagine v0.9，以20秒內(nèi)快速生成視頻且全用戶免費(fèi)開放的特點(diǎn)作出回應(yīng)。國(guó)內(nèi)AI視頻創(chuàng)業(yè)公司生數(shù)科技也宣布，其Vidu Q2參考生功能將于本月底正式亮相，為行業(yè)注入新的活力。

在這場(chǎng)技術(shù)競(jìng)賽中，"引用角色形象"成為視頻生成領(lǐng)域的關(guān)鍵突破方向。Sora應(yīng)用的Cameo功能和Vidu的參考生功能，均通過支持上傳參考圖生成視頻的方式，有效解決了視頻生成中的情節(jié)割裂、角色行為矛盾等問題。這種技術(shù)路徑不僅提升了視頻生成的可控性，還為創(chuàng)作者提供了更高的自由度。

作為全球"參考生視頻"概念的首創(chuàng)者，生數(shù)科技早在2024年9月便推出了Vidu的參考生視頻功能。隨著Sora應(yīng)用程序的落地，中美在AI視頻領(lǐng)域的技術(shù)與產(chǎn)品競(jìng)爭(zhēng)正式進(jìn)入白熱化階段。Vidu Q2參考生視頻功能的推出，不僅降低了普通用戶的使用門檻，還滿足了專業(yè)創(chuàng)作者及廣告電商、影視動(dòng)漫等To B領(lǐng)域?qū)σ恢滦浴⒕珳?zhǔn)性和性價(jià)比的高要求。

當(dāng)前，視頻生成技術(shù)仍面臨諸多挑戰(zhàn)。相較于文字和圖像生成，視頻生成需要處理連續(xù)畫面中的敘事完整性，時(shí)長(zhǎng)增加時(shí)易出現(xiàn)情節(jié)斷裂、角色行為不一致等問題。模型的理解能力和記憶能力限制，以及普通用戶難以準(zhǔn)確使用專業(yè)術(shù)語的痛點(diǎn)，進(jìn)一步加劇了視頻生成的可控性難題。引用角色形象的技術(shù)思路，成為解決這些問題的有效路徑。

Sora App中的Cameo功能允許用戶通過簡(jiǎn)短視頻和音頻錄制，將自己或授權(quán)他人帶入生成的場(chǎng)景中，實(shí)現(xiàn)角色參考。而Vidu的"參考生"功能則覆蓋角色、環(huán)境、道具等更多要素，為創(chuàng)作者提供更高的自由度和控制力。例如，Vidu Q2支持上傳最多7張照片，包括人物、物體、場(chǎng)景等不同組合，并在保持參考圖特征的同時(shí)，更貼近用戶原始輸入。

在實(shí)際效果對(duì)比中，Vidu Q2參考生功能展現(xiàn)出顯著優(yōu)勢(shì)。以介紹皇冠的提示詞為例，Sora 2生成的視頻中皇冠樣式發(fā)生改變，甚至出現(xiàn)憑空漂浮的反常理畫面；而Vidu Q2生成的視頻中，主體人物始終手握皇冠，人物形象、皇冠樣式及麥克風(fēng)位置保持一致，眼神隨皇冠移動(dòng)而變化，增強(qiáng)了互動(dòng)感。盡管Vidu Q2未生成音頻，但其在主體一致性上的表現(xiàn)更為突出。

在另一個(gè)案例中，提示詞要求"女孩閉上眼睛，身后的云朵飛舞，發(fā)出金光"。Sora 2生成的人臉與參考圖差異較大，而Vidu Q2則更好地保持了與參考圖人物的一致性。這些對(duì)比表明，Vidu參考生功能突破了單一角色引用的局限，實(shí)現(xiàn)了角色、道具、場(chǎng)景、特效等全要素參考，同時(shí)在主體一致性上保持領(lǐng)先。

據(jù)悉，Vidu Q2模型的升級(jí)將AI視頻生成推向新階段，其參考生功能在原有基礎(chǔ)上實(shí)現(xiàn)了質(zhì)的突破。升級(jí)后的版本在視頻一致性上保持全球領(lǐng)先，生成速度更快，價(jià)格更優(yōu)惠，且對(duì)國(guó)內(nèi)用戶更加友好。內(nèi)測(cè)體驗(yàn)顯示，Vidu Q2在廣告電商、知識(shí)科普、寵物擬人化劇情等多個(gè)場(chǎng)景中均表現(xiàn)出色，能夠滿足鏡頭角度轉(zhuǎn)換、人物動(dòng)作變化等需求，生成速度僅需十幾秒即可完成5秒視頻片段。

例如，在廣告電商類案例中，Vidu Q2成功復(fù)現(xiàn)了美妝博主眼睛上的亮片、使用的美妝蛋及臥室梳妝臺(tái)等細(xì)節(jié)，人物運(yùn)動(dòng)和鏡頭切換時(shí)未出現(xiàn)變形。在知識(shí)科普類案例中，皮革紋理、工具擺放位置保持不變，鏡頭切換精準(zhǔn)。在寵物擬人化劇情案例中，客廳背景、道具位置及柯基帽子均與參考圖一致，鏡頭運(yùn)鏡符合提示詞要求。這些案例充分展示了Vidu Q2參考生功能的實(shí)用性和創(chuàng)新性。

隨著Vidu Q2參考生視頻功能的發(fā)布倒計(jì)時(shí)開啟，其將用實(shí)際表現(xiàn)證明中國(guó)視頻大模型的技術(shù)實(shí)力和落地價(jià)值。這場(chǎng)視頻生成競(jìng)賽不僅推動(dòng)了技術(shù)的進(jìn)步，也為創(chuàng)作者提供了更高效的工具，助力視頻生成領(lǐng)域邁向新的發(fā)展高度。

11-11

阿里巴巴與萬豪強(qiáng)強(qiáng)聯(lián)手，AI賦能共繪旅行個(gè)性化體驗(yàn)新藍(lán)圖

11-11

東風(fēng)奕派eπ007+高能登場(chǎng)，以“奕派速度”為年輕人解鎖百萬級(jí)出行新體驗(yàn)

11-11

商湯科技發(fā)布SenseNova-SI系列模型，空間智能領(lǐng)域表現(xiàn)超GPT-5等頂尖模型

11-11

維基百科為應(yīng)對(duì)流量下滑呼吁AI開發(fā)者“負(fù)責(zé)”使用并引入付費(fèi)平臺(tái)

11-11

12歲孩童AI圖引發(fā)小區(qū)恐慌：AI娛樂需守界，莫讓玩笑毀信任

11-11

王自如稱內(nèi)存漲價(jià)致手機(jī)或提價(jià) 今年入手旗艦機(jī)或成好時(shí)機(jī)

11-11

理想增程SUV交付量破140萬！2025款L6-L9四大系列煥新登場(chǎng) 智能配置全面升級(jí)

11-11

首屆中國(guó)（國(guó)際）機(jī)器人辯論大賽落幕松延動(dòng)力小諾隊(duì)奪冠引關(guān)注

決賽分為小組賽、季軍爭(zhēng)奪戰(zhàn)與冠軍爭(zhēng)奪戰(zhàn)三個(gè)環(huán)節(jié)，辯題涵蓋宇宙哲學(xué)、人類天賦、戰(zhàn)爭(zhēng)本質(zhì)與人工智能倫理等前沿議題，充分考驗(yàn)機(jī)器人辯手的邏輯推理、語義理解與多模態(tài)交互能力。決賽階段，各隊(duì)機(jī)器人則在無人干預(yù)的情況下…

11-11

嵐圖泰山來襲：外觀大氣內(nèi)飾豪華能否在高端SUV市場(chǎng)分一杯羹？

11-11

13.99萬起！東風(fēng)奕派eπ007+攜百萬級(jí)體驗(yàn)入場(chǎng)，重塑14萬級(jí)轎跑新格局

11-11

東風(fēng)奕派eπ007+上市，14萬級(jí)配激光雷達(dá)四驅(qū)，打造年輕專屬轎跑

11-11

東風(fēng)奕派eπ007+深圳上市，智能配置拉滿，助力品牌沖刺百萬銷量

11-11

東風(fēng)奕派eπ007+攜激光雷達(dá)與8295P芯片入場(chǎng)，13.99萬起能否攪動(dòng)年輕轎跑市場(chǎng)？

11-11

第五代瑞虎8重磅登場(chǎng)，9.29萬起！家庭實(shí)用好伙伴，實(shí)力不容小覷

11-11

點(diǎn)擊查看更多 +

全站最新

周末帶娃新玩法！探秘比亞迪新能源，與科大訊飛AI互動(dòng)，解鎖地質(zhì)寶石奧秘

同濟(jì)“青松計(jì)劃”赴合肥：探智能出行與AI前沿，助碩博生鋪就職業(yè)新路

東風(fēng)奕派eπ007+上市，13.99萬起享八重禮，純電增程雙版本亮點(diǎn)多

13.99萬元起享“百萬級(jí)”體驗(yàn)！東風(fēng)奕派eπ007+上市，顏值性能品質(zhì)全拉滿

京東埃安UT super價(jià)格破局，布局一站式服務(wù)，欲重構(gòu)新能源汽車生態(tài)

買了新能源汽車后，我成了“電價(jià)偵探”“續(xù)航焦慮者”與“OTA期待者”

熱門內(nèi)容

本欄最新

東風(fēng)奕派eπ007+高能登場(chǎng)，以“奕派速度”為年輕人解鎖百萬級(jí)出行新體驗(yàn)

嵐圖泰山來襲：外觀大氣內(nèi)飾豪華能否在高端SUV市場(chǎng)分一杯羹？

13.99萬起！東風(fēng)奕派eπ007+攜百萬級(jí)體驗(yàn)入場(chǎng)，重塑14萬級(jí)轎跑新格局

東風(fēng)奕派eπ007+上市，14萬級(jí)配激光雷達(dá)四驅(qū)，打造年輕專屬轎跑

東風(fēng)奕派eπ007+深圳上市，智能配置拉滿，助力品牌沖刺百萬銷量

東風(fēng)奕派eπ007+攜激光雷達(dá)與8295P芯片入場(chǎng)，13.99萬起能否攪動(dòng)年輕轎跑市場(chǎng)？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Vidu Q2月底登場(chǎng)：參考生功能升級(jí)，與Sora 2正面交鋒展實(shí)力

日本精品一区二区三区高清久久