美國(guó)人工智能研究機(jī)構(gòu)OpenAI近期推出視頻生成模型Sora 2及其配套社交應(yīng)用,標(biāo)志著視頻生成技術(shù)進(jìn)入新階段。該模型在物理模擬精準(zhǔn)度、多鏡頭連貫性及多模態(tài)交互能力上實(shí)現(xiàn)突破,能夠同步生成與畫(huà)面匹配的環(huán)境音效、人物對(duì)話,并確保口型與語(yǔ)音精準(zhǔn)同步。據(jù)OpenAI披露,Sora 2上線五日內(nèi)下載量突破百萬(wàn)次,增速超越此前現(xiàn)象級(jí)產(chǎn)品ChatGPT。
技術(shù)層面,Sora 2通過(guò)原生視頻-音頻生成架構(gòu),解決了傳統(tǒng)模型在物理運(yùn)動(dòng)模擬中的常見(jiàn)缺陷。例如,模型可準(zhǔn)確呈現(xiàn)物體碰撞、流體運(yùn)動(dòng)等復(fù)雜物理現(xiàn)象,同時(shí)支持跨鏡頭場(chǎng)景的無(wú)縫銜接,確保多視角切換時(shí)人物特征、環(huán)境細(xì)節(jié)保持一致。其劇情生成功能可根據(jù)簡(jiǎn)單文本提示自動(dòng)補(bǔ)充合理情節(jié),顯著提升創(chuàng)作效率。
全球科技企業(yè)加速布局。xAI推出的Grok Imagine v0.9模型實(shí)現(xiàn)靜態(tài)圖像到動(dòng)態(tài)視頻的轉(zhuǎn)化,并集成背景音樂(lè)與對(duì)話生成功能;谷歌Veo 3.1模型可生成8秒720p分辨率帶音軌視頻,在細(xì)節(jié)處理上較前代顯著優(yōu)化。行業(yè)專(zhuān)家認(rèn)為,當(dāng)前文生視頻技術(shù)已具備商業(yè)化基礎(chǔ),圍繞全能型生成器的競(jìng)爭(zhēng)日趨激烈。
證券機(jī)構(gòu)建議關(guān)注三大投資方向:其一,算力需求隨模型規(guī)模化落地持續(xù)爆發(fā),推動(dòng)硬件架構(gòu)多元化發(fā)展;其二,AIoT設(shè)備向自主決策進(jìn)化,AR眼鏡、人形機(jī)器人、AI手機(jī)進(jìn)入放量周期;其三,C端流量增長(zhǎng)反哺B端效率提升,金融、醫(yī)療、教育領(lǐng)域形成"數(shù)據(jù)-模型-收益"的良性循環(huán)。華泰證券指出,技術(shù)優(yōu)化將降低影視、廣告等行業(yè)內(nèi)容生產(chǎn)成本,催生新型商業(yè)模式。
光大證券分析認(rèn)為,Sora 2的技術(shù)突破顯示視頻生成領(lǐng)域仍有巨大提升空間,專(zhuān)業(yè)級(jí)商業(yè)化創(chuàng)作成為下一階段競(jìng)爭(zhēng)焦點(diǎn)。算力與存儲(chǔ)需求增長(zhǎng)將帶動(dòng)相關(guān)基礎(chǔ)設(shè)施投資,形成技術(shù)進(jìn)步與市場(chǎng)擴(kuò)張的雙向驅(qū)動(dòng)。











