OpenAI近日正式發(fā)布了新一代視頻生成模型Sora2的API接口,為生成式媒體技術(shù)開辟了全新應(yīng)用場(chǎng)景。該模型突破性地實(shí)現(xiàn)了從自然語(yǔ)言或靜態(tài)圖像到動(dòng)態(tài)視頻的轉(zhuǎn)換能力,并首次支持同步生成包含環(huán)境音效的完整視頻片段。
技術(shù)團(tuán)隊(duì)透露,Sora2的核心架構(gòu)采用多模態(tài)擴(kuò)散模型,經(jīng)過(guò)海量視覺(jué)數(shù)據(jù)的深度訓(xùn)練。在三維空間感知、動(dòng)態(tài)物體運(yùn)動(dòng)建模以及場(chǎng)景時(shí)空連續(xù)性等關(guān)鍵指標(biāo)上,該模型展現(xiàn)出顯著優(yōu)勢(shì),使得生成的視頻在畫面流暢度和邏輯合理性方面達(dá)到新高度。
為滿足開發(fā)者多樣化需求,OpenAI通過(guò)Video API開放了五項(xiàng)核心功能。用戶可通過(guò)"創(chuàng)建視頻"端點(diǎn)提交文本描述或參考圖像啟動(dòng)渲染任務(wù);"獲取視頻狀態(tài)"端點(diǎn)支持實(shí)時(shí)查詢?nèi)蝿?wù)進(jìn)度;完成渲染后,可通過(guò)"下載視頻"端點(diǎn)獲取MP4格式文件;"列出視頻"功能提供歷史作品分頁(yè)瀏覽服務(wù);"刪除視頻"端點(diǎn)則允許用戶管理云端存儲(chǔ)內(nèi)容。
產(chǎn)品體系包含兩個(gè)版本:標(biāo)準(zhǔn)版Sora2主打快速響應(yīng),適合社交媒體內(nèi)容創(chuàng)作、產(chǎn)品原型設(shè)計(jì)等需要快速迭代的場(chǎng)景;專業(yè)版Sora2Pro則專注于4K級(jí)影視制作,可生成電影級(jí)畫質(zhì)素材,特別適用于廣告拍攝、影視特效等對(duì)分辨率要求嚴(yán)苛的領(lǐng)域。
定價(jià)策略采用差異化方案:標(biāo)準(zhǔn)版生成720P視頻每秒收費(fèi)0.10美元,專業(yè)版720P視頻每秒0.30美元,1080P高清視頻每秒0.50美元。這種分級(jí)定價(jià)模式使用戶可根據(jù)項(xiàng)目預(yù)算和品質(zhì)要求靈活選擇服務(wù)。
開發(fā)文檔顯示,該API已集成先進(jìn)的錯(cuò)誤處理機(jī)制和批量操作功能。開發(fā)者可通過(guò)平臺(tái)提供的示例代碼快速上手,文檔地址:https://platform.openai.com/docs/guides/video-generation
核心亮點(diǎn):











