財(cái)聯(lián)社12月2日訊(編輯 趙昊)當(dāng)?shù)貢r(shí)間周一(12月1日),美國人工智能初創(chuàng)公司Runway推出Gen-4.5——一款新視頻模型,該模型在獨(dú)立基準(zhǔn)測試中表現(xiàn)優(yōu)于谷歌和OpenAI同類產(chǎn)品。
Gen-4.5能根據(jù)用戶提供的文字提示,通過描述其中的運(yùn)動(dòng)與動(dòng)作,生成高清的視頻內(nèi)容。Runway 表示,這款模型在理解物理規(guī)律、人體動(dòng)作、鏡頭運(yùn)動(dòng)以及因果關(guān)系方面表現(xiàn)突出。
該模型在獨(dú)立AI基準(zhǔn)測試與分析公司Artificial Analysis的Video Arena排行榜上位居第一,而谷歌的Veo 3位列榜單第二,OpenAI的Sora 2 Pro則排在第七。
該排行榜的文本生成視頻模型排名是通過盲選方式得出:人們比較兩個(gè)模型的輸出視頻,并投票選擇更好的一個(gè),投票時(shí)不會(huì)知道對應(yīng)的是哪家公司。
Runway CEO Cristóbal Valenzuela在接受采訪時(shí)表示,“我們僅靠一百人的團(tuán)隊(duì),就擊敗了萬億美元規(guī)模的公司。只要極度專注、勤奮,就能觸及技術(shù)前沿。”
Runway成立于2018年,公司從事AI研究,打造視頻模型和世界模型,即在視頻與觀測數(shù)據(jù)上訓(xùn)練、以更真實(shí)反映物理世界運(yùn)行方式的模型。
目前,Runway的客戶包括媒體機(jī)構(gòu)、影視工作室、品牌方、設(shè)計(jì)師、創(chuàng)作者和學(xué)生,但公司的員工規(guī)模只有120人。
根據(jù)PitchBook數(shù)據(jù),其估值已膨脹至35.5億美元。投資者包括 General Atlantic、Baillie Gifford、英偉達(dá)、Salesforce Ventures等。
Valenzuela表示,Gen-4.5的內(nèi)部代號(hào)是 “David(大衛(wèi))”,象征著圣經(jīng)中“大衛(wèi)戰(zhàn)歌利亞”(以弱勝強(qiáng))的典故。他說,這個(gè)模型“是一個(gè)可以一夜成名、卻花了七年時(shí)間打造的產(chǎn)品”。
“現(xiàn)在確實(shí)是一個(gè)非常有趣的時(shí)間節(jié)點(diǎn),一個(gè)講究效率和研究的時(shí)代正在到來。”Valenzuela說,“我們非常興奮能確保AI不會(huì)被兩三家公司壟斷。”
Runway表示,Gen-4.5正在逐步上線,本周內(nèi)將向所有客戶開放。Valenzuela表示,這是公司接下來發(fā)布的一系列重大更新中的第一個(gè)。
“它將通過Runway的平臺(tái)、其應(yīng)用程序接口(API)以及公司的一些合作伙伴渠道提供。”






