人工智能視頻生成領域迎來重大突破,Runway公司最新推出的Gen-4.5模型在Artificial Analysis評測榜單中登頂,以1247分的ELO評分超越Veo 3/3.1、Kling 2.5和Sora 2 Pro等主流模型,成為當前全球評價最高的視頻生成系統(tǒng)。該模型在運動質(zhì)量、提示詞響應精度和視覺真實感三個核心維度樹立了新標桿,為創(chuàng)作者提供了電影級畫面生成能力與前所未有的創(chuàng)作控制權(quán)。
作為Runway視頻模型系列的第四代半迭代產(chǎn)品,Gen-4.5延續(xù)了前代在生成效率方面的優(yōu)勢,同時通過預訓練數(shù)據(jù)優(yōu)化和后訓練技術革新實現(xiàn)了質(zhì)的飛躍。測試數(shù)據(jù)顯示,該模型在動態(tài)動作生成、時間連貫性控制以及多模式生成精度方面均達到行業(yè)領先水平。創(chuàng)作者現(xiàn)在可以精確控制物體運動軌跡、光影變化和材質(zhì)表現(xiàn),甚至能實現(xiàn)發(fā)絲級細節(jié)的動態(tài)穩(wěn)定呈現(xiàn)。
在物理模擬能力方面,Gen-4.5展現(xiàn)出突破性進展。模型能夠準確還原液體流動動力學、碰撞物理效果和復雜場景中的力學關系。例如在模擬廚房場景時,光線透過窗戶形成的斑駁光影、物體間的投影關系以及不同材質(zhì)表面的反射特性都達到真實攝影水準。當生成北極熊困在冰塊的場景時,系統(tǒng)能精準計算冰塊透明度、光線折射角度以及運動軌跡的物理合理性。
該模型的美學表現(xiàn)力同樣令人矚目,支持從超現(xiàn)實動畫到寫實電影的多種視覺風格無縫切換。在風格化控制測試中,系統(tǒng)既能生成具有90年代復古色調(diào)的奇幻森林場景,也能創(chuàng)造手持紀錄片風格的靈長類動物奔跑畫面。特別在人物表現(xiàn)方面,模型成功捕捉到微表情變化和肢體語言細節(jié),如老人傾斜鏡子的特寫鏡頭中,面部皺紋動態(tài)和手部肌肉運動都呈現(xiàn)得自然真實。
技術架構(gòu)層面,Gen-4.5完全基于NVIDIA GPU構(gòu)建,研發(fā)團隊與英偉達深度合作優(yōu)化了從訓練到推理的全流程效率。借助Hopper和Blackwell系列GPU的算力支持,模型在保持Gen-4級生成速度的同時,將畫面質(zhì)量提升至全新高度。所有訂閱用戶均可使用相同性能參數(shù),確保不同規(guī)模創(chuàng)作者都能獲得頂級視頻生成體驗。
盡管取得顯著進步,研發(fā)團隊坦言模型仍存在局限性。當前版本在因果邏輯呈現(xiàn)、物體持續(xù)性保持和動作成功率校準方面有待改進。例如系統(tǒng)可能生成"門未開啟先出現(xiàn)人物"的時空錯位畫面,或在物體遮擋時出現(xiàn)短暫消失現(xiàn)象。針對這些挑戰(zhàn),Runway已啟動專項研究計劃,重點攻關世界模型技術,旨在建立更精準的物理因果推理系統(tǒng)。
目前Gen-4.5已全面集成圖生視頻、關鍵幀控制和視頻轉(zhuǎn)制等原有功能模塊,用戶可通過官方平臺體驗這項突破性技術。該模型的發(fā)布不僅鞏固了Runway在AI視頻生成領域的領先地位,更為影視制作、廣告創(chuàng)意和數(shù)字藝術等領域開辟了新的創(chuàng)作維度。












