Runway Gen-4.5刷屏發(fā)布,把重量塵土和光影都做對了,網(wǎng)友:顛覆
文轉(zhuǎn)視頻基準(zhǔn)1247分,超越現(xiàn)有所有模型
西風(fēng) 鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“視頻生成AGI時刻”,這是Runway Gen-4.5突襲發(fā)布后獲得的評價。
趁著ChatGPT發(fā)布三周年,AI圈開始過年啦(doge)。
最新發(fā)布的Runway Gen-4.5以1247 Elo評分——在Artificial Analysis文本轉(zhuǎn)視頻基準(zhǔn)測試中拿下SOTA,超越所有現(xiàn)有模型。

直接來看效果。
運(yùn)鏡、視角切換很絲滑,文字也能很好地生成:

人照鏡子這種復(fù)雜場景,幾乎看不出破綻:

汽車疾馳塵土飛揚(yáng),還有很真實的顛簸感:

下面這個刷墻視頻也能看到很多細(xì)節(jié),已經(jīng)刷過的地方顏料干了,顏色會稍微淺一點(diǎn):

縱觀Gen 1到Gen4.5兩年迭代,質(zhì)感全面蛻變:

視頻鏈接:https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg
網(wǎng)友們紛紛評價道:“顛覆者”。

尤其是其前所未有的物理和視覺準(zhǔn)確性,不只是更美觀,這下真實內(nèi)容與AI生成內(nèi)容更難以區(qū)分了。

官方表示正在逐步開放Runway Gen-4.5的使用權(quán)限,未來幾天內(nèi)所有用戶都能體驗到。
并且“加量不加價”,會以和當(dāng)前訂閱套餐相近的價格全面開放。

超強(qiáng)物理還原度與視覺精準(zhǔn)度
下面來看官方介紹。
首先,Gen-4.5主打擅長理解并執(zhí)行復(fù)雜的序列式指令。
換句話說,你可在單個提示詞中精準(zhǔn)指定詳細(xì)的鏡頭運(yùn)鏡方式、復(fù)雜的場景構(gòu)圖、事件的精確時間節(jié)點(diǎn),以及細(xì)微的氛圍變化。

Gen-4.5既保留了Gen-4在速度和效率上的核心優(yōu)勢,又實現(xiàn)了畫質(zhì)層面的突破性提升。

對比Gen-2,運(yùn)行相同的提示be like:

其次,物理還原度與視覺精準(zhǔn)度也是一大核心賣點(diǎn)。
其生成的視頻物體移動具備符合現(xiàn)實的重量感與動量特征,物體表面呈現(xiàn)出與現(xiàn)實世界一致的物理特性。

街頭滑滑板效果很逼真:

速度提升,背景模糊處理也很有質(zhì)感:
當(dāng)然,遵循還是突破物理定律,全靠你的創(chuàng)作構(gòu)想。
你也可以讓小羊拉北極熊(doge):
各種風(fēng)格都能駕馭:
3D繪畫風(fēng)格也可以:
在網(wǎng)友們都關(guān)心的可控性方面,官方表示除了文本生成視頻,會為Gen-4.5適配所有已有的控制模式,比如圖片轉(zhuǎn)視頻、關(guān)鍵幀生成、視頻轉(zhuǎn)視頻等。
值得一提的是,官方還毫不避諱模型局限性:
盡管該模型的能力實現(xiàn)了質(zhì)的飛躍,但仍存在一些局限性,例如因果推理與物體恒存性(即理解“物體即使看不見也依然存在”的認(rèn)知能力)方面表現(xiàn)不足。
好消息是,目前團(tuán)隊正在進(jìn)行相關(guān)優(yōu)化了。
最后再來看兩個長視頻展示~
視頻鏈接:
https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg
- 知名數(shù)學(xué)家辭職投身AI創(chuàng)業(yè):老板是00后華人女生2025-12-06
- 靈光 “一閃”,330萬個“閃應(yīng)用”已創(chuàng)建2025-12-02
- AI也會被DDL逼瘋!正經(jīng)研究發(fā)現(xiàn):壓力越大,AI越危險2025-12-01
- 月之暗面公開RL訓(xùn)練加速方法:訓(xùn)練速度暴漲97%,長尾延遲狂降93%2025-11-27




