Runway Gen-4.5刷屏發(fā)布,把重量塵土和光影都做對(duì)了,網(wǎng)友:顛覆
文轉(zhuǎn)視頻基準(zhǔn)1247分,超越現(xiàn)有所有模型
西風(fēng) 鷺羽 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
“視頻生成AGI時(shí)刻”,這是Runway Gen-4.5突襲發(fā)布后獲得的評(píng)價(jià)。
趁著ChatGPT發(fā)布三周年,AI圈開(kāi)始過(guò)年啦(doge)。
最新發(fā)布的Runway Gen-4.5以1247 Elo評(píng)分——在Artificial Analysis文本轉(zhuǎn)視頻基準(zhǔn)測(cè)試中拿下SOTA,超越所有現(xiàn)有模型。

直接來(lái)看效果。
運(yùn)鏡、視角切換很絲滑,文字也能很好地生成:

人照鏡子這種復(fù)雜場(chǎng)景,幾乎看不出破綻:

汽車(chē)疾馳塵土飛揚(yáng),還有很真實(shí)的顛簸感:

下面這個(gè)刷墻視頻也能看到很多細(xì)節(jié),已經(jīng)刷過(guò)的地方顏料干了,顏色會(huì)稍微淺一點(diǎn):

縱觀Gen 1到Gen4.5兩年迭代,質(zhì)感全面蛻變:

視頻鏈接:https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg
網(wǎng)友們紛紛評(píng)價(jià)道:“顛覆者”。

尤其是其前所未有的物理和視覺(jué)準(zhǔn)確性,不只是更美觀,這下真實(shí)內(nèi)容與AI生成內(nèi)容更難以區(qū)分了。

官方表示正在逐步開(kāi)放Runway Gen-4.5的使用權(quán)限,未來(lái)幾天內(nèi)所有用戶都能體驗(yàn)到。
并且“加量不加價(jià)”,會(huì)以和當(dāng)前訂閱套餐相近的價(jià)格全面開(kāi)放。

超強(qiáng)物理還原度與視覺(jué)精準(zhǔn)度
下面來(lái)看官方介紹。
首先,Gen-4.5主打擅長(zhǎng)理解并執(zhí)行復(fù)雜的序列式指令。
換句話說(shuō),你可在單個(gè)提示詞中精準(zhǔn)指定詳細(xì)的鏡頭運(yùn)鏡方式、復(fù)雜的場(chǎng)景構(gòu)圖、事件的精確時(shí)間節(jié)點(diǎn),以及細(xì)微的氛圍變化。

Gen-4.5既保留了Gen-4在速度和效率上的核心優(yōu)勢(shì),又實(shí)現(xiàn)了畫(huà)質(zhì)層面的突破性提升。

對(duì)比Gen-2,運(yùn)行相同的提示be like:

其次,物理還原度與視覺(jué)精準(zhǔn)度也是一大核心賣(mài)點(diǎn)。
其生成的視頻物體移動(dòng)具備符合現(xiàn)實(shí)的重量感與動(dòng)量特征,物體表面呈現(xiàn)出與現(xiàn)實(shí)世界一致的物理特性。

街頭滑滑板效果很逼真:

速度提升,背景模糊處理也很有質(zhì)感:
當(dāng)然,遵循還是突破物理定律,全靠你的創(chuàng)作構(gòu)想。
你也可以讓小羊拉北極熊(doge):
各種風(fēng)格都能駕馭:
3D繪畫(huà)風(fēng)格也可以:
在網(wǎng)友們都關(guān)心的可控性方面,官方表示除了文本生成視頻,會(huì)為Gen-4.5適配所有已有的控制模式,比如圖片轉(zhuǎn)視頻、關(guān)鍵幀生成、視頻轉(zhuǎn)視頻等。
值得一提的是,官方還毫不避諱模型局限性:
盡管該模型的能力實(shí)現(xiàn)了質(zhì)的飛躍,但仍存在一些局限性,例如因果推理與物體恒存性(即理解“物體即使看不見(jiàn)也依然存在”的認(rèn)知能力)方面表現(xiàn)不足。
好消息是,目前團(tuán)隊(duì)正在進(jìn)行相關(guān)優(yōu)化了。
最后再來(lái)看兩個(gè)長(zhǎng)視頻展示~
視頻鏈接:
https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg




