AI視頻生成
首次實(shí)現(xiàn)第一視角視頻與人體動(dòng)作同步生成!新框架攻克視角-動(dòng)作對(duì)齊兩大技術(shù)壁壘
一舉攻克了視角-動(dòng)作對(duì)齊與因果耦合兩大瓶頸
CVPR2025視頻生成統(tǒng)一評(píng)估架構(gòu),上交x斯坦福聯(lián)合提出讓MLLM像人類一樣打分
能夠通過(guò)模擬人類的認(rèn)知過(guò)程,建立起連接文本指令與視覺(jué)內(nèi)容的智能評(píng)估體系。
英偉達(dá)讓機(jī)器人「做夢(mèng)學(xué)習(xí)」,靠夢(mèng)境實(shí)現(xiàn)真·從0泛化
利用AI視頻世界模型生成神經(jīng)軌跡,學(xué)會(huì)執(zhí)行22種新任務(wù)
復(fù)旦視頻擴(kuò)散模型綜述:覆蓋300+文獻(xiàn),探討近期研究趨勢(shì)與突破,Github攬星2k+
擴(kuò)散模型在視頻生成、編輯及理解等前沿領(lǐng)域的進(jìn)展
港大字節(jié)最新視頻生成模型刷屏!網(wǎng)友直接RIP市場(chǎng)營(yíng)銷,Sora也不香了
校正流Transformer拿下新SOTA
AI視頻邊生成邊播放!首幀延遲僅1.3秒,生成速度9.4幀/秒|Adobe&MIT新研究
自回歸實(shí)時(shí)視頻生成技術(shù)























