何愷明組三位本科生領銜!持續聚焦Flow模型,突破歸一化流生成效率瓶頸
速度提升兩個數量級
魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI
何愷明團隊新作,持續聚焦Flow模型。
與MeanFlow對流匹配的優化不同,這次主要旨在解決歸一化流在生成模型中的局限。

論文提出名為雙向歸一化流(BiFlow)的新框架,通過解耦前向過程——將數據映射為噪聲,和逆向過程——把噪聲再轉回來生成圖片,成功打破了傳統歸一化流生成模型效率低下的問題。
值得一提的是,論文的三位一作分別是來自清華姚班和MIT的本科生。
BiFlow:逆向過程不必是前向過程的精確逆運算
歸一化流方法(NFs)已經成為生成建模的一種原則性框架。
標準的歸一化流包含前向過程和逆向過程:
前向過程將數據映射為噪聲,逆向過程則通過對前向過程求逆來生成樣本。
傳統的NF模型有一個硬性規定,逆向過程必須是前向過程的精確逆運算——要像鑰匙和鎖一樣完全匹配。這就導致了兩個問題:
- 模型設計受限:因為要保證 “可逆”,不能使用很多強大的通用架構(比如視覺Transformer),得特意設計復雜結構;
- 推理速度慢:由于架構約束,歸一化流通常需要比其他模型更深、更寬的網絡才能達到相似效果。以TARFlow為例,逆向生成時需要一步步按順序計算,并且無法并行加速。

BiFlow的核心創新就在于,打破了“逆向過程必須是前向過程的精確逆運算”這一規則。
設計思路是這樣的:
BiFLow解耦了前向過程和逆向過程的設計。
前向模型仍然使用易于訓練的流模型(如改進版TARFlow),將數據映射為噪聲。
逆向模型則引入一個可學習的獨立模型,來近似前向模型的逆映射。
由此,逆向模型不需要是前向模型的數學精確逆,可以使用任意架構(如非因果的雙向Transformer)來實現并行化和高效計算。
逆向模型也可以在單次前向傳遞中,直接從噪聲生成圖像,無需像自回歸模型那樣逐步生成。
具體來說,何愷明團隊的這篇新論文提出了三項關鍵技術。
隱藏層對齊(Hidden Alignment)
為了解決獨立逆向模型容易跑偏的問題,論文提出了一種新的損失函數策略,既利用了全軌跡監督,又保持了架構的靈活性:
- 利用前向過程的完整中間狀態軌跡(數據→半噪聲→純噪聲)作為監督信號;
- 通過可學習的投影頭,將逆向模型的中間狀態與前向狀態對齊。

學習去噪(Learned Denoising)
傳統NF方法(如TARFlow)推理時需要額外去噪,會增加計算量。
BiFlow將去噪步驟直接整合進逆向模型的一個額外模塊中,實現了“端到端”的從噪聲到清晰數據的映射,消除了額外的推理開銷。

訓練時無分類器引導(Training-time CFG)
為了在推理時保持單步生成(1-NFE)的高效性,BiFlow在訓練階段就引入了無分類器引導(CFG),讓模型學習以CFG比例為條件的生成,從而避免了推理時計算兩次前向傳播的成本。
實驗結果:速度提升兩個數量級
實驗結果顯示,在生成質量方面,BiFlow在ImageNet 256×256數據集上,取得了2.39的FID分數,刷新目前基于NF方法的SOTA。

在推理速度方面,相比于基線方法(改進版TARFlow),BiFlow的采樣速度提升了兩個數量級(在TPU上快697倍)。

另外,BiFlow憑借雙向映射特性,無需額外訓練即可實現圖像修復和類別編輯兩類圖像編輯任務。
本科生領銜
BiFlow有兩位項目負責人。
陸伊煬,江蘇南通人,清華姚班大二本科生,目前在MIT計算機科學與人工智能實驗室(CSAIL)實習,導師是何愷明,主要研究方向為計算機視覺和深度生成模型。

高中時期,他是物理競賽生,曾以江蘇選手中第一名、全國第九名的成績,在2022年獲得了第三十九屆全國中學生物理競賽(CPhO)金牌。
Qiao Sun,MIT大二本科生,目前是何愷明計算機視覺課題組的本科生研究機會項目(UROP)學生。研究主要集中在生成模型方面,如擴散模型、流匹配等。

Qiao Sun高中畢業于上海中學,是2023年國際數學奧林匹克競賽(IMO)金牌得主。
論文的另一位一作是王銜邦,今年剛從人大附中畢業,進入MIT學習。他的導師同樣是何愷明。

王銜邦還是一名雙料競賽生,在2024年IMO上摘得金牌,還在2021年和2022年獲得過全國信息學奧林匹克競賽的銀牌。
論文地址:
https://arxiv.org/abs/2512.10953v1
— 完 —
- 蘋果芯片主管也要跑路!庫克被曝出現健康問題2025-12-07
- 世界模型和具身大腦最新突破:90%生成數據,VLA性能暴漲300%|開源2025-12-02
- 谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?2025-12-05
- 90后華人副教授突破30年數學猜想!結論與生成式AI直接相關2025-11-26



