字節Seed發布PXDesign:蛋白設計效率提升十倍,進入實用新階段
24小時內即可生成數百個高質量的候選蛋白
字節Seed團隊 投稿
量子位 | 公眾號 QbitAI
AI蛋白設計進入新階段!
最近,字節跳動Seed團隊多模態生物分子結構大模型(Protenix)項目組提出了一種可擴展的蛋白設計方法,叫做PXDesign。

在實際測試中,PXDesign展現出極高的效率,24小時內即可生成數百個高質量的候選蛋白,生成效率較業界主流方法提升約10倍,并在多個靶點上實現了20%–73%的濕實驗成功率,達到了當前領域的領先水平。
要知道,蛋白設計一直是個成功率很低的任務,即便是DeepMind推出的AlphaProteo,憑借其AlphaFold系列模型,在相同靶點上的成功率也僅為 9%-33%。
此外,Protenix團隊還推出了公開免費的binder在線設計服務,讓科學家無需自建復雜流程,就能直接調用這一能力,加速科研探索。

背景與意義
蛋白質是生命活動的基石。2024年諾貝爾化學獎一半授予David Baker(計算蛋白設計),另一半聯合授予Demis Hassabis與John Jumper(蛋白結構預測)。
這也凸顯了科學家關注的挑戰:不僅要“預測結構”,更要能“反向設計”?—— 根據功能需求,創造全新的蛋白質。
其中,設計能精確結合目標蛋白的結合蛋白(binder),有望為癌癥、感染等重大疾病帶來全新療法,是領域研究的熱點。
過去,蛋白設計依賴高通量實驗篩選,往往要從數萬候選里才能淘出少數有效分子,成本高、效率低。而近幾年,深度學習的突破讓蛋白設計迎來了新機遇。
在這一背景下,字節跳動Seed團隊的Protenix項目組提出了新一代蛋白設計方法PXDesign。
實驗室驗證表明,PXDesign在多個靶點上取得了20–73%的實驗成功率,在相同靶點相較DeepMind的AlphaProteo提升2–6 倍,達到了當前領域最高水準。

這意味著,科學家們不用再像過去那樣依賴昂貴的高通量篩選實驗,只需要低通量的常規實驗,就能直接得到能緊緊抓住目標蛋白的binder。
更重要的是,團隊還提供了公開免費的網頁服務,使得蛋白設計有望成為常規科研工具的一部分,讓科學家更快地用全新的蛋白解決挑戰性問題。
PXDesign的突破:“生成+過濾”組合拳
Protenix團隊是怎么做到的?
答案在于他們打出了一套“生成+過濾”的組合拳。
生成:快速高效
想要找到合適的binder,先要讓模型給出大量的候選設計。
目前主流有兩大技術路線:
Hallucination:以BindCraft為代表,利用AlphaFold2等結構預測模型作為“評分器”,通過反向傳播不斷優化隨機序列,直到得到高置信度的設計。
Diffusion:以RFdiffusion為代表,直接從復合物數據中學習規律,從噪聲逐步生成自然界中不存在的binder結構,再預測對應的氨基酸序列。
Protenix團隊系統性探索了兩種技術路線,構建了PXDesign-d(Diffusion)和PXDesign-h(Hallucination)?兩個方案。
在相同框架下,兩者均超過了現有主流方法,而基于Diffusion的PXDesign-d在生成質量、通量和結構多樣性方面表現最佳,更適合挑戰性任務上的大規模生成。尤其是在VEGF-A、H1、TNF-α等高難度靶點上,PXDesign-d的效率較以往方法提升數倍甚至數百倍。
PXDesign-d的優勢既來自模型架構,也源于技術路線的差異。
同類Diffusion的對比:PXDesign-d采用復雜度為 O(N2) 的DiT網絡結構,而RFdiffusion中還包含O(N3) 的模塊。這讓PXDesign-d可以在更大的結構數據上訓練,生成效率也更高。
對比Hallucination路線:Hallucination方法每一步都要調用一次O(N3) 的結構預測模型,并通過反向傳播更新參數,需要多輪迭代才能收斂。這樣雖然能定向優化,但整體速度遠不及PXDesign-d。

正因PXDesign-d在效率與成功率上的大幅提升,團隊才能以免費網頁服務的形式開放大規模binder設計能力,而不再受制于計算開銷。
過濾:精準穩定
有了快速高效的生成器,下一步就是利用結構預測模型作為“篩子”,從中挑選出真正有潛力的候選。
由于蛋白設計領域的訓練數據規模和質量遠不及自然語言模型,生成器往往無法直接給出完全可靠的結果,因此仍需要依賴其他工具進行篩選,而最常用的篩選工具就是結構預測模型的置信度評分。
過濾環節重點關注兩個維度:
1)準確性:哪種過濾器的眼光最好,可以把真正合適的binder篩出來?
2)效率:在準確的前提下,哪個過濾器計算成本更低?
為此,Protenix團隊對AlphaFold 2和自研的Protenix結構預測模型在公開歷史數據上進行了系統性評估,驗證不同過濾策略的效果。
Protenix是團隊此前對標AlphaFold 3的一款開源復合物結構預測模型,該項目在GitHub上有不錯的影響力。它的名字來源于“Protein + X”,寓意是面向蛋白質和更廣泛的生物分子的基礎模型。

為了提升效率,Protenix團隊還開發了Protenix-Mini系列模型,通過 few-step ODE 擴散采樣器,把AlphaFold 3生成結構需要的200步的擴散過程簡化到2步,顯著縮短了計算時間。
結果證明,基于Protenix的過濾器有3點優勢:
1)更準:相比AlphaFold 2,Protenix在絕大多數靶點的binder挑選任務上,都有更高的準確性;
2)更快:「加速版」的Protenix-Mini有相似的篩選能力,同時效率提升了數倍;
3)更穩定:Protenix和AlphaFold 2各有偏好,把兩者組合起來,可以構建出更穩定、更精準的篩選標準。

簡而言之,以Protenix為核心構建評估工具,實驗成功率更高,尤其適合大規模篩選。這也幫助PXDesign取得了非常高的濕實驗成功率。
從算法到應用:讓蛋白Binder設計走向開放應用
為了加速binder設計和評估的效率,除了PXDesign,Protenix團隊還發布了兩款配套工具,加速設計與評估的應用落地:
PXDesign Server
基于論文成果,Protenix團隊開發了可直接使用的binder設計網頁服務——PXDesign Server(https://protenix-server.com/)。
現在,研究人員無需自己搭建流程,只需進入網站,即可一站式完成設計,獲得多樣化的binder候選與質量評估結果。
PXDesign Server提供兩種模式:
1)Preview:用于快速調試和難度預估,在20-30分鐘內返回5–25個經過篩選的候選binder。
2)Extended:用于深入研究和實驗前篩選,生成候選數量更多、質量更高、評估指標更全面,更適合進行濕實驗驗證。
PXDesign Server之所以能開放應用,正是得益于PXDesign框架生成質量和效率的大幅提升。
相比以往即便耗時數天,仍可能效果不理想的傳統方法,PXDesign Server顯著縮短了設計周期,讓高水平的binder設計真正變得觸手可及。
PXDesignBench
自從AI加入蛋白設計賽道,各種新方法層出不窮。
然而,領域內一直缺乏統一的評估標準:不同研究使用的數據集不一致、過濾器差異顯著,評估指標更是五花八門。
這樣的“各說各話”導致優劣難以公平比較,很大程度上阻礙了整個領域的進展。
為了解決這個問題,Protenix團隊分享了他們的解決方案,這就是PXDesignBench。

PXDesignBench是一套系統化的評估工具箱,整合了主流的評估指標與流程。無論是單體蛋白(monomer)還是結合蛋白(binder)的設計,都能從多個維度給出全面評價。
所有評估流程、模型調用和過濾器配置已在GitHub開源。研究者不僅能直接復現PXDesign的結果,還可以輕松將自己的方法接入進行公平對比。
One More Thing
字節不是唯一一個在生物領域有布局的互聯網大廠。今年6月,微軟發布了開源動態預測模型BioEmu,前不久,蘋果也發布了自研蛋白質折疊模型SimpleFold。
可以預見,AI在生物領域的探索正在從學術界走向工業界,未來的生物和制藥行業或許會像芯片一樣,成為科技巨頭們不愿錯過的技術高地。
項目主頁:https://protenix.github.io/pxdesign/
論文:https://protenix.github.io/pxdesign/technical_report.pdf
PXDesign Server:https://protenix-server.com
PXDesignBench:https://github.com/bytedance/PXDesignBench
- 起底“豆包手機”:核心技術探索早已開源,GUI Agent布局近兩年,“全球首款真正的AI手機”2025-12-09
- 商湯分拆了一家AI醫療公司,半年融資10億,劍指“醫療世界模型”2025-12-02
- “豆包手機”在二手市場價格都翻倍了……2025-12-05
- OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta2025-12-03



