被AI激活的計算生物賽道:發展30年不被主流接納,如今一年投資近400億元 | 量子位智庫報告
《計算生物學深度產業報告》(附下載)
楊凈 豐色 發自 凹非寺
量子位 | 公眾號 QbitAI
計算生物界的大明星AlphaFold,再度取得重大突破。
它已經能夠預測超過100萬個物種的2.14億個蛋白質結構,幾乎涵蓋了地球上所有已知蛋白質。
從今天起,預測幾乎所有已知蛋白質的結構,都如同使用搜索引擎一樣簡單。
而又在一周前,國內外兩種代表性企業,幾乎同時傳來最新研發成果。
互聯網巨頭Meta,更新蛋白質大模型ESMFold。它可直接從單序列語言模型表示中預測完整的蛋白質結構,準確性與AlphaFold相媲美,推理速度快了一個數量級。
彭健大牛帶隊的AI創新藥明星公司華深智藥,也實現了最新突破:OmegaFold用單條序列搞定蛋白質3D結構,即便是人工設計蛋白質,也可以通過AI預測3D結構確定其功能。
全球屢屢傳出最新進展,這種盛況放在幾年前并不多見。
近年來放眼全球,谷歌DeepMind、英偉達已紛紛布局。而國內的大廠也時常亮出新技術、學界大牛踴躍探討生物世界數字化,以及投資動作頻頻……
過去一年投資金額增長3倍,大批創業公司也在近幾年間爆發式增長。
這些都無一不在證明,計算生物的價值已經顯性,在制藥、醫療等領域已經開始應用落地。
但不為更多人所知的是,早在上世紀90年代初,這個賽道就已經成為生物領域的重要組成部分。
CMU、MIT、布朗大學等全球頂尖高校都早已開設了這門課程(包括本科)。
在AlphaFold出現之前,就已經有科學家斷言:所有生物學都是計算生物學,不過始終不被主流學界所接納。
毫無疑問,我們正處于一個嶄新的技術創新周期。僅計算生物這個賽道,就已經被廣泛感知。
在AI激活、數據驅動下,它正從幕后走向臺前,從實驗室走向大規模應用前夜……
現在,量子位智庫做了個全球體系化梳理,寫下《計算生物學深度產業報告》試圖描繪出國內外發展現狀,以及這一行所面臨的困境與機遇。
計算生物來到應用前夕
計算生物,本質來講就是通過計算手段來解決生物學問題。
具體來說,就是根據不同類型的生物數據(比如濃度、序列、圖像等)來構建算法和模型,從而理解生物系統本身(比如分子、細胞、組織和器官等),并推進相關研究及應用的學科。
而從應用劃分,目前主要落地領域包括序列分析、結構和功能分析、生物分子動力學、系統建模、進化和群體基因組學、相關性網絡……
以AlphaFold2為例,它是基于基因序列預測蛋白質結構,屬于結構和功能分析范疇。
可以看到的是,計算生物學屬于工具性質的學科。某種程度上這決定了市面上尚不存在嚴格意義上的計算生物學公司,而是以AI制藥、組學、精準醫療等名義出現。
這一點在我國尤為明顯。
目前,國內以AI制藥為核心場景。
不光高校機構(西湖大學生命科學研究院、北大前沿交叉學科研究院等)、互聯網大廠(阿里、百度、華為等)有相關研究和布局。
相關創業公司在2017年-2021年呈現出爆發式增長,且都已獲高融資。
這種情況同樣也體現在國外。
據浦發硅谷銀行《醫療健康行業投資與退出趨勢》報告顯示,2021年投向計算生物學公司的金額達到59億美元(即397億元)一年增長高達3倍,超過非計算生物學公司投資的兩倍。
從商業模式上看,整個行業以2B為主導,主要為算法授權、生物資產和軟件使用。
我國主要為前兩種,但鑒于軟件平臺和先鋒項目能夠形成技術及業務迭代閉環。
量子位智庫認為,在出現大量優勢自研算法后,軟件平臺所占比重將有明顯上升。國外已開始通過打包訂閱、按照使用量計費等方式對外商用其計算生物學服務。
為什么現在才火?
事實上,在1990年代后期,計算生物學就開始成為生物學中非常重要的一部分。
1997年之時,國際計算生物學學會ISCB在美國成立,如今發展成為一個擁有來自70多個國家3200多名會員的組織。
正如開頭所提,在學術界,國外多所知名高校很早就開設了計算生物學這一門課程,甚至是在本科階段,比如最早的是CMU,是在1989年開設,學生既要學習各類生物學,也要學習算法設計、機器學習等計算機相關的課程。
在我國,四川大學也于2014年以雙學位的形式開設了國內首個計算生物學本科專業。
略有不同的是,川大的這個專業設在生命科學學院之下,而國外高校如CMU則是放在了計算機科學學院之下。
此外,還值得關注的是,在AlphaFold掀起浪潮之前,就有科學家斷言:
所有生物學都是計算生物學。
他認為計算思維和技術對理解生命至關重要。
但與此同時,他卻透露在2008年到2016年間始終被質疑的經歷:有數學和機器學習經驗的研究者,是否真的會對生物學有所貢獻。
不過AI或者深度學習的出現,給計算生物帶來了轉機。
量子位智庫分析了如今這一賽道爆火的原因。
一是和深度學習近年來的爆發式增長有關;
二是最近興起的AI for Science概念,讓AI在生物學領域落地的象征——計算生物學成為一種趨勢。AI和傳統科研結合帶來的巨大潛能,有望帶來一場全新的科學革命;
三是對于生物學本身,傳統的實驗和分析手段已難以充分開發海量生物數據,確實需要計算生物學這種跨學科,同時兼顧多個細分領域的綜合性工具來解決問題。
在具體實驗方法上,當前絕大數采用的都是基于已有數據庫和資源、利用成熟工具來解決特定問題,或進行自行設計統計分析、數值計算方法,而計算生物學的出現讓干濕實驗結合的新方法開始走向主流。
那么,計算生物學具體能給生物學帶來什么價值呢?
分成科研和應用兩大塊。
在科研方面,計算生物學最直接的作用,就是對實驗的替代,甚至超越。
與操作水平、 實驗器具、觀察水平等精度有限的傳統生物實驗相比,基于計算機的計算生物學不僅成本更低、速度更快,在理論上也擁有無限的計算精度和高度可復制性。
在將過往經驗內化在AI模型中后,計算生物學能夠自動化、規模化和并行化地提出假設,讓科研人員無需依賴少數天才,同時降低下游進行開發的門檻,而這將有望對行業格局帶來重大影響。
其次是開辟“先假設-再驗證-最后優化假設”的新方式,讓研發效率得到數倍提升。
早在1991年,Nature上有觀點就提出,新的生物學研究方式的出發點應該是科學家先從理論推測出發,再返回到實驗里去,追蹤或驗證理論假設。
計算生物學恰好能夠基于干濕循環實驗,開辟“假設-驗證-優化假設”的新方式,提升整體生物研發效率。
具體來說,一方面,實驗室通過高通量的濕實驗,在快速驗證AI預測的同時,為AI模型提供大量可用的訓練數據,提升AI預測模型的精度。
另一方面,AI將基于自身的數據處理能力, 提供能夠在濕實驗中驗證的假設(高參考價值、甚至可實用),兩者共同迭代加速。
在AI制藥領域,智能實驗室已成為公司長久競爭力的重要體現。智庫認為,這種情況也將廣泛適用于所有計算生物學相關的產業領域。
在應用方面的價值,可以按流程劃分為三大類:
一是計算推演生物性質及原理,包括:蛋白質結構預測、致病機理研究、蛋白質相互作用預測(PPI)、抗體和抗原的表位預測、基于基因組學尋找疾病成因或尋找新型的生物標志物等。
(生物標志物是指可以標記系統、器官、組織、細胞及亞細胞結構或功能的改變或可能發生的改變的生化指標,可用于疾病診斷、判斷疾病分期或者用來評價新藥或新療法在目標人群中的安全性及有效性。)
這些研究的成功后續可用于得到新的藥物靶點等,為疾病治療提供基本思路。
從多組學的角度來看,智庫認為,在新生物標記物獲取成本降低至消費級之后,有望催生出和現在基因組學類似、甚至更大的產業格局,可能就是蛋白質組學,以及正在發展中的RNA組學。
二是搭建預測及判斷模型,包括:AI制藥中基于靶點的化合物性質預測(主要涉及小分子藥物開發),疾病診斷/監控/治療建模,涵蓋細胞/器官/人體的生物模擬器等。
其中生物模擬器的本質功能是用于驗證特定療法有效性的生物模擬器,可以簡單理解為生物醫藥領域的數字孿生。
值得注意的是,該部分目前國內尚未看到公司明確涉及,但在國外已出現多個相關公司,并以該領域作為核心業務進行變現。
智庫提示,由于需要技術、數據、臨床實驗等多方面共同支撐等原因,這一領域極易形成競爭壁壘。
三是對生物體進行控制改造,包括:新療法/藥物開發、精準醫療和生物制造(以合成生物學為代表)。
其中新療法/藥物開發是目前落地最成熟的場景。
精準醫療將成為計算生物學長期的重點發力方向,這是由于C端市場的消費意愿更為明顯,且使用人體廣泛、產品形態相對直接。
在這個方向上,國外已出現了基于多組學的多家布局,而國內布相關公司相對較少,且均基于基因組學進行,存在一定差距。
再往細來說,對癌癥的個性化治療和基因組學也將成為精準醫療中最先落地的場景。
總的來看,量子位智庫認為,以疾病診斷與AI制藥為代表,生物模型預測及判斷將成為短期內計算生物學應用價值的首批增長點。
但計算生物學產業價值的最終落地還是體現在對生物體的控制改造上。
未來會怎么樣?
從現狀分析來看,計算生物學行業離商業化爆發還需至少5年時間,目前還不好做市場規模計算。
可以預見的是,計算生物學未來的產業鏈將會是以數據提供商為底層支撐+上層各類相關從業公司(包括提供計算平臺和軟件、分子建模/機器學習框架、算力以及智能實驗室的企業)的結構構成。
它的發展也將分為三個階段:
2025年以前為基礎沉淀期,計算生物學的發展的將處于相當早期,并在數據、設備、算法等基礎條件的積累下緩慢攀升。
2025年到2030年進入多點驗證期,除去目前最為常見的基因組學,更多的組學數據、乃至于交叉組學將開始加速進展,計算生物學能夠從更多角度創造應用價值。
除去蛋白質結構預測問題之外,也有望出現下一個well-defined(定義比較清晰的)的問題,更多生物IT公司關注到計算生物學這一領域。
2030年之后開始全面發展,在此期間,計算生物學將迎來指數級的增長,成為Biotech領域必備的底層基礎設施,相關應用場景普遍實現商業化,基于計算生物學的一系列應用也會在生物醫藥領域占據相當份額。
其中,智庫預測,計算生物學軟件平臺將產生相當的市場規模,以及該領域內研究的問題將逐漸向系統化、底層化、更適用于直接落地的方向發展。
眼下,要想實現以上期待,年輕的計算生物學還有著以下幾大關鍵瓶頸待突破——有的問題為該行業獨有,也有的是整個AI科學領域都存在的:
一是對生物底層原理的明確。目前,我們還有大量關于生物學本身的底層機制待研究透徹,在進行模型構建、生物驗證及人體落地時,需要引入這次知識來減少不符合領域認知的偏差,保證準確率。
二是統一的計算和數據框架。基于微觀手段,一些生物學上的特定問題能夠得到解決,但要最終落地,所需的模型需要能夠覆蓋多組學數據、多環節及功能并行。
此外,需要保證計算生物學中的多種異構數據,例如圖像、視頻、分子圖譜、DNA 代碼、基因表達、電信號等,有明確的標準和通用格式,以便在不同算法和平臺之間互操作。
三是消費級數據的獲取。在分析師看來,基因組學相關的計算生物學,其關鍵的產業發展階段是數據采集達到了消費級水準。
四是工程落地能力。目前學術上有很多機器學習算法和模型已經相當成熟,關鍵是如何在具備底層數據的情況下,加入對生物學的具體理解,進行精細地調整。
最后就是數據隱私的問題,以及如何讓相關模型具備可解釋性,取得這一特殊行業的信任問題。
One More Thing
掃描二維碼,就能下載量子位智庫出品完整《計算生物學深度產業報告》。

在下一期專題中,將詳細解讀我們在計算生物學產業領域的七大判斷。

關于量子位智庫:
量子位旗下科技創新產業鏈接平臺。致力于提供前沿科技和技術創新領域產學研體系化研究。面向前沿AI&計算機、生物計算、量子技術及健康醫療等領域最新技術創新進展,提供系統化報告和認知。通過媒體、社群和線下活動,幫助決策者更早掌握創新風向。
特別感謝:微軟亞洲研究院、深勢科技、黃晶教授(西湖大學)、西湖歐米、百圖生科(按首字母排序)。
參考鏈接:
[1]http://www.phirda.com/artilce_27183.html
[2]https://cbd.cmu.edu/about-us/what-is-computational-biology.html
[3]https://en.wikipedia.org/wiki/Computational_biology
[4]https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.2002050
[5]https://www.universities.com/programs/computational-biology-degrees
- 空間智能卡脖子難題被杭州攻克!難倒GPT-5后,六小龍企業出手了2025-08-28
- 陳丹琦有了個公司郵箱,北大翁荔同款2025-08-28
- 英偉達最新芯片B30A曝光2025-08-20
- AI應用如何落地政企?首先不要卷通用大模型2025-08-12




