谷歌DeepMind再登Science:用AI預測基因突變致病性,PK人類專家=89:0.1 | 開源
已對7100萬錯義突變進行分類
魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI
基因突變會如何影響人類健康,很大程度上還是個未解之謎。
不過現在,人類可以借AI之力來研究這件事兒了:
谷歌DeepMind在AlphaFold的基礎上,訓練出了專門預測人類基因組中錯義突變致病性的AlphaMissense。
論文今天登上Science。

“錯義突變”是DNA序列的一種非同義替換。簡單來說,就是DNA原本的字母(堿基對)被替換掉了。
這就意味著,對應生成的蛋白質里的氨基酸也會發生異化,這可能會讓蛋白質失去原本的功能,導致疾病的產生。
AlphaMissense出山第一步,就是對全部7100萬種可能的錯義突變進行了分類。
結果是,這個AI成功將這些變異中的89%,分類為“可能致病”和“可能良性”。相比之下,人類專家目前的成績是0.1%。

用AI預測基因突變致病性
一句話總結,AlphaMissense的主要能力,就是預測人類基因組中所有可能的錯義突變是致病性的還是良性的。
如何做到——
AlphaMissense基于DeepMind的蛋白質結構預測模型AlphaFold打造。
研究人員用人類和靈長類變異頻率數據庫對AlphaFold進行了微調。具體而言,自然界中的常見變異可以視作對生物無害的變異,而未曾在數據庫中出現的變異,則可視作“致病變異”訓練數據。
這種訓練策略,可以避免人工標注帶來的偏見。

值得一提的是,AlphaMissense不能預測突變后蛋白質結構的變化和突變對蛋白質穩定性的其他影響。
在輸入一種錯義突變之后,AlphaMissense會結合蛋白質結構上下文和蛋白質語言模型,對突變進行一個0-1分的打分,以此大致判定這種突變會不會致病。

△AlphaMissense+AlphaFold效果
那么問題來了,AlphaMissense的這種分類,真的可靠嗎?
研究人員對其進行了實驗驗證。

在遺傳學權威數據庫ClinVar上,AlphaMissense展現出了比其他計算方法更強大的分類性能。
在18924個變異數據中,AlphaMissense的ROC曲線下面積(auROC)達到0.94。這個數字越接近于1,就代表模型越能正確地區分正樣本和負樣本。
值得注意的是,上圖中,以灰色顯示的計算方法是在ClinVar上訓練的,可能存在過擬合。
在預測準確率方面,AlphaMissense也達到了SOTA。通過調節分類閾值,AlphaMissense給出的“可能致病”和“可能良性”分類,期望精確度都達到了90%。

DeepMind表示:
我們期待看到AlphaMissense幫助解決基因組學和生物科學中懸而未決的問題。
為此,他們已經把AlphaMissense的預測結果和模型代碼開源了出來。
另外,DeepMind還分享了19000多種人類蛋白質中所有可能的2.16億個單氨基酸序列置換預測數據集。
參考鏈接:
[1]論文地址:https://www.science.org/doi/10.1126/science.adg7492
[2]https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases
[3]https://github.com/deepmind/alphamissense
— 完 —
- 蘋果芯片主管也要跑路!庫克被曝出現健康問題2025-12-07
- 世界模型和具身大腦最新突破:90%生成數據,VLA性能暴漲300%|開源2025-12-02
- 谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?2025-12-05
- 90后華人副教授突破30年數學猜想!結論與生成式AI直接相關2025-11-26




