IBM的AI醫(yī)療走進死胡同:想用NLP解決醫(yī)學(xué)問題,連Bengio也不看好
IBM Watson醫(yī)療雷聲大雨點小,前期給了很高承諾,如今卻遠遠沒有達成目標(biāo)。
曉查 編譯自 IEEE Spectrum
量子位 報道 | 公眾號 QbitAI
從2011年開始,藍色巨人IBM在AI醫(yī)療上押上了重注,甚至為其AI部門建立了一個華麗的總部。這一切都是為了在AI浪潮中保持自己的領(lǐng)先定位。
然而IBM Watson的醫(yī)療技術(shù)已經(jīng)使用了8年,卻從未給人留下深刻印象。
IEEE Spectrum高級副主編Eliza Strick認(rèn)為IBM Watson醫(yī)療雷聲大雨點小,前期給了很高承諾,如今卻遠遠沒有達成目標(biāo)。
在IBM的設(shè)想中,Watson的記憶庫掌握著各種罕見疾病的知識,可以在幾秒內(nèi)就解決一個棘手的病例。如果Watson能夠?qū)⑦@種即時專業(yè)知識帶到世界各地的醫(yī)院和診所,人工智能似乎可以減少診斷錯誤。
但是Watson的成果只限于研究領(lǐng)域。IBM試圖將Watson應(yīng)用于醫(yī)學(xué)界的最大挑戰(zhàn)之一癌癥時,遇到了機器學(xué)習(xí)方式和醫(yī)生工作方式之間的根本不匹配。
8年承諾未能兌現(xiàn)
2011年,IBM Watson在智力競賽電視節(jié)目《危險邊緣》中戰(zhàn)勝兩位人類冠軍,隨后IBM宣布了自己雄心勃勃的計劃:未來讓W(xué)atson成為一名AI醫(yī)生。IBM還承諾在未來18到24個月的時間里推出首批醫(yī)療健康產(chǎn)品。
實際上,IBM當(dāng)時宣布的項目并沒有產(chǎn)生任何商業(yè)產(chǎn)品。
此后8年中,IBM高調(diào)宣揚自己在AI醫(yī)療技術(shù)上的努力,但是與其他醫(yī)院、高校合作的AI醫(yī)療項目大多數(shù)已經(jīng)失敗。
據(jù)IEEE Spectrum統(tǒng)計,從2011年開始,IBM Watson與其他機構(gòu)合作的25個具有代表性的項目中,僅有5個合作項目推出了AI醫(yī)療產(chǎn)品。
IBM還試圖通過收購來加強自身,但內(nèi)部人士表示,收購的公司并沒有起太大的作用。
從IBM的Watson Health部門出來的產(chǎn)品與曾經(jīng)設(shè)想的AI醫(yī)生完全不同:它更像是可以執(zhí)行某些日常任務(wù)的AI助手。
加州大學(xué)舊金山分校醫(yī)學(xué)系主任Robert Wachter說:IBM遇到了麻煩。他們把營銷放在第一位,產(chǎn)品放在第二位,吊足了人們的胃口,但是項目上馬后,又發(fā)現(xiàn)這是一個非常難解決的問題。
NLP短期解決不了問題
目前,美國監(jiān)管機構(gòu)只批準(zhǔn)了少數(shù)AI工具用于醫(yī)院。這些開創(chuàng)性的產(chǎn)品主要是在視覺領(lǐng)域,而IBM卻一直致力于用NLP解決醫(yī)療問題。
其他AI醫(yī)療公司在研究用計算機視覺分析圖像,如X光片和視網(wǎng)膜掃描。但是IBM沒有這樣分析醫(yī)學(xué)影像的產(chǎn)品,盡管他們在該領(lǐng)域有一個活躍的研究項目。
除去醫(yī)療影像,即便是今天最好的AI也難以理解復(fù)雜的醫(yī)療信息。用軟件對人類醫(yī)生專業(yè)知識進行編碼是一件非常困難的事情。正如全世界所看到的,IBM已經(jīng)在市場上學(xué)到了這些痛苦的教訓(xùn)。
雖然IBM并沒有放棄目標(biāo),但它的失敗已經(jīng)向技術(shù)專家和醫(yī)生們表明,創(chuàng)建AI醫(yī)生是多么困難。
2011年Watson在知識問答上的勝利,證明了它在NLP方面的卓越表現(xiàn)。為了玩這個游戲,它必須解析復(fù)雜的文字游戲線索,搜索大量的文本數(shù)據(jù)庫,找到并確定最好的答案。
“看起來Watson幾乎可以理解語言的含義,而不僅僅是識別單詞的模式。” 在2011年曾擔(dān)任IBM 研究院首席醫(yī)學(xué)科學(xué)家Martin Kohn說。
其實早在參加《危險邊緣》之前,IBM就已經(jīng)考慮過AI醫(yī)療的可能性。
大量的患者數(shù)據(jù)看起來非常適合用于AI醫(yī)療研究,特別是當(dāng)醫(yī)院和醫(yī)生開始使用電子健康記錄時。
雖然其中一些數(shù)據(jù)可以很容易地被機器消化,例如實驗室結(jié)果和生命體征測量數(shù)據(jù),但還有大部分是“非結(jié)構(gòu)化”信息,例如醫(yī)生筆記和出院記錄。這類敘述性文本占到患者記錄約80%的內(nèi)容。
Kohn認(rèn)為,Watson強大的NLP能力可以轉(zhuǎn)變?yōu)獒t(yī)學(xué)理論。Watson可以閱讀患者的健康記錄以及醫(yī)學(xué)文獻的全部內(nèi)容,包括教科書、同行評審期刊文章、批準(zhǔn)藥物清單等。通過訪問所有這些數(shù)據(jù),Watson可能會成為一名超級醫(yī)生,能夠辨別出人類無法看到的模式。
哥倫比亞大學(xué)醫(yī)學(xué)系教授Herbert Chase曾與IBM展開合作,希望Watson能成為一種“臨床診斷支持”工具,他們一起研究了一種診斷工具的原型。但是雙方從2014年分道揚鑣,原因是Chase教授對Watson進展緩慢感到失望。
Chase教授只是IBM Watson的眾多合作者之一,另一名合作者馬里蘭大學(xué)放射學(xué)教授認(rèn)為,AI工具在10年內(nèi)對醫(yī)生來說是不可或缺的,但他并不相信IBM能實現(xiàn)它們。
他說:“我不認(rèn)為IBM處于AI技術(shù)的最前沿,最令人興奮的事情發(fā)生在蘋果、谷歌、亞馬遜這些公司。”
2014年,Kohn離開了IBM,他說:“僅僅證明你擁有強大的技術(shù)是不夠的,還需要向別人證明你能做出有用的東西。”
Kohn一直在等待醫(yī)學(xué)期刊上的論文證明AI可以改善患者的治療效果并節(jié)省醫(yī)療系統(tǒng)的花費。到目前為止,這類文章發(fā)表的很少,Watson也沒有任何結(jié)果。
IBM首次涉足AI醫(yī)療領(lǐng)域
在試圖將AI引入醫(yī)療時,IBM面臨著巨大的挑戰(zhàn),它在許多計算領(lǐng)域已經(jīng)落后于谷歌、蘋果等巨頭。IBM需要一些重要的東西才能保證地位。為此,IBM在AI醫(yī)療領(lǐng)域投入大量資金。
2014年,IBM向Watson部門投資10億美元。2015年,IBM宣布成立一個特殊的Watson Health部門,到2016年中期,Watson Health已經(jīng)收購了四家健康數(shù)據(jù)公司,總花費約40億美元。
IBM似乎有了讓AI進入醫(yī)療健康領(lǐng)域所需的技術(shù)、資源和承諾。“將AI用于醫(yī)療健康是一項艱巨的任務(wù),這是一項挑戰(zhàn),但我們正在這樣做。” IBM認(rèn)知解決方案和IBM研究院高級副總裁John E. Kelly說。從2011年開始,Kelly就負責(zé)指導(dǎo)Watson研究,現(xiàn)在他還負責(zé)對Watson Health的直接監(jiān)督。
他說公司在需要的時候已經(jīng)轉(zhuǎn)向:“我們正在繼續(xù)學(xué)習(xí),所以我們的產(chǎn)品會隨著我們的學(xué)習(xí)而改變。”
IBM的醫(yī)療診斷工具就是一個例子,它并沒有上市,IBM醫(yī)療保健和生命科學(xué)研究副總裁Ajay Royyuru說:“診斷不是我們要進入的領(lǐng)域,這是醫(yī)療專家們可以做得很好的地方,無論你用AI做得多好,都不會取代人類專家。”
為了找到AI醫(yī)療的商業(yè)案例,IBM開展了一系列令人眼花繚亂的項目,針對醫(yī)療保健系統(tǒng)中不同參與者:醫(yī)生、行政人員、保險公司和患者。
在許多種嘗試中,IBM努力讓W(xué)atson的NLP去理解醫(yī)療文本。但蒙特利爾大學(xué)計算機教授Yoshua Bengio說,在醫(yī)學(xué)文本文件中,人工智能系統(tǒng)無法理解其模糊性,也無法了解人類醫(yī)生注意到的微妙線索。到目前為止,沒有人工智能可以達到人類醫(yī)生的理解和洞察力。
IBM對癌癥的研究是這家公司遇到的主要挑戰(zhàn)之一。一位肺癌專家Mark Kris表示:“我認(rèn)為沒有人會知道這(實現(xiàn)癌癥診斷)會花多長時間。”他所在的研究機構(gòu)早在2012年就和IBM Watson展開了合作。
Kris和其他醫(yī)生在2015年訓(xùn)練了一個人工智能系統(tǒng),該系統(tǒng)成為了Watson腫瘤產(chǎn)品。德克薩斯大學(xué)MD安德森癌癥中心的醫(yī)生與IBM合作創(chuàng)建了一個名為Watson腫瘤顧問。白血病部門測試了該工具,但它從未成為商業(yè)產(chǎn)品。
Watson腫瘤顧問遭受了多方批評。有文章指出Watson腫瘤是無用甚至?xí)峁┪kU的建議。Kris說他經(jīng)常聽到批評說該產(chǎn)品不是“真正的人工智能”。IBM與MD安德森癌癥中心的合作項目花費了6200萬美元,最后以失敗告終而被取消。
該項目揭示了機器學(xué)習(xí)的承諾與醫(yī)療保健的現(xiàn)實根本不匹配,在“真正的AI”與當(dāng)今醫(yī)生對功能性產(chǎn)品的要求之間存在著差距。
Watson腫瘤通過獲取大量癌癥患者健康記錄和醫(yī)學(xué)文獻來學(xué)習(xí)。IBM希望Watson憑借其強大的計算能力,將檢查這些記錄中的數(shù)百個變量,發(fā)現(xiàn)人類無法看到的模式。對于腫瘤學(xué)家來說,這聽起來像癌癥護理方面的潛在突破。對于IBM來說,它聽起來就像一個偉大的產(chǎn)品。
Watson很快就學(xué)會了如何瀏覽臨床研究的文章并確定基本結(jié)果。但它不會像醫(yī)生那樣閱讀文章。醫(yī)生是從文章中提取信息,用來改變他們的治療方法。
而Watson的思想是基于統(tǒng)計數(shù)據(jù),所以它能做的就是收集有關(guān)主要結(jié)果的統(tǒng)計數(shù)據(jù)。“但醫(yī)生不這樣做。”
例如,在2018年,F(xiàn)DA批準(zhǔn)了一種新癌癥藥物,它對所有表現(xiàn)出特定基因突變的腫瘤都有效。人類醫(yī)生會建議每個肺癌患者都接受這種基因檢測,但Watson不會根據(jù)有55名患者中4名肺癌患者改變結(jié)論。
與現(xiàn)有醫(yī)療體系標(biāo)準(zhǔn)不符
Watson無法從醫(yī)療文獻中新的病歷事件提取出自己的見解,這只是它失敗的第一步。研究人員還發(fā)現(xiàn),它也無法像預(yù)期的那樣從患者的電子健康記錄中挖掘信息。
研究人員讓W(xué)atson研究白血病患者的健康記錄。在一份2018年發(fā)表于The Oncologist的論文中,該團隊報告說,基于Watson的腫瘤學(xué)專家顧問在從醫(yī)療記錄中的文本文檔中提取信息方面取得了不同程度的成功。在處理診斷等明確概念時,準(zhǔn)確度從90%到96%不等,但對依賴于時間的信息(如治療時間線),準(zhǔn)確度僅為63%至65%。
不僅如此,IBM實現(xiàn)AI超級醫(yī)生的夢想還遭遇了另一重打擊:研究人員意識到,Watson無法將新患者與之前發(fā)現(xiàn)隱藏模式的癌癥患者進行比較。IBM本來希望AI能夠模仿他們的專家腫瘤學(xué)家的能力,利用之前的結(jié)果和經(jīng)驗,為新患者制定治療策略。
但醫(yī)療保健系統(tǒng)目前的標(biāo)準(zhǔn)并不鼓勵這種現(xiàn)實世界的學(xué)習(xí)。AI系統(tǒng)的建議基于它在醫(yī)療記錄中發(fā)現(xiàn)的模式 ,但是如果沒有科學(xué)研究的嚴(yán)格控制,這種發(fā)現(xiàn)只會被認(rèn)為是相關(guān)性,而不是因果關(guān)系。
IBM認(rèn)為醫(yī)療保健的標(biāo)準(zhǔn)必須改變,才能讓AI實現(xiàn)其全部潛力并轉(zhuǎn)化為醫(yī)學(xué)。
腫瘤專家不信任
根據(jù)傳聞報道,IBM在美國尋找其Watson腫瘤產(chǎn)品的買家時遇到了麻煩。一些腫瘤學(xué)家說他們相信自己的判斷,并不需要沃森告訴他們該做什么。有人說Watson只是建議他們很清楚的標(biāo)準(zhǔn)治療方法。
在過去的幾年里,與IBM合作的醫(yī)院已開始發(fā)表關(guān)于Watson腫瘤相關(guān)經(jīng)驗的研究。
在印度,Manipal綜合癌癥中心的醫(yī)生對638例乳腺癌病例中,Watson與專家治療建議的一致率為73%。Watson在韓國Gachon大學(xué)Gil醫(yī)療中心表現(xiàn)更差,該醫(yī)院為656名結(jié)腸癌患者提供的最佳建議,只有49%與專家相匹配。
Watson Health也有一些成功案例。IBM與北卡羅來納大學(xué)的合作伙伴在2017年發(fā)表了第一篇關(guān)于Watson for Genomics有效性的論文中,參加該研究的32%的癌癥患者,Watson發(fā)現(xiàn)了人類從未發(fā)現(xiàn)的潛在重要突變。
Watson Health的故事是一個警示,每個人都喜歡雄心壯志,但是沒人希望被放鴿子。
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關(guān)村。期待有才氣、有熱情的同學(xué)加入我們!相關(guān)細節(jié),請在量子位公眾號(QbitAI)對話界面,回復(fù)“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動態(tài)




