當(dāng)大模型時(shí)代到來,如何借助 AI 驅(qū)動(dòng)生命科學(xué)與醫(yī)藥創(chuàng)新
AI驅(qū)動(dòng)的生命科學(xué)與醫(yī)藥創(chuàng)新
近年來,利用AI技術(shù)驅(qū)動(dòng)業(yè)務(wù)創(chuàng)新與發(fā)展已經(jīng)成為行業(yè)共識(shí)。2021年,DeepMind發(fā)布了AlphaFold2,憑借自身在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上的高可信度,以及遠(yuǎn)優(yōu)于傳統(tǒng)實(shí)驗(yàn)方法的效率和成本表現(xiàn),樹立起一座“AI for Science”的全新里程碑。AlphaFold2不僅在生命科學(xué)領(lǐng)域掀起了顛覆式的革新,也成為了AI在生物學(xué)、醫(yī)學(xué)和藥學(xué)等領(lǐng)域落地的核心發(fā)力點(diǎn)。
那么,當(dāng)大模型時(shí)代到來,Al輔助的生命科學(xué)研究和制藥將迎來哪些變化?AlphaFold2是否還是制勝的法寶?它如何在英特爾? 架構(gòu)的CPU和加速器平臺(tái)上實(shí)現(xiàn)顯著性能優(yōu)化?
潞晨科技創(chuàng)始人兼董事長(zhǎng),NUS校長(zhǎng)青年教授尤洋、英特爾人工智能架構(gòu)師楊威和百圖生科AI算法負(fù)責(zé)人、資深總監(jiān)王太峰三位專家,圍繞《AI驅(qū)動(dòng)的生命科學(xué)與醫(yī)藥創(chuàng)新》這一主題進(jìn)行了精彩的分享。

AI 大模型驅(qū)動(dòng)生命科學(xué)與制藥創(chuàng)新,提速降本成為關(guān)鍵
“用 AI 大模型驅(qū)動(dòng)生命科學(xué)與制藥創(chuàng)新的關(guān)鍵在于降低模型訓(xùn)練成本,提高訓(xùn)練效率。”
尤洋在主題為《AI 大模型驅(qū)動(dòng)的生命科學(xué)與醫(yī)藥創(chuàng)新》的分享中指出,過去六年大模型參數(shù)量每18個(gè)月增長(zhǎng)了40倍,過去三年每18月增長(zhǎng)了340倍,而硬件的增長(zhǎng)速度大概每18個(gè)月增長(zhǎng)1.7倍,已經(jīng)完全跟不上節(jié)奏。
而訓(xùn)練世界頂尖AI大模型成本高、周期長(zhǎng),因此降低成本,提高效率,成為擺在生命科學(xué)與醫(yī)藥行業(yè)面前最大的挑戰(zhàn)。

潞晨科技開發(fā)了Colossal-AI系統(tǒng),包括高效內(nèi)存管理系統(tǒng)、N維并行系統(tǒng)和低延遲推理系統(tǒng),三位一體地幫助用戶降低訓(xùn)練成本,提高訓(xùn)練效率。
作為當(dāng)下最火熱的開源AI大模型解決方案之一,Colossal-AI已收獲Github Star七千多顆,此前在Stable Diffusion、GPT-3、AlphaFold等大模型上也展現(xiàn)出了卓越的性能優(yōu)勢(shì)。
潞晨科技與英特爾的合作,正是關(guān)于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方案的優(yōu)化。
優(yōu)化方案充分利用了Colossal-AI的大模型優(yōu)化能力,使用英特爾? 至強(qiáng)? 可擴(kuò)展處理器進(jìn)行數(shù)據(jù)預(yù)處理,并用英特爾AI專用加速芯片Habana? Gaudi? 加速了AlphaFold2模型推理的執(zhí)行。相比于之前應(yīng)用的方案,AlphaFold2端到端推理速度最高提3.86倍,相較GPU方案,應(yīng)用成本最多降低39%!
尤洋還表示,對(duì)于超長(zhǎng)序列蛋白質(zhì)結(jié)構(gòu)的推理,通過引入至強(qiáng)? 可擴(kuò)展處理器,發(fā)揮其內(nèi)置加速硬件在AI推理上的優(yōu)勢(shì),也能取得十分卓越的效果。
大幅優(yōu)化 AlphaFold2 的性能,第四代英特爾?至強(qiáng)? 可擴(kuò)展平臺(tái)解讀
面對(duì)大模型時(shí)代到來,Al 輔助的生命科學(xué)研究和制藥將迎來新變化,英特爾? 至強(qiáng)? 可擴(kuò)展平臺(tái)能否實(shí)現(xiàn)更進(jìn)一步的性能優(yōu)化?英特爾人工智能架構(gòu)師楊威進(jìn)行了詳細(xì)的解讀。

在2022年,英特爾以第三代至強(qiáng)? 可擴(kuò)展平臺(tái)為硬件基座,對(duì)AlphaFold2實(shí)施了端到端的高通量?jī)?yōu)化,累計(jì)通量提升可達(dá)優(yōu)化前的23.11倍。

今年,英特爾采用第四代至強(qiáng)? 可擴(kuò)展處理器對(duì)AphaFold2進(jìn)行優(yōu)化,在第三代的基礎(chǔ)上使通量再獲得高達(dá)3.02倍的提升。

AlphaFold2 是一個(gè)科學(xué)計(jì)算+AI 的混合計(jì)算管線,在計(jì)算過程中可以將它分成預(yù)處理、深度學(xué)習(xí)模型推理和后處理三個(gè)階段。
基于第四代至強(qiáng)? 可擴(kuò)展處理器的優(yōu)化方案主要聚焦在預(yù)處理和模型推理兩個(gè)層面,用五大步驟助AlphaFold2實(shí)現(xiàn)端到端優(yōu)化,以多項(xiàng)針對(duì)AI工作負(fù)載的優(yōu)化加速技術(shù)為AlphaFold2推理帶來“推背感”。
具體的優(yōu)化步驟和優(yōu)化加速技術(shù),歡迎大家注冊(cè)觀看本期《至強(qiáng)實(shí)戰(zhàn)課》,或點(diǎn)擊“閱讀原文”鏈接獲取白皮書。
面向未來,加速創(chuàng)新!持續(xù)探索AI在生命科學(xué)與醫(yī)藥上的新方向、新趨勢(shì)、新挑戰(zhàn)
大模型無疑是近來科技圈最火爆的技術(shù)之一,它在醫(yī)藥和生命科學(xué)領(lǐng)域大步發(fā)展,也在此領(lǐng)域中發(fā)揮著巨大的作用。
百圖生科AI算法負(fù)責(zé)人、資深總監(jiān)王太峰認(rèn)為,在傳統(tǒng)的制藥領(lǐng)域去設(shè)計(jì)蛋白質(zhì),或者淘選有用的蛋白質(zhì),往往都是利用傳統(tǒng)實(shí)驗(yàn),受限于當(dāng)前物種現(xiàn)存在的一些蛋白質(zhì)。當(dāng)需要為特定病種去設(shè)計(jì)更好的蛋白質(zhì)藥物的時(shí)候,往往需要跨越已有的限制去重新設(shè)計(jì),或者從頭去de novo這些蛋白。這就需要研究人員對(duì)于整個(gè)蛋白領(lǐng)域有非常完善的知識(shí)。

據(jù)介紹,通過大語言的模型,或者基于生物體的里面的這些自然語言(包括所有的蛋白質(zhì)和氨基酸等等的序列),通過這些非常大規(guī)模的蛋白質(zhì)數(shù)據(jù),從中學(xué)習(xí)或理解到這些蛋白質(zhì)內(nèi)在的一些規(guī)律。基于這個(gè)規(guī)律從頭去設(shè)計(jì)新的蛋白質(zhì),這就是生物大語言模型之所以需要存在的一個(gè)非常必要的原因。
今年,百圖生科開放了AIGP(AI Generated Protein)平臺(tái),并正致力于借助此平臺(tái)加速研發(fā)工作,降低研發(fā)成本,并使其成為一個(gè)即插即用的平臺(tái),讓更多的藥物設(shè)計(jì)公司能夠復(fù)用這些平臺(tái)的建設(shè)。
未來,是否還會(huì)有更多AI輔助的生命科學(xué)研究和制藥領(lǐng)域的創(chuàng)新?是否還有更多算法可以在生命科學(xué)和醫(yī)藥創(chuàng)新領(lǐng)域里找到機(jī)遇和探索的空間?讓我們拭目以待。
如果您對(duì)本文涉及的基于Habana? Gaudi? 與英特爾? 至強(qiáng)? 可擴(kuò)展處理器對(duì)AlphaFold2進(jìn)行端到端優(yōu)化的技術(shù)細(xì)節(jié)感興趣,如果您也想了解百圖生科在AIGP領(lǐng)域的最新進(jìn)展,英特爾《至強(qiáng)實(shí)戰(zhàn)課》之《AI驅(qū)動(dòng)的生命科學(xué)與醫(yī)藥創(chuàng)新》將為您帶來更加全面且詳細(xì)的真人講解,歡迎大家掃描海報(bào)中的二維碼注冊(cè)收看;
點(diǎn)擊“閱讀原文”也可以了解更多英特爾? 至強(qiáng)? 可擴(kuò)展平臺(tái)對(duì)AlphaFold2的優(yōu)化詳情。

*本文系量子位獲授權(quán)刊載,觀點(diǎn)僅為作者所有。
原文鏈接:https://www.intel.cn/content/www/cn/zh/customer-spotlight/cases/cpu-acceleration-alphafold2-next-level-throughput.html?cid=soc&source=Wechat&article_id=4848
- 長(zhǎng)城汽車自研芯片點(diǎn)亮!提前布局下一代架構(gòu)RISC-V,魏建軍:不能再受制于人2024-09-27
- 騰訊云發(fā)布自研大數(shù)據(jù)高性能計(jì)算引擎Meson,性能最高提升6倍2024-07-04
- Intel2024-03-18
- 數(shù)字員工全新發(fā)布 加速企業(yè)轉(zhuǎn)型2024-01-15




