當大模型時代到來,如何借助 AI 驅動生命科學與醫藥創新
AI驅動的生命科學與醫藥創新
近年來,利用AI技術驅動業務創新與發展已經成為行業共識。2021年,DeepMind發布了AlphaFold2,憑借自身在蛋白質結構預測上的高可信度,以及遠優于傳統實驗方法的效率和成本表現,樹立起一座“AI for Science”的全新里程碑。AlphaFold2不僅在生命科學領域掀起了顛覆式的革新,也成為了AI在生物學、醫學和藥學等領域落地的核心發力點。
那么,當大模型時代到來,Al輔助的生命科學研究和制藥將迎來哪些變化?AlphaFold2是否還是制勝的法寶?它如何在英特爾? 架構的CPU和加速器平臺上實現顯著性能優化?
潞晨科技創始人兼董事長,NUS校長青年教授尤洋、英特爾人工智能架構師楊威和百圖生科AI算法負責人、資深總監王太峰三位專家,圍繞《AI驅動的生命科學與醫藥創新》這一主題進行了精彩的分享。

AI 大模型驅動生命科學與制藥創新,提速降本成為關鍵
“用 AI 大模型驅動生命科學與制藥創新的關鍵在于降低模型訓練成本,提高訓練效率。”
尤洋在主題為《AI 大模型驅動的生命科學與醫藥創新》的分享中指出,過去六年大模型參數量每18個月增長了40倍,過去三年每18月增長了340倍,而硬件的增長速度大概每18個月增長1.7倍,已經完全跟不上節奏。
而訓練世界頂尖AI大模型成本高、周期長,因此降低成本,提高效率,成為擺在生命科學與醫藥行業面前最大的挑戰。

潞晨科技開發了Colossal-AI系統,包括高效內存管理系統、N維并行系統和低延遲推理系統,三位一體地幫助用戶降低訓練成本,提高訓練效率。
作為當下最火熱的開源AI大模型解決方案之一,Colossal-AI已收獲Github Star七千多顆,此前在Stable Diffusion、GPT-3、AlphaFold等大模型上也展現出了卓越的性能優勢。
潞晨科技與英特爾的合作,正是關于蛋白質結構預測方案的優化。
優化方案充分利用了Colossal-AI的大模型優化能力,使用英特爾? 至強? 可擴展處理器進行數據預處理,并用英特爾AI專用加速芯片Habana? Gaudi? 加速了AlphaFold2模型推理的執行。相比于之前應用的方案,AlphaFold2端到端推理速度最高提3.86倍,相較GPU方案,應用成本最多降低39%!
尤洋還表示,對于超長序列蛋白質結構的推理,通過引入至強? 可擴展處理器,發揮其內置加速硬件在AI推理上的優勢,也能取得十分卓越的效果。
大幅優化 AlphaFold2 的性能,第四代英特爾?至強? 可擴展平臺解讀
面對大模型時代到來,Al 輔助的生命科學研究和制藥將迎來新變化,英特爾? 至強? 可擴展平臺能否實現更進一步的性能優化?英特爾人工智能架構師楊威進行了詳細的解讀。

在2022年,英特爾以第三代至強? 可擴展平臺為硬件基座,對AlphaFold2實施了端到端的高通量優化,累計通量提升可達優化前的23.11倍。

今年,英特爾采用第四代至強? 可擴展處理器對AphaFold2進行優化,在第三代的基礎上使通量再獲得高達3.02倍的提升。

AlphaFold2 是一個科學計算+AI 的混合計算管線,在計算過程中可以將它分成預處理、深度學習模型推理和后處理三個階段。
基于第四代至強? 可擴展處理器的優化方案主要聚焦在預處理和模型推理兩個層面,用五大步驟助AlphaFold2實現端到端優化,以多項針對AI工作負載的優化加速技術為AlphaFold2推理帶來“推背感”。
具體的優化步驟和優化加速技術,歡迎大家注冊觀看本期《至強實戰課》,或點擊“閱讀原文”鏈接獲取白皮書。
面向未來,加速創新!持續探索AI在生命科學與醫藥上的新方向、新趨勢、新挑戰
大模型無疑是近來科技圈最火爆的技術之一,它在醫藥和生命科學領域大步發展,也在此領域中發揮著巨大的作用。
百圖生科AI算法負責人、資深總監王太峰認為,在傳統的制藥領域去設計蛋白質,或者淘選有用的蛋白質,往往都是利用傳統實驗,受限于當前物種現存在的一些蛋白質。當需要為特定病種去設計更好的蛋白質藥物的時候,往往需要跨越已有的限制去重新設計,或者從頭去de novo這些蛋白。這就需要研究人員對于整個蛋白領域有非常完善的知識。

據介紹,通過大語言的模型,或者基于生物體的里面的這些自然語言(包括所有的蛋白質和氨基酸等等的序列),通過這些非常大規模的蛋白質數據,從中學習或理解到這些蛋白質內在的一些規律。基于這個規律從頭去設計新的蛋白質,這就是生物大語言模型之所以需要存在的一個非常必要的原因。
今年,百圖生科開放了AIGP(AI Generated Protein)平臺,并正致力于借助此平臺加速研發工作,降低研發成本,并使其成為一個即插即用的平臺,讓更多的藥物設計公司能夠復用這些平臺的建設。
未來,是否還會有更多AI輔助的生命科學研究和制藥領域的創新?是否還有更多算法可以在生命科學和醫藥創新領域里找到機遇和探索的空間?讓我們拭目以待。
如果您對本文涉及的基于Habana? Gaudi? 與英特爾? 至強? 可擴展處理器對AlphaFold2進行端到端優化的技術細節感興趣,如果您也想了解百圖生科在AIGP領域的最新進展,英特爾《至強實戰課》之《AI驅動的生命科學與醫藥創新》將為您帶來更加全面且詳細的真人講解,歡迎大家掃描海報中的二維碼注冊收看;
點擊“閱讀原文”也可以了解更多英特爾? 至強? 可擴展平臺對AlphaFold2的優化詳情。

*本文系量子位獲授權刊載,觀點僅為作者所有。
原文鏈接:https://www.intel.cn/content/www/cn/zh/customer-spotlight/cases/cpu-acceleration-alphafold2-next-level-throughput.html?cid=soc&source=Wechat&article_id=4848
- 長城汽車自研芯片點亮!提前布局下一代架構RISC-V,魏建軍:不能再受制于人2024-09-27
- 騰訊云發布自研大數據高性能計算引擎Meson,性能最高提升6倍2024-07-04
- Intel2024-03-18
- 數字員工全新發布 加速企業轉型2024-01-15



