騰訊量子實驗室公開自建的Alchemy數(shù)據(jù)庫,發(fā)起Tencent Alchemy 2019競賽,挖掘算法的泛化性能,推動學(xué)術(shù)界與產(chǎn)業(yè)界聚焦化學(xué)中分子的量子性質(zhì)預(yù)測問題,及其AI解決方案。
希望該競賽能激發(fā)不同領(lǐng)域人才的合作創(chuàng)新活力,推動分子科學(xué)及應(yīng)用的加速進展,助力整體生態(tài)成長和相關(guān)產(chǎn)業(yè)發(fā)展。
競賽背景
騰訊量子實驗室積極探索將量子和AI技術(shù)應(yīng)用于化學(xué)研究,及其在制藥材料等行業(yè)中的潛在應(yīng)用。該領(lǐng)域中的一個重要挑戰(zhàn)是現(xiàn)有的大部分實驗化學(xué)數(shù)據(jù)包含大量的噪聲,這對還在初期階段的AI化學(xué)和制藥模型的研發(fā)與評估帶來了很大的困難。
一個解決方案是用高精度的量子化學(xué)計算來搭建可靠的分子數(shù)據(jù)庫,以供AI算法的研發(fā)和評估使用。但這需要耗費大量的計算資源,事實上,現(xiàn)有的公開數(shù)據(jù)庫只提供了非常小而特殊的分子的性質(zhì),這對算法開發(fā)的作用已日趨飽和。
騰訊量子實驗室利用騰訊強大的計算能力,自建了分子量子性質(zhì)數(shù)據(jù)庫-Alchemy:一個全新的、包含更大分子的,更豐富結(jié)構(gòu)的高質(zhì)量數(shù)據(jù)庫,有望極大加速AI化學(xué)和制藥領(lǐng)域的發(fā)展進程。
競賽任務(wù)
在競賽中,參賽者可根據(jù)騰訊量子實驗室提供的分子訓(xùn)練集,自由使用機器學(xué)習(xí)算法預(yù)測分子的包含幾何、電子、熱力學(xué)性質(zhì)等方面的12個屬性(列表1),按要求提交結(jié)果。最終比賽將基于12個回歸任務(wù)的平均誤差來評估。
△?列表1:分子待預(yù)測的12個屬性
量子力學(xué)性質(zhì)對于預(yù)測分子在某些環(huán)境下的的行為至關(guān)重要。例如,HOMO和LUMO能量,以及Free energy等屬性都有助于預(yù)測分子的化學(xué)反應(yīng)結(jié)果。
參賽對象
此次競賽面向全社會。國內(nèi)外高等院校、科研單位、企業(yè)人員均可報名參賽。
(大賽主辦和合作伙伴,以及有機會接觸競賽題目和數(shù)據(jù)的工作人員不能參與比賽。)
報名方式
訪問競賽官網(wǎng) https://alchemy.tencent.com ,即可報名參賽
競賽流程
準備階段:2019年5月22日-7月31日。
評測階段:2019年8月1日-9月30日。
公布結(jié)果:2019年12月31日前。
獎項設(shè)置
一等獎 ¥50,000
二等獎 ¥30,000
三等獎 ¥20,000
特別介紹:分子量子性質(zhì)數(shù)據(jù)庫-Alchemy
使用量子模擬的方法生成分子數(shù)據(jù)庫已經(jīng)在這個領(lǐng)域有所嘗試,不過由于算力的限制,學(xué)術(shù)界已有的分子數(shù)據(jù)庫大多由小分子(重原子數(shù)量≤9)組成。現(xiàn)有公開數(shù)據(jù)庫中(列表2),QM9擁有最多的分子數(shù)量并且計算了多達12個分子的量子力學(xué)性質(zhì)(列表1)。
△?列表2:Alchemy與現(xiàn)有分子數(shù)據(jù)庫的對比
Alchemy數(shù)據(jù)庫是基于QM9的一個擴展,有更為豐富的分子結(jié)構(gòu)(重原子數(shù)量9-12),包括更多元的重原子類型(S 和 Cl),而且分子樣本是從GDB MedChem這一藥物化學(xué)性質(zhì)良好的分子數(shù)據(jù)庫中篩選出來,具有較高的藥物開發(fā)潛在價值。對比總結(jié)如下表(列表3)。
△?列表3:Alchemy與QM9的詳細對比
期望Alchemy這樣一個全新的、包含更大分子的高質(zhì)量數(shù)據(jù)庫,能夠助力分子科學(xué)及其應(yīng)用,為AI化學(xué)和制藥助力!
大賽已于5月22日正式發(fā)布,第一階段將于7月31日結(jié)束,更多詳情歡迎前往官網(wǎng) https://alchemy.tencent.com 了解!
— 完 —




