GPT-4搞科研登Nature!布洛芬配方輕松拿捏,諾獎得主提出的復雜反應也能完成
網(wǎng)友:更多博士失業(yè)了
西風 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
AI大模型“化學家”登Nature!
能夠自制阿司匹林、對乙酰氨基酚、布洛芬的那種。
就連復雜的鈀催化交叉偶聯(lián)反應,也能完成!
要知道,2010年諾貝爾化學獎獲得者就因為對該反應的研究才獲獎的,這類反應可以高效地構(gòu)建碳-碳鍵,生成很多以往很難甚至無法合成的物質(zhì)。

而現(xiàn)在名為Coscientist,基于GPT-4等大模型的AI系統(tǒng),可快速準確地自主完成檢索信息、規(guī)劃及設計實驗、編寫程序、遠程操控自動化系統(tǒng)做實驗、分析數(shù)據(jù)的一整套流程。

一位主頁標注自己是化學家的網(wǎng)友表示:
栓Q,你們創(chuàng)造了更多失業(yè)的博士生。

那么Coscientist究竟是如何做到的?
“化學家”Coscientist長啥樣?
Coscientist由卡內(nèi)基梅隆大學的研究團隊開發(fā)。
前不久谷歌DeepMind造的AI“化學家”也登上了Nature,號稱一口氣能預測220萬種新材料。
而現(xiàn)在Coscientist則是實打?qū)嵞茏灾魍瓿珊罄m(xù)所有實驗流程。
能夠完成如此復雜的實驗任務,關鍵在于多模塊交互的系統(tǒng)架構(gòu)。

Coscientist內(nèi)含五大模塊:Planner、Web searcher、Code execution、Docs searcher、Automation。
其中Planner模塊是整個系統(tǒng)的智能中樞,它基于GPT-4打造,負責根據(jù)用戶的輸入,調(diào)用和協(xié)調(diào)其它模塊來規(guī)劃和推進整個實驗。
Planner可以發(fā)出GOOGLE、PYTHON、DOCUMENTATION和EXPERIMENT四個指令。
GOOGLE指令負責使用Web searcher模塊在互聯(lián)網(wǎng)中檢索關于實驗的信息,Web searcher本身也是一個大模型。
PYTHON指令控制Code execution模塊,Code execution是一個隔離的Docker容器,提供一個獨立的Python執(zhí)行環(huán)境,可以完成實驗相關的計算工作。
DOCUMENTATION指令控制Docs searcher模塊,也是用來為中樞提供信息。
但與Web searcher不同,Docs searcher是用于文本檢索和文檔理解。它可以定位實驗設備的技術文檔,比如機械手編程手冊,通過文本挖掘提供給Planner模塊必要的實驗參數(shù)及操作細節(jié)。
而后,Automation模塊負責自動化連接實際實驗設備的API,將Planner制定的實驗方案轉(zhuǎn)換為設備控制代碼,下發(fā)執(zhí)行,完成實驗操作。
比如,在“云實驗室”中遠程操控移液機器人開展實驗。

如此一來,假設要求Coscientist合成某種物質(zhì)時,Coscientist會在互聯(lián)網(wǎng)上搜索合成路線;然后設計所需反應的實驗方案;下一步編寫代碼來指導移液機器人;最后運行代碼,使機器人執(zhí)行其預定的任務。
值得一提是,Coscientist還可以進行迭代優(yōu)化,從反應結(jié)果中學習,并建議修改方案來改進實驗。
總的來說Coscientist能完成六大任務:
- 根據(jù)公開數(shù)據(jù)規(guī)劃已知化合物的合成;
- 有效搜索和瀏覽大量的硬件文檔;
- 使用文檔中的信息在云實驗室執(zhí)行高級命令;
- 用低級指令精確控制液體處理儀器;
- 處理需要同時使用多個硬件模塊并整合不同數(shù)據(jù)源的復雜科學任務;
- 通過分析之前收集的實驗數(shù)據(jù)解決優(yōu)化問題。
成功完成鈀催化交叉偶聯(lián)反應
Coscientist表現(xiàn)究竟如何?研究人員對多個模塊進行了測試。
其中,為測試Coscientist設計化學反應流程的能力,研究團隊要求Coscientist通過檢索學習分別生成阿司匹林、對乙酰氨基酚和布洛芬等藥物分子。
并且還設置了GPT-3.5、GPT-4、Claude 1.3、Falcon-40B-Instruct不同模型的比較。

基于GPT-4的Web Searcher顯著改進了合成計劃,在對乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有試驗中都達到了最高分(上圖b,數(shù)字“5”代表生成了一個非常詳細且化學上準確的操作步驟)。
重點還要看Coscientist的一體化能力。為此,研究人員設計了催化交叉偶聯(lián)實驗。
研究人員設置了可利用的實驗設備,包含:OpenTrons OT-2液體處理機器人;數(shù)個微板,包括放置反應物的源微板和放置在加熱震蕩模塊上的目標微板。
源板上準備了實驗所需的試劑,包括己烷基碘、溴苯、氯苯、苯基乙炔、苯硼酸等原料,還有催化劑、堿和溶劑。
Coscientist的目標是利用這些試劑成功設計和運行兩種常見鈀催化偶聯(lián)反應Suzuki反應和Sonogashira反應。
Coscientist首先通過Web searcher模塊搜索確定Suzuki反應和Sonogashira反應的最佳反應條件,如溫度、當量比等參數(shù)。

然后合理選擇了不同的試劑,例如Suzuki反應時優(yōu)先選擇溴苯而不是氯苯。同時Coscientist提供選擇的化學依據(jù),如反應活性。
接著,Coscientist調(diào)用Code execution模塊,根據(jù)各反應物的濃度和當量計量計算所需體積。
生成控制機器人進行移液操作的Python代碼,指定源孔板與目標孔板之間的轉(zhuǎn)移體積。

但中間出現(xiàn)個小插曲,最初使用的加熱震蕩模塊的方法名錯誤。
之后Coscientist迅速查閱了Opentrons設備文檔糾正了方法名,重新生成正確代碼,成功完成了Suzuki反應和Sonogashira反應。

最終,產(chǎn)物通過GC-MS技術驗證,檢測到目標產(chǎn)物的特征質(zhì)譜信號,證實目標產(chǎn)物生成。
論文鏈接:https://www.nature.com/articles/s41586-023-06792-0
- 商湯分拆了一家AI醫(yī)療公司,半年融資10億,劍指“醫(yī)療世界模型”2025-12-02
- “豆包手機”在二手市場價格都翻倍了……2025-12-05
- OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta2025-12-03
- 讓大模型學會“高維找茬”,中國聯(lián)通新研究解決長文本圖像檢索痛點|AAAI 2026 Oral2025-12-01




