在人們的傳統(tǒng)印象里,在實驗室搞研究的都是穿白大褂的科研人員。但在中國科學(xué)技術(shù)大學(xué)(以下簡稱“中國科大”)機器化學(xué)家實驗室里,卻是另一番景象:這里沒有一個人,只有動作靈活的機器人在操作臺之間來回穿梭,伸出機械手臂配制試劑。它不僅能夠做實驗,還會自主設(shè)計實驗步驟和方案。
這款全球首個集閱讀文獻、設(shè)計實驗、自主優(yōu)化等功能于一體,覆蓋化學(xué)品開發(fā)全流程的機器化學(xué)家平臺,被科研人員形象地稱為“機器化學(xué)家”。
實驗室負責(zé)人、中國科大化學(xué)物理系教授江俊介紹:“從數(shù)百萬種材料的可能組合中找到最優(yōu)解,科研人員也許一生都做不完;有了機器化學(xué)家,可能只需要一兩周時間?!?/p>
機器化學(xué)家融合了大數(shù)據(jù)、人工智能和自動化的強大優(yōu)勢,為化學(xué)這一傳統(tǒng)學(xué)科提供了新的研究范式。
那么,這款如此聰慧的機器化學(xué)家是如何誕生的?時任中國科大化學(xué)物理系執(zhí)行主任、現(xiàn)任中國科大合肥微尺度物質(zhì)科學(xué)國家研究中心主任羅毅說:“這是天時、地利、人和的結(jié)果?!?/p>
機器化學(xué)家“小來”在做實驗。中國科大供圖
天時:科研發(fā)展的必然
2011年底,江俊決定回國加入中國科大,與他在瑞典皇家理工學(xué)院攻讀博士學(xué)位的導(dǎo)師羅毅再次攜手。
兩人都從事理論和計算化學(xué)方面的研究,但各有側(cè)重。羅毅主攻解析高分辨單分子化學(xué)成像,江俊則更關(guān)注材料設(shè)計和微觀機理的研究。
2013年底的一天,羅毅與江俊一起出差。在路上,羅毅拋出一個問題:基于獨立事例的理論計算,雖然符合傳統(tǒng)研究范式,但效率太低。有沒有可能通過大數(shù)據(jù)技術(shù)提高效率?
江俊經(jīng)過調(diào)研后發(fā)現(xiàn),我國嚴(yán)重缺乏科學(xué)數(shù)據(jù)的積累,在學(xué)術(shù)上非常被動。
“我們做了大量研究工作,但最終成果發(fā)表在外文期刊上。引用這些論文數(shù)據(jù)時還得花錢買,并且只有訪問權(quán),不允許大量下載?!苯≌J(rèn)為,要用好大數(shù)據(jù)技術(shù),必須首先建立數(shù)據(jù)系統(tǒng)。
從2014年起,江俊帶領(lǐng)學(xué)生收集教科書、論文、專利中“沉淀”的化學(xué)經(jīng)驗和知識,用3年搭建起“中國人自己的化學(xué)材料大數(shù)據(jù)庫”。
有了足夠的數(shù)據(jù)后,接下來的問題就是如何使用。在技術(shù)上,人工智能是處理大數(shù)據(jù)最好的手段。然而,這對羅毅、江俊而言是一個全新的工具。
不懂就學(xué),知難而上。他們以自己熟悉的譜學(xué)、催化為抓手,應(yīng)用人工智能方法開展研究,取得了良好的效果。值得一提的是,江俊發(fā)現(xiàn)的多個功能強大的描述符,被《科學(xué)》雜志兩次專文推薦。
雖然融合了人工智能技術(shù),但如何用大數(shù)據(jù)解決實際的化學(xué)問題,依舊是個挑戰(zhàn)。“因為數(shù)據(jù)本身缺乏知識邏輯的關(guān)聯(lián)。”羅毅說。
2017年的一天,羅毅想到一個好點子:可否借助本校兩位教授在發(fā)光材料、催化劑領(lǐng)域的深厚積累,將他們的知識與大數(shù)據(jù)庫融合?
他激動地將江俊叫到辦公室,說:“你把張國慶、熊宇杰發(fā)表的論文全部讀一遍,這樣就能形成一個‘張國慶大腦’、一個‘熊宇杰大腦’。研究發(fā)光材料時,就調(diào)用‘張國慶大腦’;設(shè)計催化劑時,就調(diào)用‘熊宇杰大腦’。這樣一來,我們這些化學(xué)知識不足的人也可以用好數(shù)據(jù)了?!?/p>
就這樣,江俊和同學(xué)們一起對海量文本數(shù)據(jù)進行人工標(biāo)注,逐步賦予計算機自主閱讀并分析文獻資料的能力,僅用兩年就成功培育出一顆“化學(xué)大腦”。
“化學(xué)大腦”有了,下一步就是想辦法給大腦配上可以實際操作的“雙手”。
2020年,英國利物浦大學(xué)安德魯·庫珀團隊建造了世界首個移動機器人實驗員。研讀完他們發(fā)表的相關(guān)文章,江俊信心滿滿地對羅毅說:“我們不但可以讓機器人做實驗,還可以給機器人配上‘化學(xué)大腦’?!?/p>
同年,在中國科大的一次交叉學(xué)科論壇上,江俊認(rèn)識了該校信息科學(xué)技術(shù)學(xué)院從事機器人研究的副教授尚偉偉,兩人在聯(lián)手研發(fā)機器化學(xué)家上一拍即合。
于是,在江俊的帶領(lǐng)下,他們迅速組織了一個青年團隊,夜以繼日協(xié)同攻關(guān)。
2021年12月,全球首個數(shù)據(jù)智能驅(qū)動的機器化學(xué)家,終于在中國誕生了。它融合“化學(xué)大腦”,集成了兩臺移動機器人、19個智能化學(xué)工作站和高通量計算系統(tǒng),覆蓋科學(xué)研究方法論全流程。
2022年9月,相關(guān)研究成果發(fā)表在《國家科學(xué)評論》上。審稿專家如此評價:這款機器化學(xué)家的“機器人系統(tǒng)、工作站和智能化學(xué)大腦都是最先進的”,“將對化學(xué)科學(xué)產(chǎn)生巨大影響”。
“機器化學(xué)家不是某天一拍腦袋就能做出來的?!绷_毅說,“這是我們與時俱進、吸納新知識、利用新技術(shù)解決問題的過程,也是持續(xù)進行科研探索的必然結(jié)果?!?/p>
地利:多學(xué)科交叉的優(yōu)勢
創(chuàng)造出這樣一位能閱讀、能思考、能實踐、能最終解決問題的機器化學(xué)家,并非易事。
江俊認(rèn)為,這主要得益于中國科學(xué)院集成攻關(guān)的傳統(tǒng)和中國科大寬松的科研環(huán)境、多學(xué)科交叉的優(yōu)勢。
他回憶,大數(shù)據(jù)模型建立后,需要在實驗中進一步驗證,這意味著更大的投入。
2021年初,中國科學(xué)院發(fā)布了當(dāng)年基礎(chǔ)前沿和關(guān)鍵核心技術(shù)中的重大科學(xué)問題清單,“數(shù)據(jù)驅(qū)動的化學(xué)、材料和生物科學(xué)的機器科學(xué)家”是46個項目之一。
江俊鼓起勇氣,決定“揭榜掛帥”。很快,他的項目申請獲得通過。從2021年到2025年,中國科學(xué)院將拿出2000萬元經(jīng)費,給予江俊團隊連續(xù)5年的穩(wěn)定支持。
也是在2021年,江俊向中國科大提交了一份“‘雙一流’學(xué)科重點項目建議表”。學(xué)校研究后,給予1000萬元經(jīng)費支持。同時,中國科大合肥微尺度物質(zhì)科學(xué)國家研究中心、化學(xué)與材料科學(xué)學(xué)院出手相援,為研發(fā)團隊提供了研發(fā)場地、調(diào)配了研究設(shè)備。
“這種快速決策、快速支持、快速撥款的響應(yīng)機制給了我很大激勵,也為研究提供了及時、充分的保障。在人工智能領(lǐng)域,技術(shù)迭代速度極快,一步落后就會步步落后?!苯≌f。
中國科大還有一個天然優(yōu)勢:這里會聚了不同學(xué)科背景的科研人員,他們可以優(yōu)勢互補、協(xié)同攻關(guān),更加快速地把構(gòu)想變成現(xiàn)實。
例如,機器人是整個平臺中的重要一環(huán)。當(dāng)初,尚偉偉與江俊商量后,愿意改變團隊的研究方向,專門研發(fā)實驗機器人。
安德魯·庫珀在參觀機器化學(xué)家實驗室時,最羨慕的就是江俊他們擁有自己的機器人研發(fā)團隊。江俊頗為自豪地說:“化學(xué)機器人指令集的每一行代碼都是我們團隊自己寫出來的,如果要做一個新的動作,可以隨時調(diào)整代碼。安德魯·庫珀則必須請公司改代碼,因為他的機器人是買來的?!保ㄓ浾咄趺簦?/p>
研究團隊在控制室分析電催化機器實驗數(shù)據(jù)結(jié)果。張大崗 攝
(未完待續(xù))
責(zé)任編輯:魏敏