在大衆的想像裡,研究材料科學就是一羣科學家穿着像兔寶寶一樣的無塵衣,熟練地操作貴重的儀器,開發出一系列氾濫親友Line群組的神奇新材料,如幾年前的「中東完了!」系列。其實很多時候,材料科學家的日常跟廚師有着驚人的相似!廚師們穿著潔白的廚師袍,準備各種不同的食材與調味料,控制煎煮炒炸的火候,最後端出讓人食指大動的美味料理。材料學家們面對的食材與調味料,就是不同的前驅物、溶劑、添加物與催化劑;而廚師煎煮炒炸的火候,則對應材料學家調控蒸鍍溫度、生長速度與退火時程等等製程參數。新穎材料製程的recipe,往往需要材料實驗室內的廚師們焚膏繼晷地爆肝試誤才能try出來。因此,就連材料學界大佬也曾自嘲自己的工作比較接近「the cooking thing」。

如同廚師們的各式異國料理,材料科學家們可分為金屬系、陶瓷系、有機系(不是有機食品的有機喔!)以及電子系材料。邁入21世紀後,融合(fusion)系料理開始風靡,材料廚師們融合有機系及陶瓷系材料,沒想到竟然煲出來了一鍋美味的鈣鈦礦濃湯!喜好重口味的材料廚師們再接再厲,不斷在鈣鈦礦濃湯內混入不同的有機、無機離子成分,沒想到這麼一番大亂燉的結果竟然大大提升了鈣鈦礦太陽能電池的效率以及使用壽命!金屬系的材料廚師們也不甘示弱,在鍋子裡倒入了多種(大於4種)金屬成分,也煲出了一鍋口感綿密、絕無顆粒感、比傳統合金材料更輕、更強、更耐腐蝕的高熵合金粥!隔壁的陶瓷系還有二維系的廚師們也不甘寂寞地端出了高熵陶瓷還有高熵二維材料等等功夫材料,一時之間大把大把的材料學者們在自己的材料廚房內殫精竭慮,期望能夠像黃蓉端出一道像「玉笛誰家聽落梅」(高熵奈米管?)的功夫材料,成為材料界的米其林廚神。

鍋子裡加的料越多,要變出一鍋好材料的recipe也越難try。Try recipe對材料學家來講是非常燒錢的苦差事。材料學家們的「食材」和「廚具」普遍比魚子醬和WMF金貴許多,比如一台上千萬的聚焦離子束「沙西米刀」,或ASML的極紫外光「烤箱」。烹煮美味料理的廚師們只要眼睛一瞄、鼻子一嗅、舌頭一嘗,馬上就知道這個recipe是成功還是失敗;材料學家們如果想知道自己的這一鍋是不是好料,可得動用到比眼鼻口更昂貴的儀器,如花費鉅資建設,佔地寬廣可在Google衛星上看到的「臺灣光子源」這支材料火眼。由於「開一次伙」的巨大開銷,試圖找出鈣鈦礦材料、高熵合金等大亂燉材料最佳recipe的材料學家們,慢慢將不懷好意的眼光投向了在旁沈迷電腦虛擬世界的工程師們……

電腦模擬動畫可以說是好萊塢的「摳死當(cost down)」神器。電腦可以模擬出幾可亂真的爆炸、巨浪等等特效,還有種種「黑雲壓城城欲摧」的活人、死人、殭屍、猩猩大軍的效果。片場拍片,幾個主角、一張綠幕加上主角們的自行腦補就可以搞定大部分場景。材料廚神們也希望電腦工程師們能夠在電腦上模擬他們心愛的大亂燉材料們,模擬出不同原子、分子在材料中最穩定的位置、模擬它們的振動、模擬它們在極限施壓下無奈分泌出差排時絕望的哀嚎!由於幾代計算科學家(包含1998、2013兩屆諾貝爾化學獎得主)的努力,材料廚神們的願望大部分得到了實現,理論上只要付出電費與時間,就可以觀賞大亂燉材料的原子尺度小電影,不必動用金貴的儀器就可以知道自己辛苦燉出來的這一鍋是米其林還是塑化劑。理想很豐滿,那現實呢?

很不幸的,問題就出在付出的「時間」上。要用電腦精確模擬這些成分複雜的大亂燉材料必須使用量子化學計算(quantum chemistry,以下簡稱QC)模擬幾乎每一「坨」電子的狀態(電子其實是「一坨坨」的電子雲哦!)。這個計算消耗的計算資源很大,計算時間很長,按下enter鍵開始計算到完成的時間足夠學生們去環台happy了。除此之外,QC計算能模擬的原子總數也不多,最多就上千顆原子!這樣數量的原子對應的材料尺寸還不夠模擬台積電的5奈米製程。考慮到大亂燉材料複雜的成分組合(四種以上化學成分,每種成分有各自的濃度),還有QC計算慢活的計算速度,材料廚師們所冀望的,完全用電腦模擬來找出大亂燉材料的神奇recipe,目前仍然是一個艱難的挑戰。

幸運的是,這幾年來高歌猛進的機器學習(machine learning,以下簡稱ML)提供了可能的解方。隨處可見的停車場車牌辨識系統,只要輸入照片,模型就會瞬間輸出辨識出的車牌號碼。那麼,如果我們把模型的輸入改成材料中的原子種類及位置,訓練好模型,是不是也可以「咻」一下輸出材料的性質呢?這個問題的答案是肯定的。

圖一表示了可以用來快速預測材料系統能量的ML模型,只要輸入原子種類與座標,就可以輸出對應的系統能量,「水往低處流」,低能量的材料結構是最容易出現的,我們只要找出能量低的材料結構,任務就完成一大半囉!那麼,用ML模型比用QC計算快多少?我們的實測顯示,對一個將近2,600顆原子的鈣鈦礦晶體,ML可以把能量預測從使用QC計算的將近3小時壓到0.1秒!這樣跑的飛快的模型準確度如何呢?圖一也顯示了ML模型預測的鈣鈦礦晶體能量(紅線)與QC計算所得能量(藍線)的比較,很明顯的,這個訓練好的模型能夠準確的預測這個鈣鈦礦材料的能量。ML模型能夠又快速、又準確的預測鈣鈦礦結構能量,那我們又能利用這些模型來做些什麼幫助材料廚師們呢?

圖一、機器學習模型(上)與模型預測鈣鈦礦材料能量的準確度(下)。量子化學計算是使用密度泛函理論計算軟體VASP

鈣鈦礦大亂燉濃湯近幾年來一直都是鈣鈦礦材料的效率擔當,其中一個例子是如圖二顯示的MAyFA1-yPb(BrxI1-x)3鈣鈦礦[x、y分別表示溴(Br)、甲胺(MA)離子的相對濃度]。注意這鍋大亂燉總共包含了碳、氮、氫、鉛、溴、碘6種元素!為了找出決定最佳recipe的關鍵,我們利用ML模型搜尋了81種成分濃度組合,將近100萬種不同的結構,並與實驗團隊量測的效率比對,發現影響大亂燉效率的關鍵因素是離子大小問題:由於碘(I)和甲脒(FA)是相對較大的陰/陽離子,當少量的碘或甲脒被塞到鈣鈦礦晶體裡時,會引起晶體不適(想想不小心吞了一大塊客家麻糬的感覺),晶體當然是沒辦法把塞進去的大顆陰/陽離子吐出來的,含淚吞了少量大顆陰/陽離子的鈣鈦礦,只能無奈將大的陰離子(碘)跟小的陽離子(甲胺)集中「代謝」到晶體的某個地方,可是這樣整鍋鈣鈦礦濃湯就不再是如絲般滑順,而是有顆粒感了,這些析出的顆粒在晶體內會引入缺陷,因此影響到材料的表現!

所以,鈣鈦礦濃湯的最佳recipe,需要小心控制大顆陰/陽離子的濃度,超過臨界濃度無法吸收可是會析出「結石」的!除了 MAyFA1-yPb(BrxI1-x)3鈣鈦礦大亂燉之外,我們還有訓練模型來虐待
(NixCo1-x)y(HfmTinZr1-m-n)1-y高熵合金奈米線,如圖二右半所示,這個密集恐懼症慎入的模擬系統有超過10萬顆原子(不同顏色小球表示不同種類原子),這已經是目前QC計算遠遠無法企及的大小了,而我們可以模擬它在極限施壓下彎折並且局部出現非晶態(如圖二橘色圈內部分)。這兩個例子都展示了機器學習模型在研究複雜組成材料的潛力!

圖二、以機器學習模型研究複雜鈣鈦礦(左)與高熵合金(右)材料。

儘管有這些振奮人心的發展,機器學習應用在找尋大亂燉材料的recipe的任務仍然是「路漫漫其修遠兮」!目前的最大瓶頸在模型「訓練」過程上。訓練集包含了上千筆QC計算能處理的小型系統,「慢活」的QC計算要將這些結構的對應能量算出來做為標記,會花費掉相當多時間。更麻煩的是,訓練集包含的材料結構必須盡可能考慮到所有可能,對大亂燉材料而言,因為其極大的可能成分組合,訓練集涵蓋的結構組合可能會有所遺漏而導致預測結果失真,訓練過程自動化(自主學習)因此成為當前熱門的方向之一。

機器學習儘管為破解大亂燉材料的神奇recipe指出了一個很有潛力的方向,將來還是需要努力上下求索,方能使這個理想成為現實!