「醣」是生物體中最重要的分子之一,從細胞之間的互動到癌細胞的增生,都與醣分子息息相關。然而,取得特定的醣分子原非易事,一直到「一鍋化」系列方法問世,科學家才得以人工方法合成足量、純粹的醣分子。如今,拜人工智慧與演算法之賜,「一鍋合成法」將更加方便廣泛!

本院翁啟惠院士繼「一鍋式酵素合成法」及「程式化一鍋合成法」後,近期又與本院基因體研究中心吳宗益研究員,及資訊科學研究所許聞廉特聘研究員跨領域合作,結合人工智慧(AI)及演算法(Algorithm),寫成電腦軟體「Auto-CHO」與學術社群共享,讓「程式化一鍋合成法」更上層樓。今後的科學家可以如閱讀食譜一般,更快速且廣泛地合成醣分子,並可望對與醣分子有關的疾病提出更多解方。

研究成果已於本(12)月6日登上國際期刊《自然通訊》(Nature Communications)

醣分子的食譜軟體開放原始碼! 「一鍋化」與人工智慧、演算法跨域結合

1982年的「一鍋式酵素合成法」使用生物方式,以酵素將單醣合成為寡醣;1999年的「程式化一鍋合成法」則採用化學方式,將單醣所組成的組合單元(Building blocks, BBL),依據其相對反應值(relative reactivity values,RRV),建入電腦程式資料庫Optimer,科學家只要將想合成的寡醣結構輸入,該程式即可自動找出適合的組合單元。

然而,既有的程式化一鍋合成法也有資料庫小、RRV排序要求等限制。吳宗益研究員表示,本次研究成果Auto-CHO軟體,將資料庫從原有的50個組合單元,增加至154個RRV經實證的組合單元,及5萬個具預測RRV的「虛擬」組合單元,並將醣分子的合成以階層化處理,除了能讓不同的一鍋化產物互相使用,更讓醣分子合成的階段以流程圖呈現。

許聞廉特聘研究員表示,由於醣分子的種類繁多 ,以實驗一一測量其組合單元的RRV會耗費大量時間精力,因此,研究團隊使用人工智慧學習方法,將經實驗證實的醣組合單元資料,透過特徵工程(feature engineering)建立最佳化的「RRV預測模型」。此模型無論在交叉驗證(cross-validation)或獨立驗證(independent test)上皆有傑出表現,而許多虛擬組合單元也進一步通過實驗證實。

此外,研究團隊設計了一套演算法,將醣分子的合成過程拆解成不同階層,讓一個以一鍋化方法合成的醣片段,可作為新的醣元件用於另一個一鍋化方法。團隊並以此開發為視覺化操作軟體Auto-CHO,將一鍋化方法整理成步驟架構,如同一篇可依序調配的「食譜」。依據Auto-CHO提供的「食譜」,研究團隊已成功合成出四種生物學上重要的寡醣分子。

研究團隊亦決定公開Auto-CHO的原始碼,提供科學界免費使用,並讓使用該程式的化學家們,可將虛擬醣元件的使用心得回饋,讓廣大的研究社群可以共襄盛舉,持續修正和增添資料庫的內容。

本篇論文標題為「Hierarchical and Programmable One-Pot Synthesis of Oligosacchaides」,第一作者為本院TIGP生物資訊學程博士生鄭成偉,論文全文可於下列網址存取閱讀:https://doi.org/10.1038/s41467-018-07618-8

 

醣分子的食譜軟體開放原始碼! 「一鍋化」與人工智慧、演算法跨域結合

圖說: a)概念描述,醣分子合成標的輸入Auto-CHO軟體後,透過醣組合單元資料庫搜尋,軟體回傳可行的一鍋化合成方案。醣元件的RRV可以是實驗驗證的或是預測的。 b)細節描述,包括如何建構RRV預測模型並建立虛擬醣組合單元資料庫。

 

(基因體研究中心、資訊科學研究所)