醣化學新突破:以統計分析及機器學習解析醣合成反應

醣分子為細胞表面上主要及重要的結構,其複雜的結構形成特異的分子辨識,主導多個重要功能,例如細胞間的訊號傳遞、媒介細菌與病毒的感染,以及調控疾病的生成與進展。例如,醣類疫苗的發展,正是利用致病原外鞘膜與癌細胞表面上特有的醣分子作為基體,剖析其分子結構並尋找出具高免疫活性的醣序列,來協助自身免疫系統產生對應的抗體,以達到精準治療。

然而,醣分子的合成相當困難,至今產、學界仍然缺乏取得大量且高純度的醣類衍生物的合成通則和指導方針,根本原因在於其核心反應「醣鏈結反應」中,立體選擇性難以預測,產率也很難有效評估,導致以醣為核心之疫苗和藥物開發受到極大限制。

近期,由本院化學研究所王正中副研究員、本院翁啟惠院士共同帶領的研究團隊,開發出「GlycoComputer」軟體並建立即時預測網站「GlycoComputer: Explorer for chemical glycosylation」(網站連結),架起分子科學、演算法以及有機合成之間的橋樑,讓準確預測醣化學合成不再是夢想。此研究成果於今(2021)年2月26日刊登於國際期刊《德國應用化學》(Angewandte Chemie International Edition)。

在傳統醣疫苗開發中,需考量的反應物和合成環境變因高達11種以上,導致合成路徑的篩選和優化過程相當漫長且雜亂無章。合成單體的細微結構差異更左右著醣苷鍵生成的產率和立體位向,費勁耗時的研發過程使得複雜醣類藥物的量產過程遙不可及。有鑑於此,研究團隊開創GlycoComputer預測軟體以期解決此瓶頸。在進行合成反應前,以電腦輔助突破傳統合成思維,即能透過預測結果來篩選出成功率最高的合成路徑,大幅加速合成開發並促進寡糖和醣類疫苗的生產。

王正中指出:「傳統合成往往受限於盲目摸索,而經驗法則更容易受到主觀意識和人為判讀而有所偏歧。因此,機器學習和統計分析提供一個客觀基於大量數據的評估平臺,解析醣化學合成的多項變因」。藉由GlycoComputer程式,各種醣體活性、反應物以及試劑皆能明確定量並逐一分析和探討。此預測系統無須複雜的演算過程,即可準確合成醣類抗原疫苗並成功估算其合成結果,預計未來可大幅簡化醣類藥物分子的生產。

此研究由本院以及科技部支持。第一作者為王正中實驗室的張峻瑋博士;通訊作者為本院化學所王正中副研究員以及本院翁啟惠院士。

論文全文連結:https://onlinelibrary.wiley.com/doi/full/10.1002/anie.202013909

醣化學新突破:以統計分析及機器學習解析醣合成反應