近年來,AlphaFold的橫空出世在結構生物學領域實現了一場變革。這種能準確預測蛋白結構的AI系統,已經應用於生命科學研究的各個場景。去年7月,AlphaFold預測出98。5%的人類蛋白結構;現在,AlphaFold又站上了藥物研發的戰線。其預測的結構可以促進基於結構的藥物設計,特別是對於那些缺乏足夠的蛋白結構資訊的新靶點。
近日,英矽智慧公司的研發團隊就藉助AlphaFold,
針對一個缺乏可用蛋白結構資訊的新型靶點,開發出潛在的全球首創(first-in-class)苗頭化合物。
目前該論文已上傳至arXiv預印本平臺。
在這項工作中,研發團隊將AlphaFold應用於英矽智慧開發的端到端AI藥物發現引擎中,這個引擎由
生物計算平臺PandaOmics
和
生成化學平臺Chemistry42
組成。
其中,PandaOmics以來自組學和文字資料的資訊為起點,將AI深度學習和生物資訊學方法相結合,用於資料的分析、視覺化和解讀,
判定基因與疾病靶點的關聯性,從而找到有潛力的靶點。
不過,如果這些靶點沒有明確的晶體結構,傳統方法將難以繼續開展研究。這時,AlphaFold的作用就體現了出來:它能夠準確地預測蛋白結構,這樣研究者就可以
選擇最具潛力的靶點,運用Chemistry42 平臺設計苗頭化合物。
▲研發團隊將 AlphaFold與英矽智慧的AI藥物發現平臺 PandaOmics 和 Chemistry42 相結合,針對肝細胞癌進行靶點發現與苗頭化合物的設計和生成。
(圖片來源:參考資料[1])
在這項研究中,這個引擎尋找的是針對
肝細胞癌
的靶點。根據國際癌症研究機構 (IARC) 釋出的全球癌症(GLOBOCAN)統計報告2020年版,原發性肝癌是全球第六大常見癌種,也是癌症死亡的第三大原因。肝細胞癌 (HCC) 是肝癌的主要型別,約佔患者總人數的 75%。由於預後不佳,全球範圍內肝癌的死亡率和發病率不相上下。
為了尋找治療靶點,研發團隊首先獲取了包含1133 個患者樣本和 674 個健康樣本的肝細胞癌資料集。利用這些資料,PandaOmics篩選出20個有潛力的靶點。由於AlphaFold已經預測出這些靶點的晶體結構,PandaOmics可以基於靶點與疾病的關聯度給出評分。這樣,作者確定了得分最高的靶點——
細胞週期蛋白依賴性激酶20(CDK20)
。
已有研究發現,CDK20在結直腸癌、肝細胞癌、肺癌和卵巢癌等多種癌症患者的腫瘤樣本中過度表達。這個分子透過多種方式促進腫瘤細胞的生長與增殖:
它們不僅參與調節腫瘤細胞週期和致癌訊號傳導,還與某些腫瘤的免疫抑制相關。
因此,儘管發現的時間不長, CDK20已經引起了廣泛關注。CDK20 抑制劑一旦問世,將有望成為癌症,特別是肝細胞癌的創新療法。
▲英矽智慧針對CDK20靶點的苗頭化合物生成過程
(圖片來源:參考資料[1])
但遺憾的是,儘管針對CDK家族其他部分成員的藥物研發大獲成功(例如多款CDK4/6抑制劑已經獲批上市,用於治療乳腺癌、肺癌等),但針對CDK20抑制劑的研發尚未出現。一個重要原因就在於,CDK20沒有可用的蛋白結構資訊。在這項最新研究中,
基於Alphafold 預測的蛋白結構,Chemistry42成功設計、生成了潛在的CDK20 抑制劑。
▲A) CDK20的 AlphaFold 預測結構;B) CDK20 的 ATP 結合口袋
(圖片來源:參考資料[1])
Chemistry42從預測的蛋白結構中發現,CDK20有一個較淺的ATP結合口袋。結合這個口袋的結構特性,Chemistry42設計並生成了8918種分子結構,並且最終篩選出7個最具潛力的化合物進行合成。
▲Chemistry42生成的7 個分子的化學結構
(圖片來源:參考資料[1])
透過進一步的評估,研發團隊發現在7個候選化合物中,
化合物ISM042-2-001與CDK20結合的能力極強。
研發團隊隨後預測了其結合模式,基於這一模式,研發團隊目前正在對ISM042-2-001進行更多衍生物的設計與合成,以進一步提高酶活性。
在這篇論文裡,研發團隊展示了將AlphaFold與AI引擎PandaOmics和Chemistry42相結合,
在30天內完成了靶點選擇、分子生成、化合物合成和生物學測試
,最終快速發現有望治療肝細胞癌的苗頭化合物分子。目前,對該分子的進一步最佳化仍在進行中。這項研究也是將 AlphaFold 預測的蛋白結構用於藥物研發的一個例項,之後英矽智慧也會繼續公佈對其他靶點型別(如GPCR和E3連線酶)的進一步研究。
參考資料:
[1] Feng Ren et al。, AlphaFold Accelerates Artificial Intelligence Powered Drug Discovery: Efficient Discovery of a Novel Cyclin-dependent Kinase 20 (CDK20) Small Molecule Inhibitor。 arXiv:2201。09647