
機器學習和大數據正幫助化學家搜尋藥物
2016年,制藥公司Sunovion給一群經驗豐富的員工布置了一項不同尋常的作業。在位于美國馬薩諸塞州馬爾伯勒的公司總部,這些藥劑師被要求玩一個游戲,以便確定誰能發現針對新藥的最好的先導化合物。他們的工作臺上是一個由上百種化學結構組成的網格,其中僅有10種被標上了關于其生物效應的信息。專家們不得不利用辛苦獲得的化學結構和生物學方面的知識,選擇其他可能最終成為候選藥物的分子。在11名參與者中,有10人花了好幾個小時才艱難地完成任務。不過,有1名參與者僅用了幾毫秒便輕松過關——因為它是一個算法。
這個電腦程序是Willem van Hoorn腦力勞動的產物。van Hoorn是利用人工智能設計藥物的初創公司——Exscientia化學信息學部門的負責人。該公司總部位于英國敦提,想同Sunovion擴展新興的伙伴關系,因此這次比賽事關重大?!拔业男抛u冒著極大的風險?!眝an Hoorn說。20輪游戲過后,他統計了得分,然后長舒了一口氣。只有一位尋找藥物的專家打敗了機器。
自此以后,Exscientia和Sunovion繼續開展合作,以發現精神治療藥物?!斑@場競賽確實幫助獲得了那些作出化學研究決定的人們的支持?!痹赟unovion公司負責計算化學業務的Scott Brown表示。
探索化學宇宙
要想在化學宇宙中“航行”,最好有一幅地圖。2001年,瑞士伯爾尼大學化學家Jean-Louis Reymond開始利用計算機繪制盡可能多的化學空間。16年后,他積累了全世界最大的小分子數據庫——由1660億種化合物構成的巨大虛擬庫。這個被稱為GDB-17的數據庫包括所有最多由17個原子構成并且從化學角度看很合理的有機分子。這也是Reymond的計算機所能處理的數據量的上限。
為理解這些繁多的可能的藥物起點,Reymond想到了一種組織化學宇宙的方法。受元素周期表的啟發,他將化合物在一個多維空間中分組。在這個空間中,鄰近的化合物擁有相關聯的屬性。位置則根據諸如每種化合物有多少個碳原子等42個特征進行分配。
對于每種進入市場的藥物來說,會有幾百萬種化合物在化學性質上和其幾乎相同。其中一些化合物的表現甚至比已經獲批的藥物還好。藥劑師在沒有外界幫助的情況下幾乎不可能想象出所有這些差異?!肮庥眉埡凸P,你肯定沒辦法搞清楚這些同分異構體?!盧eymond表示。
Reymond和同事通過尋找化合物之間的相似性,辨別出在治療上有前景的被證實藥物的“近鄰”。該團隊利用一種特定的藥物作為起點,僅在3分鐘內便梳理了數據庫中所有1660億種化合物,以尋找引人注目的候選藥物。在一項概念驗證實驗中,Reymond從一種同煙堿型乙酰膽堿受體(一個和神經系統以及肌肉功能相關的疾病的有用靶點)相結合的已知分子入手,編輯了一個由344種相關化合物組成的最終候選藥物名單。該團隊合成了3種藥物,并且發現有兩種可強有力地激活上述受體,因此可能在治療衰老過程中出現的肌肉萎縮方面排上用場。Reymond介紹說,這種方法就像利用地質圖弄清楚到哪里開采黃金?!澳阈枰恍┓椒ㄟx擇將去哪里挖掘?!?
另一種替代方法
另一種替代方法利用計算機獲得眾多金礦位置,而無須過多擔心起始地點。就尋找藥物而言,這意味著在巨大的化合物庫中進行篩選,以尋找同既定蛋白相結合的小分子。首先,研究人員利用X射線結晶學拍下蛋白的快照,以確定結合部位的形狀。隨后,利用分子對接算法,計算化學家一步步地搜遍整個化合物數據庫,以尋找針對任何既定部位的最佳匹配小分子。
隨著計算能力的爆發,這些算法的性能也得以改善。2016年,由Brian Shoichet領導的加州大學舊金山分?;瘜W家在尋找一類新的止痛藥的過程中,展示了這種方法的潛力。該團隊篩選了300多萬種市場上可買到的化合物,目標是尋找在不干擾密切相關的β-arrestin信號通路的情況下可選擇性激活μ-阿片受體信號以緩解疼痛感的候選藥物。研究認為,β-arrestin信號通路同阿片類藥物的副作用存在關聯,包括呼吸速率下降和便秘。研究人員迅速從巨大的化合物數據庫中篩選出23種排名靠前的化合物,以供后續研究。
在試管中,7種候選藥物具有所期望的活性。進一步的研發將其中一種轉變成PZM21—— 一種作用于μ-阿片受體但無須激活β-arrestin的化合物。目前,總部位于舊金山、由Shoichet共同創建的生物技術公司Epiodyne正試圖基于這些發現開發更加安全的止痛藥。Shoichet計劃利用相同方法尋找調節其他G蛋白偶聯受體(GPCR)的化合物。GPCR是一類據估測占到40%藥物靶點的蛋白家族。
他的團隊還在利用由1億種化合物構成的虛擬“星云圖”開展類似試驗。這些化合物此前從未被制造出來,但應該很容易合成。行業藥物開發者也在測試這種方法:總部位于馬薩諸塞州劍橋市的生物技術公司Nimbus將擁有天然化學物質特性的化合物整合進分子對接的篩選。通常,要獲得天然化學物質,需要不辭辛苦地從諸如土壤等自然環境中收集。上述過程則避免了這一麻煩。不過,它們能否促成新藥物尚無定論。
利用機器學習
這些數據搜尋方法被不斷地嘗試和測驗,但涉及其中的計算機只能遵循腳本說明。計算藥物開發領域的最新前沿技術是機器學習,即算法利用數據和經驗教會自己辨別哪種化合物同哪個靶點相結合,并且發現對人眼來說不可見的模式。約有十幾家公司涌現出來,并且創建了藥物尋找算法。它們通常和大型制藥公司合作,對它們進行測試。
Exscientia首席執行官Andrew Hopkins提出了一個強有力的案例,證實這些算法的威力。發現并優化用于臨床前測試的候選藥物平均需要4.5年的時間,而藥劑師通常要合成上千種化合物,才能獲得有前景的先導化合物。即便這樣,它們最終進入市場的幾率也非常小。Exscientia的方法——利用各種算法,包括一種令Sunovion研發主管們印象深刻的算法,可能將這一時間線縮短至一年,并且能使藥品研發活動需要考慮的化合物數量大大減少。
2015年,Exscientia為總部位于日本大阪的住友制藥公司(Sunovion是其子公司)完成了一項為期12個月的藥物研發活動。研究人員訓練他們的人工智能工具尋找同時調節兩種GPCR的小分子,然后發現他們僅需要合成不到400種化合物,便能辨別出良好的候選藥物。隨后出現的藥物如今正準備進入治療精神疾病的臨床試驗。從今年5月開始,該公司同總部位于法國巴黎的賽諾菲和總部位于布倫特福德的葛蘭素史克簽署了金額達上億美元的協議。
總部位于加州圣布魯諾的人工智能藥物設計公司Numerate首席科技官Brandon Allgood介紹說,除了辨別先導化合物,機器學習算法還能幫助藥物開發者盡早決定放棄哪些化合物。如果一種化合物無法在數月后通過毒性或者吸收測試,那么將其制造出來并且進行測試是沒有意義的。Allgood表示,在人工智能的幫助下,僅需要幾毫秒便能決定它是否應該“出局”。今年,Numerate已同制藥公司達成兩項協議,針對人工智能發現的藥物開展面向心臟病和心律失?;颊叩呐R床試驗。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25