被AI催火的計算生物學賽道

近日,AI預測蛋白質結構又取得新突破。“深層思維”公司宣佈,該公司開發的人工智能程序“阿爾法摺疊”(AlphaFold)已預測出約100萬個物種的超過2億種蛋白質的結構,涵蓋科學界已編錄的幾乎每一種蛋白質。

據介紹,這些信息將上傳至可公開訪問的“阿爾法摺疊蛋白質結構數據庫”。該數據庫由“深層思維”公司和歐洲生物信息學研究所合作開發,去年7月上線時已包含98.5%的人類蛋白質結構。

近幾年,AI預測蛋白質結構成績亮眼,各大國內外企業也紛紛入局。在AI激活、數據驅動下,AI預測蛋白質結構正從幕後走向臺前,其產業化發展也正進入一個新的階段。

AI預測蛋白質結構背後的計算生物學

蛋白質的三維結構決定了它在細胞中的功能。明確蛋白質的結構信息,在藥物研發等領域十分重要。傳統上,研究人員使用X射線晶體學等手段測定蛋白質結構,耗時費力且花銷不菲,卻常無法獲得所需結果。“阿爾法摺疊”通過學習實驗測定出的蛋白質結構信息,來預測其他蛋白質的三維結構,其預測準確度相當高。歐洲生物信息學研究所的數據顯示,阿爾法摺疊有35%的預測是高度準確的,可媲美實驗測定結果;另有45%的預測足以在很多場景使用。

人工智能極大提升了蛋白質結構預測的效率,這也是AI預測蛋白質結構近幾年被人熟知的原因,但其背後的計算生物學卻已經歷多年發展。計算生物學是根據不同類型的生物數據構建算法和模型,從而理解生物系統本身,並推進相關研究及應用的學科。

隨着人工智能的發展,計算生物學正在被激活。浦發硅谷銀行《醫療健康行業投資與退出趨勢》報告顯示,2021年美國市場投向計算生物學公司的金額達到59億美元,一年增長高達3倍,超過非計算生物學公司投資的兩倍。在2019年以來首次完成種子輪/A輪融資的707家生物製藥和研發工具公司中,計算生物學公司有129家,佔比爲18%。2021年對計算生物學公司的投資額激增,幾乎是2019年和2020年募集資金總和的兩倍。

在我國,各研究機構和企業也正開展相關佈局。如近日,由清華大學人工智能產業研究院孵化的AI製藥企業華深智藥對外宣佈,其在AI和生命科學結合領域取得突破:研究人員在蛋白質結構預測方面開發出全新技術。據華深智藥官方介紹,該技術僅從單條蛋白序列就能預測出蛋白質3D結構的算法。

加速藥物研發、爲精準醫療提供助力

計算生物學正在改善傳統制藥行業高投入、高技術、高風險、長週期的特性,加速藥物研發過程。有分析機構認爲,目前我國計算生物學發展的主要方向仍是AI製藥,相關創業公司在2017—2021年呈現出爆發式增長,且都已獲融資。從商業模式上看,整個行業以面向企業提供服務爲主。

除此之外,計算生物學也爲精準醫療的實現提供了助力。

有分析機構認爲,在應用方面,計算生物學產業可大致分爲三類:一是計算推演生物性質及原理,如蛋白質結構預測、致病機理研究、蛋白質相互作用預測、抗體和抗原的表位預測、基於基因組學尋找疾病成因或尋找新型的生物標誌物等。二是搭建預測及判斷模型,如AI製藥中基於靶點的化合物性質預測,疾病診斷、監控、治療建模,涵蓋細胞、器官、人體的生物模擬器等。三是對生物體進行控制改造,如新療法、藥物開發、精準醫療和生物製造。其中精準醫療或將成爲計算生物學長期的重點發力方向。在這個方向上,國外已出現了基於多組學佈局的企業。

如2021年11月,阿斯利康、德國默克、輝瑞和梯瓦等6家大藥廠與亞馬遜、以色列生物科技基金共同推出了創新實驗室——AION Labs。該實驗室的模式是:在以色列初創生態系統下,建立和投資基於AI和計算生物學技術進行藥物發現和開發的初創公司,併爲這些公司提供資源、指導,以及合作開發新技術,最後反哺製藥行業。AION Labs 在一份聲明中指出,其投資的初創公司將利用AI和雲計算更快、更高效地找到新的治療方法,推進以患者爲中心的精準醫療。

雖然計算生物學已逐漸走入人們的視野,但它要想實現商業化還面臨着一些關鍵瓶頸問題有待突破。

首先是對生物底層原理的進一步明確。目前,還有大量關於生物學本身的底層機制有待研究透徹,在進行模型構建、生物驗證時,需要引入這些知識來減少不符合領域認知的偏差,保證準確率。

其次是要有統一的計算和數據框架。計算生物學要最終落地,模型要能夠覆蓋多組學數據、多環節及功能並行。同時,還需要保證計算生物學中的多種異構數據,例如圖像、視頻、分子圖譜、DNA代碼、基因表達、電信號等,有明確的標準和通用格式,以便在不同算法和平臺之間互操作。

此外,還有消費級數據的獲取、工程落地能力、行業信任與模型可解釋性問題,以及數據隱私問題等。

本網站轉載的所有的文章、圖片、音頻視頻文件等資料的版權歸版權所有人所有。如因無法聯繫到作者侵犯到您的權益,請與本網站聯繫,我們將採取適當措施。