基因測序信息轉為挽救生命療法 谷歌推出開源AI工具

15年前,科學家們在對人類生活的大量數據進行研究之後,對人類基因組進行了測序,到目前為止,這仍然是一個巨大的挑戰。

周一,Google發布了一個名為DeepVariant的工具,它使用最新的人工智慧技術,從測序數據中構建出一幅更準確的人類基因組圖像。在重構基因組序列方面比以前的經典方法具有更高的準確性。

DeepVariant可幫助將高通量測序讀數轉換為完整基因組的圖像。用深度神經網路從DNA測序數據中快速精確識別鹼基變異位點。

高通量測序在2000年代變得廣泛可用,並使得基因組測序更容易獲得。但是使用這樣的系統生成的數據僅提供了有限的、容易出錯的全基因組快照。對於科學家而言,區分測序過程中產生的隨機錯誤的小突變,特別是在基因組的重複部分中,通常具有挑戰性。因為這些突變很可能與疾病如癌症直接相關。

有多種工具可用於解釋這些讀數,包括GATK、VarDict和FreeBayes。然而,這些軟體程序通常使用更簡單的統計和機器學習方法來來識別突變,嘗試排除讀取錯誤。

哈佛大學公共衛生學院的研究科學家布拉德·查普曼(Brad Chapman)認為,在這個領域的挑戰之一是在基因組部分,每個工具都有其長處和短處。他對早期版本的DeepVariant進行了測試,他認為這些比較困難的部分對於臨床測序來說越來越重要。

DeepVariant由Google Brain團隊的研究人員開發,該團隊專註於開發和應用AI技術。

Verily是一家專註於生命科學領域的子公司。該團隊從瓶頸基因組(GIAB)項目中收集了數百萬個高通量讀段和完全測序的基因組,這是一個公私合作的項目,以促進基因組測序工具和技術。他們將數據輸入到深度學習系統中,並精心調整模型的參數,直到學會用高準確度來解釋順序數據為止。

去年,DeepVariant贏得了PrecisionFDA真相挑戰賽的第一名,這是一個由FDA執行的比賽為的是促進更精確的基因測序。

Deep Genomics公司首席執行官Brendan Frey表示,「DeepVariant的成功非常重要,因為它證明了在基因組學中,深度學習可以用來自動訓練性能優於複雜手工系統的系統。

DeepVariant的發布是機器學習可能促進基因組進展的最新信號。

Deep Genomics是幾家嘗試使用AI方法的公司之一,如利用深度學習梳理出疾病的遺傳原因,並確定潛在的藥物治療方法。

Frey表示,人工智慧的影響將不僅僅是幫助測序基因組數據。他認為,「目前阻斷藥物的缺口在於我們無法準確地將遺傳變異與疾病機制進行對照,並利用這些知識快速確定拯救生命的療法。」

另一個在這個領域的知名公司是無錫Nextcode,它在上海、雷克雅未克和馬薩諸塞州劍橋設有辦事處。無錫Nextcode已經積累了世界上最大的全測序人類基因組序列,並且該公司正在大量投資於機器學習方法。

DeepVariant也將在Google雲端平台上提供。谷歌及其競爭對手正在瘋狂地將機器學習功能添加到他們的雲平台上,以吸引任何想要使用最新的人工智慧技術的人。

總的來說,AI在未來幾年幫助很多方面的醫藥領域取得了巨大的飛躍。有很多機會可以挖掘許多不同類型的醫療數據,例如圖像或醫療記錄,可以預測人類醫生可能會錯過的疾病。

但基因組醫學代表了一個特別大的機會,因為數據的規模和複雜性是前所未有的。 Frey表示,「這是歷史上第一次,我們測量生物學的能力,甚至是對它採取行動,遠遠超過了我們理解它的能力。AI是我們解釋和處理海量數據的唯一技術。這將徹底改變醫學的未來。」

推薦閱讀:

焦磷酸甲基化測序
PCR duplicates in NGS - II
MeDIP-seq(甲基化DNA免疫共沉澱測序)
精準醫療:4篇Nature奠定臨床新技術(表觀遺傳學)測序中國
生物信息學100個基礎問題——第1~ 5題 答案公布

TAG:生命 | 基因 | 開源 | 工具 | 救生 | 信息 | 測序 | 谷歌 |