AI 基因測序,谷歌免費開放最尖端的深度學習技術讓你編輯基因?
2017年12月4號谷歌大腦開源了將兩大風口尖端科技融合的DeepVariant平台,這代表什麼意義?
【【人工智慧家一AI加】AI+基因測序,谷歌免費開放最尖端的深度學習技術讓你編輯基因?】http://toutiao.com/group/6499790125415793166/?iid=15906422033&app=explore_article×tamp=1519663977&tt_from=copy_link&utm_source=copy_link&utm_medium=toutiao_ios&utm_campaign=client_share
首先我們回顧下什麼是DeepVariant技術?
新一代測序技術(NGS)是一種快速發展的技術,可以通過調用數十億個短小,錯誤的序列讀數來調用個體中存在的遺傳變異來確定個體基因組的序列。 儘管經過了十多年的努力和數千名專職研究人員的努力,用於變異調用的手工製作和參數化統計模型仍然會產生數千個錯誤,並且在每個基因組中都會遺漏變體。DeepVariant使用深卷積神經網路可以通過學習「讀」(read) 堆積圖像和實況基因型調用之間的統計關係推斷下一代基因測序讀取數據中的遺傳變異。這種被稱為DeepVariant的方法比現有的工具更勝一籌,甚至在FDA管理的變異呼叫挑戰中贏得SNP的「最高性能」獎。這種基因組構建學習的模型甚至在其他物種中也可以從大量的人類基礎真實數據中受益。 不同於之前存在的工具只能在特定技術上表現良好,DeepVariant可以從各種測序技術和實驗設計中,從大範圍的深層全基因組中學習調用變體。 DeepVariant代表了從專家驅動的統計建模演進到計算機軟體解釋生物儀器數據的自動化深度學習方法的重要一大步。
DeepVariant 工作流程
其實有很多報導誇大也誤導了大眾,我們綜合一些在基因工程、基因編輯二、三十年以上的專家的意見:
1. Google 的DeepVariant開源程序不會組裝基因組或編輯基因。DeepVariant是個識別小突變的程序,主要是單個字母的變化(稱為SNPs)。 (它也可以發現稍大的變化。)這被稱為變異調用或SNP調用,已經存在了十多年。 很多程序都可以做到這一點,其中大部分程序都做得很好,精度也超過99.9%。
2. DeepVariant 比傳統方法更精確嗎?
大約一年前,谷歌團隊在bioRxiv上發布了一個聲明,聲明明他們的方法比之前由同一作者Mark DePristo在麻省理工學院開發的GATK方法更準確(在有限的數據集上)。 GATK非常好,使用非常廣泛,但還有很多其他新的方法要快得多,有時候也更準確。谷歌團隊基本上忽略了所有其他的變體調用程序,所以我們其實是不清楚到底DeepVariant是否比其它的新技術更精確。
10多年來,專家一直在對SNP和Indel在下一代基因測序數據中的問題進行改進。 通過深思熟慮的深度學習框架,DeepVariant的作者們在短短几年的時間內就已經超越了傳統方法的準確性。 雖然DeepVariant不一定就是個重大的技術突破,在執行時計算速度也比其它方法慢,然而DeepVariant的真正威力在於它不能準確地調用變體,它真正的能力就是它證明在類似的考量和運氣的情況下, 我們可以在生物信息學界剛剛開始關注的領域迅速實現幾十年的類似進展。
人工智慧家一AI加:我們只和你分享實際有用的人工智慧技能與智識
推薦閱讀:
※交通先行構築平潭島開放開發希望線
※汪洋:構建開放型經濟新體制 再造「開放紅利期」
※再也不需要挑時間,瑞典冰酒店推出「365」品牌全年開放
※「本位」與「開放」的智識人格(1)
※毛骨悚然!故宮為什麼不開放冷宮~~?