如何評價華大推出的Revolocity測序儀?

華大官網新聞:http://www.genomics.cn/news/show_news?nid=104562

關於Revolocity測序儀的官方介紹:Revolocity - Complete GenomicsComplete Genomics -

請問:

  1. Revolocity的測序原理是什麼?
  2. Revolocity的讀長、通量、準確度等評價測序儀的硬指標是多少?
  3. 和現有其他商業化測序儀相比,Revolocity有何優勢和劣勢?

希望盡量客觀評價,不要有軟文。


1. 測序原理依然是CG一直用的Sequencing by ligation (SBL) 而非illumina家明顯佔優勢的Sequencing by synthesis (SBS)。 雖然CG在前一段時間買了SBS的專利,但在這款測序儀上明顯沒有使用。28bp的讀長應該是4個7mer連起來的長度。

2. 讀長是28bp。50x coverage一個WGS,每年10000個WGS,一個run跑8天來算的話,一個run的通量大概是32.8T,就數據量講,絕對是測序儀中航母的體量的 #當然佔地面積更是#。準確度按照官方的話說應該是「unbelievable accuracy」,大概錯誤率是1E-6這個級別,顯然是比任何面試的測序儀正確率都遠遠要高。但是請不要忽略了CG這台測序儀的讀長只有28bp,而請考慮把illumina的讀長從250bp和150bp砍到28bp再比較正確率的情況。

3.1 先說優勢。數據產量巨大,因而單位成本一定很低,適合做人類基因組的重測序。CG打從出生就標榜是「人類基因組重測序的最佳測序平台」。28bp的讀長,複雜度低的「人類」基因組(或是外顯子組)處理起來尚且算是得心應手。28bp只能做重測序,組裝什麼的還是擼擼睡吧。而對於NIPT以及類似的技術,測序過程就是「堆砌數據量」,僅需檢測拷貝數變化而不關注覆蓋度和SNP水平的變異,CG這款新機器可能是非常好的選擇(我不是很確定的是,28bp這個長度是否可能對大規模混樣而需要許多複雜度較高的barcode什麼的造成一定的麻煩)。而類似於未來的面向腫瘤無創早起篩查的遊離腫瘤細胞(ctC)檢測, 遊離腫瘤DNA(ctDNA)檢測,以及面向產前胎兒基因組測序的胎兒有核紅細胞(FNRBC)檢測,所測絕大部分數據將是無用數據,CG這種「數據不要錢」的平台的優勢可能就會顯現。不就是堆數據量么,咱在行。

3.2 劣勢嘛,數據量太大也是一個劣勢——湊不滿run,一般人根本跑不動。參考Hiseq X尷尬的現狀。然後讀長是硬傷,所以除了「人類」「重測序」以外,幾乎沒辦法應用於別的領域了(熊貓那種比人類基因組複雜度還要遠低的大概還是可以啦)。以及28bp對pooling時barcode的影響,表示略擔心。其他的,參考CG以前的機器,其運行穩定性是個考驗,畢竟8天時間不短,反應量數據量都巨大,不知道會不會很容易需要「售後」。


謝@章北海邀。

說實話,我並非技術宅,也非技術控。身為一個醫學方向的小小產品經理,對於該測序儀的技術秘密,既無從了解(即使知道也不能說呀,這個覺悟還是有的),也無意深究。

我所感興趣的,是從實際需求思考幾個問題:

1. 購買測序儀/使用測序儀的客戶是誰?

2. 這些客戶的需求是什麼?

3. 這款測序儀是否滿足了他們的需求?

因為身份的限制,我不方便評價,寫好了淪為廣告軟文,寫差了不衷心為主。只好先馬克之,如果有一天我不在華大了,會回來系統地整理下我的看法的。

也非常樂於看到同行們或者跨行的朋友們從上述角度探討。

——————————————————

順便打個廣告:

下面是我的微信,承接同行交流、患者諮詢、業務洽談、轉載申請、飯局邀約、土豪包養:


華大在ESHG上預發布新的測序儀Revolocity的消息已經在朋友圈裡面滿天飛了。

CG的老大Cliff Reid接受了GenomeWeb的採訪,我摘錄一點信息如下:

  • 一年10000個全基因組或者30000個外顯子,最終會升級到一年30000個全基因組;
  • 報價是1200萬美元一台,佔地面積1500平方英尺;
  • 每8天完成120個50X的全基因組測序,可以分批上樣,比如今天上20個,後天上10個之類的。最少一次上10個樣品;
  • insert的長度是300base,兩端的讀長分別是28base——bwa mem都不能用了;
  • 暫時不支持CG的LFR技術;
  • 暫時不考慮申請FDA的clearence;
  • 已經在全球找到了200~300個值得放這套系統的地方;
  • 確實在開發桌面測序儀,但拒絕透露具體信息。

詳細信息叫我在42dna的帖子:http://www.42dna.com/m/question/12


然並卵!

這數據可想而知會給下游分析帶來巨大的麻煩,除了華大內部還有誰樂意做這種數據的分析。

拿到數據的人不關心你的原理是什麼,28bp算raw data準確率沒什麼意義。pacbio下機數據準確率85%自我校正後也能到0.001以下。

在2015年拿出一個Illumina 2008年讀長水平的機器真的有價值么?這機器就是為上市做吆喝的吧?全球能賣出10台以上?


已經停了


推薦閱讀:

3C,4C,5C以及HiC測序技術都有些什麼不同?
基因測序技術出現後是不是老的生物分類有很多都被推翻了?
為什麼到現在才有第一個「單個線粒體的DNA序列」?「單線粒體測序」有何意義?
genotype 和 gene expression 有什麼區別?
個人基因組測序有哪些意義?

TAG:DNA測序 | 華大基因 |