如何看待WeGene開放了1000萬個位點的下載?
實測60萬,真的能推算出1000萬的位點嗎? 他們聲稱的98%的準確性有多靠譜?
用的imputation。這個本身不是什麼新鮮技術了,不過還是需要不少計算資源的,能在商業上大規模使用,說明數據處理流程上面還是下了不少功夫的。
實測60w推算出1000w,應該是用的imputation(不好意思我不知道中文怎麼翻)一般是根據snp之間的ld(連鎖不平衡)信息推算的,方法也是多樣的。98%的準確率也還好吧。
順便,這條信息是哪看到的?wegene官網么?還是只有買了服務的人才能看到?
————————
剛剛去看了,果然是imputation。這技術沒啥神奇的,好多年了,不過演算法一直在優化。
有興趣的話自己去搜一下genetic imputation,或者看看這些鏈接
基因型填充genotype imputation
英文好的或者有相關知識背景的朋友可以看看這些:
Imputation (genetics)
A Flexible and Accurate Genotype Imputation Method for the Next Generation of Genome-Wide Association Studies
至於98%準確性,他也沒說具體怎麼算出來的。演算法優化的話,涉及商業機密應該也不會公開。我覺得至少imputation的panel得用中國人或者東亞人的,這樣準確性確實高很多。平時我們做imputation的時候,每一個imputed出來的SNP都有一個imputation score,一般0.3以下的就直接刪掉了,不知道他們這個擴展數據是不是每一個SNP都有這樣的值。
居然沒人邀請我來回答,傷心了
來貼一個曾健明同學用自己的WGS數據做的評測結果:wegene晶元擴展位點跟WGS比較,結果是擴展數據集跟WGS數據的一致性是96.79%。比官方公布的略差。
我覺得在測序low coverage對SNP Calling影響的考慮上還不夠,評測在這方面還可以再考慮考慮。
跟進一下,真的不要錢,重新檢測成本還是挺高的吧,不知道會不會賠錢
---------------------------------
是這個么,很良心嘛,還給免費重新檢測。沒說要幾天,有點著急
本來想占坑說,用我的全基因組比一下準確率能不能到98%的
結果果不其然,我的wegene晶元版本太老了不支持這次的imputation……
原理上不難,用連鎖不平衡(linkage disequilibrium)來推斷沒測到但是連鎖的SNP,但不知道選用的LD block是用的HapMap和千人基因組裡算好的呢,還是針對東亞人的,還是用他們之前樣本的60w位點重新算的。基於不支持早期晶元這一點,我覺得還真有幾率是自己算的……這個計算量也是屌了……
價值嘛是有一丟丟的,但我覺得主要還是秀一下技術實力的肌肉吧,甭管是給客戶看、給業內人士看還是給競爭對手看吧……畢竟每次有點什麼新的技術應用,都是老早就牽著別人鼻子走的,不管在商業上有沒有顯著的效果,至少爽感應該是達到了
目前的階段是,兩個大漢要掐架,脫掉上衣秀肌肉。
1、下載1000W位點比對了一下資料庫,沒有看到什麼有興趣的位點,定性而言,目前來看價值不高。
2、1000W位點相比於原59W位點,野生純合罕有突變的位點比例更高(約12%)。
3、1000W位點,仍可以看到親緣相比於無血緣的差異,但差異率降低約2%,說明準確率可靠。
推薦閱讀:
※《美國隊長2》中衛星是如何遠程讀出人的DNA的?
※現在有哪些基因檢測對普通人來說是有價值有意義的?
※做基因檢測是一種怎樣的體驗?
※「奶爸」告訴你:甜馨語言天賦煉成記
※測過23andme的來,祖源分析有比這更混血的么?!