為什麼不同基因測序公司提供的分析結果大相徑庭？

11-15

今年 28 歲的 Kira Peikoff 因為家族成員的疾病關係，對自己未來的健康表示擔憂，她希望能從基因測序裡面找到一些提示和建議。但她發現，三家不同的基因測序公司，對她的基因測序結果分析卻大型徑庭。所以我想在這裡請教各位，這是為什麼呢？既然不同公司的結果不同，甚至分析結果矛盾。這樣的測序又有什麼意義呢？

&> 23andMe said my most elevated risks — about double the average for women of European ethnicity — were for psoriasis and rheumatoid arthritis, with my lifetime odds of getting the diseases at 20.2 percent and 8.2 percent. But according to Genetic Testing Laboratories, my lowest risks were for — you guessed it — psoriasis (2 percent) and rheumatoid arthritis (2.6 percent)...

via I Had My DNA Picture Taken, With Varying Results — nytimes

謝邀，第一次被邀請回答問題還是誠惶誠恐的，所以專門連上VPN把題干裡面那份不存在的報紙（NY Times）中的報道完整讀了一遍。

首先，澄清一下題干，因為下面所引的這篇文章中的姑娘用她的DNA找了三家不同的公司做基因檢測，其中Google創始人布林投資的23Me採用的技術肯定不是基因測序(Gene Sequencing)，而是基因晶元篩查(Gene Chip Screening)，兩者之間的區別可以簡單理解為：測序是把基因組這本書從頭到尾讀完，晶元篩查是從這本書里選一些重要的標誌性字元（單個鹼基的變異，SNP），通過核查每個人的基因組在這些標誌性字元處的變異狀態，來分析這個人與疾病或其他性狀的相關性。

另外兩家公司在業內名氣可能沒有23Me那麼大，從他們的官網上很難判斷出他們使用了哪種技術，但是單純從成本來看，應該也不是測序，而更可能是晶元。但是這並不影響題目本身的意義，就是為什麼不同公司的基因檢測給出的疾病風險預測差別這麼大。

人體和幾乎所有生命體（某些RNA病毒和朊病毒除外）每一個細胞裡面都有一套完整的基因組DNA，好比是一本完整的藍圖+施工手冊。從受精卵開始，生命體就從這套手冊選擇不同的章節搭建不同功能的細胞，並讓它們執行相應的功能。每個人的這套手冊都略有不同（大多數就是前述的SNP），這些不同之處定義了人種、皮膚頭髮眼睛顏色等所有性狀，也定義了對疾病的敏感性。上述三個公司代表的基因健康諮詢產業，說白了就是試圖找到一些與疾病相關的SNP位點，檢測它們的狀態，然後計算出一個概率，最後交到被檢測者的手裡。

但是問題就出在這個原理上面：首先什麼樣的SNP位點是真的與疾病相關的？其次它的相關性到底有多少？

前一個問題基本是靠大規模的關聯性分析，其實是個統計學的概念。打個最極端的比方，找一千個身高2米的小明，再找一千個1米4的小明，假定他們的人種、營養這些背景都一致，然後找一個SNP位點（假定這個位點有A、B兩種狀態），在這兩千人裡面看一看有多少人在這個位點上是A，多少人是B，如果1000個高個子在這個位點上都是A，而1000個矮個子都是B，那麼我們就可以比較肯定地說這個位點與身高的相關性非常強，一個嬰兒剛生出來，就檢查到他這個位點是A狀態，那他長大後就有很大的幾率長成高個子。

但這是非常理想非常極端的假設，實際上只有很少量單基因疾病（比如某種先天性耳聾）有這樣斬釘截鐵的結論，身高、體重、高血壓、糖尿病、癌症，都是幾百種基因相互糾結、再加上環境因素累加影響，再加上時間因素，才會表現出最後的差異。所以現在的人類遺傳學裡面，其實大家都是在儘可能地加大統計的人群，儘可能地尋找人種和背景條件一致的人群，儘可能地提高自己研究的統計力和概率的有效性。即使如此，不同的研究小組之間出來的結論也往往千差萬別，而且由於他們選取的統計人群樣本是不太會互相共享的，這種結論也就很少有條件由其他小組獨立地重複核實。

到了這個時候，你就可以明白為什麼這些基因遺傳諮詢公司給出的報告差異這麼大。首先，他們選擇的SNP位點可能來自於不同研究報告的結論，這些結論有的經過反覆的檢驗，形成了金標準，但是還有一些並沒有那麼的靠譜；其次他們採用的檢測技術和分析方案各有不同，同一個SNP位點的同一種狀態，根據不同的分析方法也許就會出現不同的概率；最後他們在給出報告的時候，對人種、生活方式、環境因素的考量方式不同，也就會出現不同的概率。

而這些概率對這個參與檢測的人而言，到底有多大的實際意義，我其實也就呵呵了。

那麼現在基因檢測裡面有沒有特別有臨床意義，值得一做的呢？有！試列幾個：

1. 乳腺癌易感基因BRCA1/2突變，其重要性已經被很多研究反覆證實過，算是不多的可靠位點了。但是Angelina Julie是不是應該馬上動刀切掉，個人意見是不以為然，實際上不如加強早期篩查，改善生活方式。

2. 癌症化療藥物的耐葯基因，其中大多數都是經過大量臨床實驗驗證的，針對特定癌症、特定藥物，其關聯性是比較高的。在確定化療方案之前先選擇相關藥物耐葯基因進行篩查，可以有效提高化療方案的成功概率。

3. 通過採集母體血液進行胎兒染色體異常疾病（如唐氏綜合症）無創篩查，準確率已經達到羊水穿刺等傳統方法相同的水平。

最後，NY Times的科學文章水平比國內已經高了不知多少倍，但是仍然有不少事實性錯誤，好在他們採訪面非常廣，而且找了很多業內真正的專家。從這個角度來看國內的大眾媒體科普文章水平，就能知道為什麼一個轉基因問題能夠吵到這般地步。。。

樓上的很多人已經給出了比較準確的解讀，而且很多回答能把一些晦澀的生物學概念用很淺顯的語言和例子做以說明，深入淺出地介紹給非生物專業的讀者，非常不錯，值得學習。

不過這裡本人就做一個小小的補充：

1）文章提到的基因檢測，其實確切的說是direct to consumer genetics testing (直接面向用戶的基因檢測）。通常使用的方法是通過檢測某些基因位點（這裡不是對基因（組）進行測序）然後對一些常見病風險進行評估，給出一個患病的百分比，然後用戶根據檢測結果，在日後的生活中對飲食，生活方式以及相關的方面進行預防和干預。這種檢測，個人認為更具「娛樂」性質，不太具有臨床指導意義。為什麼呢？首先給出一個百分比就是一個很難解讀的結果。比如，患二型糖尿病的風險26%，相比於平均人群的風險24% 高出2個百分點，這個2個百分點之於一個個體而言意義幾乎為零。其次，評估風險的疾病大部分是一些常見病。不同於罕見病（大多數是單基因或少數基因造成，且基因型和疾病表型的關係比較簡單明了）的是常見病大多數是多基因，以及基因和環境的相互作用造成，致病機理也相對複雜。目前，通過GWAS研究找到的和常見病相關的基因位點（具體方法原理參見火焰之河的回答裡面關於2米小明的例子），很多只是證明的相關性，但是對造成疾病的作用（effect)有多大，有的還沒有很好的功能性實驗的證據。所以說，對常見病的患病的風險評估本身是一個非常具有挑戰性的工作，目前的基因檢測也只能做到靠大量的數據統計計算一個百分比的程度，生物學意義和臨床意義都不大。

2）這種直接面向用戶的基因檢測其實是基因檢測發展到近期，努力市場化的一個產物。但是這並不代表基因檢測的全部應用。很多消費者其實不了解基因檢測的應用，錯誤的認為基因檢測就是用來預測疾病風險的，這樣誤解加上new york times上這樣的報道，很容易讓人們產生基因檢測「不靠譜」的錯誤印象。事實上，基因檢測還大量運用在臨床檢測方面（不同於直接面向用戶的基因檢測，這樣的服務可以稱作面向醫生/病人的基因檢測），這也是我一直強調的具有臨床意義的基因檢測。個人認為，目前的技術水平將基因檢測使用在確切的具有臨床指導意義的醫學檢測更實際，也更加「靠譜」。那麼臨床上如何應用基因檢測的呢？這裡舉幾個例子

本人工作的地方是美國一家大學附屬醫院下面的獨立實驗室，主要提供罕見病的基因檢測。這裡檢測的大部分樣本不是來自於「健康人群」，而是來自於病人的。這些病人因為出現某些罕見病的癥狀，去看醫生，然後醫生根據身體檢查，做一些基本的檢測，懷疑某種罕見病。於是，為了幫助確診，醫生將病人refer到實驗室做基因檢測。向我上面提到的，罕見病一般是單基因或者少數基因的突變造成的疾病，並且基因和疾病的關係比較明確，所以這類針對罕見病的檢測，一般不會檢測整個基因組，而只是針對可能的一個或幾個致病基因進行深度的測序和分析。一旦找到明確的致病基因，那麼該疾病的診斷便可以確立。再加上大部分罕見病也是遺傳病，所以基因檢測的同時，還為病人及家屬提供遺傳諮詢服務，比如顯性隱性的遺傳概率多大；父母能否生育正常的孩子；病人將來生育遺傳疾病給下一代的概率多大，等等之類。
關於罕見病，目前還有個應用就是：有少數的病人患了病後，根據臨床癥狀連醫生都沒辦法確切地知道是什麼疾病，通常這個叫做undiagnosed disease（未確診的疾病）。這樣的病人現在有一個選擇，就是做全基因組或者全外顯子組測序，試圖通過這樣的基因檢測，找到致病基因，然後把基因以及已知基因的功能和臨床癥狀聯繫起來，看看能不能試圖找到治療方案。目前美國有實驗室和公司都有提供這樣的服務，也的確有病人通過這樣的基因檢測最後確診了疾病，並且得到有效的治療。不過這個技術目前更多使用在比較棘手的病人身上，因為測序尤其是數據的分析和解讀非常困難且耗時，需要有經驗的專業人員來做。
基因檢測目前還用於癌症的診斷和治療，主要在指導靶向藥物的使用。比如病人患了癌症，可以對其癌變的組織進行檢測，察看是哪個突變基因造成的癌症。肺癌白血病等都有針對某一個突變基因的靶向抗癌藥物。如果病人剛好攜帶那個突變的基因，便可以使用對應的靶向葯。這樣的治療不同於化療，對病人的傷害比較小。但臨床上有時候是和傳統方法結合起來使用。但是，目前的靶向藥物不多，如果病人即便得了癌症，但是不攜帶靶向藥物針對的突變基因，那麼靶向藥物就起不到作用。
同樣還是癌症，最近有研究發現對於癌症的劃分可以不再遵循發病的器官，比如乳腺的癌變就是乳腺癌，結腸的癌變就是結腸癌。而根據基因檢測的結果，可以把癌症按照致病的突變基因來劃分。比如兩個不同的病人，一個乳腺癌，一個宮頸癌，看似不同的疾病，但是可能是同樣的基因突變造成的，且癌變組織里的其他分子特徵都非常類似。那麼這種情況下，可以把用於該突變基因的靶向藥物同時使用在不同的癌症病人身上。這種做法已經在一些臨床案例中證明有效的。去年大概CNN還是某個知名媒體就報道了一個神奇的案例，那個病人患白血病，不斷地化療但是複發，後來通過基因檢測和基因表達譜的檢測，找到異常基因是一個經常造成腎癌的突變基因。於是醫生大膽地把治療腎癌的藥物用在這個病人身上，結果白血病治好了。
藥物基因檢測。這個在臨床上也有應用。因為每個人對藥物的代謝和反應是不同的，這個主要是由體內藥物代謝的酶決定的。為了防止不良藥物反應，主要針對病人代謝藥物的基因進行檢測，根據不同的基因型，來給病人特定劑量的藥物。比如用於針對抗血栓藥物的warfarin(華法令）的藥物基因檢測，目前比較廣泛應用在臨床。

以上舉的一些例子，就是基因檢測在臨床上的應用。個人認為這才是現階段基因檢測的主要戰場，並且是對病人具有實質幫助的基因檢測。比起那些所謂的面向用戶的疾病風險預測的檢測，個人覺得如果好奇的話去玩玩可以，但是別太當真。反正我自己是不會做這樣的檢測，因為意義不大。不過23andme里檢測有上面提到的藥物基因組的檢測，這個可能還有點意義吧。

還有一個就是關於癌症的screening （篩查），個人覺得這個檢測對於有癌症家族史的人還是有意義的。但是對於普通人群，如果體檢的時候想做個癌症基因篩查，我覺得這個意義還有待商榷。因為如果沒有家族史的話，非遺傳性癌症，那大部分是自發性的癌症，這樣的話通過血液測癌症基因不一定能檢測到。但是鑒於本人還沒有詳細的了解過這些篩查都包括哪些癌症哪些基因，目前不好評論，以後如果有詳細資料的話可以拿出來討論一下。

矮馬，第一次在之乎回答問題碼了這麼多字，不過都是想到什麼寫什麼，希望大家可以指正，提問和討論！

產生變異，引發檢測差異的情況很多。各家有各家的演算法，文獻，也會有所不同。雖然好答案已經很多了，但我覺得還有要拋磚的必要。

我不是搞流行病的，但搞過一點 SNP genotyping，就湊合一下，試讀一點報告。

別家看不到了，23Me，可以上圖。這是 coursera 上 Useful Genetics 課（Coursera.org 鏈接）的老師，UBC 的教授，Rosie Rosefield 自己的檢測結果中（module 5E），健康部分的（現在已不提供），我截了下來：

給出的信息包括健康風險，繼承的狀況，遺傳特徵（喝酒上不上臉，有什麼樣的耳屎，頭髮是卷是直），藥物反應。

大家比較關心的健康風險部分，這是風險較普通人增高的疾病：

注意分類首先按可信度分：有充分科學研究支持的在最上面，支持較弱的在下面（甚至沒有給出具體的風險數值）。在這幾個認為科學證據較充足的疾病中，又是按絕對風險排列，而不是相對風險。

風險降低的病也是如此：

點入具體疾病，比如 Rheumatoid Arthritis（類風濕性關節炎）

可以看到與此病有關的相關信息，並說明，23andMe 的預測結果是基於 9 個 SNP marker。點入可以得到具體的位點信息。比如：

這裡 SNP 的名字是 rs6457617，基因型是 CT，風險是 0.89（根據前面的表估計是 relative risk），並說明這是針對歐洲人種的結果，亞洲人種還沒有結論。

23andMe 還給出了幫助得出此結論的具體文獻，看上去的確都是重量級研究結果。

老實說，23andMe 的報告詳細到這個程度，已經大大超出我的預料了。

仔細的人應該注意到，在結論部分，說類風濕性關節炎的風險由 9 個 Marker 得出，是根據 2010 年 12 月 2 日更新的結果。也就是說，這個報告不是一個死的報告，而是會根據學界研究的發展，而不斷更新的。

想對自己負責的話，就算看不懂，也完全可以拿這個結果，去找專業的遺傳學家根據最新的研究來幫你解讀。

那大相徑庭的結果又是為什麼呢？

直接拿上面的 SNP rs6457617 出來去搜一搜。23andMe 給出了兩篇文獻。早一篇是 WTCCC 的研究：Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls

在正文里沒有提到這個 SNP，在補充材料里，但是，只是顯示了有最強的關聯，沒有給出相對風險。Rheumatoid arthritis genetic variants database 的總結里也肯定了這一點：http://hinv.jp/hinv/rav/association.php?snp_id=rs6457617enic=European

第二篇文獻， TRAF1–C5 as a Risk Locus for Rheumatoid Arthritis，也是在補充材料的 table 1B 里找到了這個 SNP，提到在患者和普通人中的，兩個基因型的比型差別很大，分別是 0.230 和 0.496 ，並得出 odds ratio 是 0.29，也就是相對風險降低。

但是，這個表裡沒說這個 C 和 T 里，誰是野生型，誰是疾病型。因為這個風險顯然是一個比例，誰做普通人很重要。最後，在 T1DBase - rs6457617 Marker Overview 找到了，T 基因型更常見一些，是野生型。於是，上文中的 0.230 和 0.496 估計是說，在類風濕性關節炎中，C 基因型的數佔了 23%，而在沒有得病的人中，佔了 49.6%，所以有 C 基因型和低得病風險相關，而且看 odds ratio 還很低，0.29，比 23andMe 的 0.89 低不少（雖然這個可能是 relative risk，但在發病率較低的情況下，可比性還是有的）。

但是，這個文章中，沒有指出 CC，CT 的相對風險或 odds ratio 到底是多少。所以也不清楚，如何出文章的結論中推出 CT 基因型的風險，是和 CC 一樣，還是介於 CC 和 TT 中間。

在 SNPedia 上，關於此 Rs6457617 的結果里說 CT 型是 CC 型風險的 2.3 倍，TT 型是 5.2 倍（反過來就是 0.43 和 0.19），也和 23andMe 的結果差很大。但是，引用的文獻是也是前面提到的 WTCCC，就是我沒找到具體風險數的研究，所以不知道這個數從何而來，要專業人士指出了。（還有為什麼它要用 CC 做野生型進行比較呢？）。

最後找到去年國內人做的一篇，是基於中國人的：http://www.hindawi.com/journals/jir/2013/891306/，根據他們的計算，也肯定了 rs6457617 作為 Marker 對類風濕性關節炎的關聯，CT 型的 odds ratio 是 0.59，CC 型是 0.39。當然這是對於中國人的比例。

轉了一圈，我只能說，僅就 rs6457617 這個 snp 的 CT 基因型，23andMe 給出風險降低和現在的科學證據是一致的，給出的文獻也很有幫助，但看不出 23andMe 給出的 0.89 這個風險是如何得出的。

只能說，水很深。

樓上幾位都說得很好，我從我這邊接觸到的角度給予一些看法，自己工作方向並非技術口，所以有些表述可能不嚴謹。

首先，基因的測序和解讀，在我看來一共有四個主要階段。
1）樣本採集後的基因測序：即採集樣本，通過測序儀轉變為原始數據。
2）信息分析：將原始數據篩選、拼接，變為可以做遺傳分析的具體數據。
3）突變分析：針對檢測出來結果中發現的基因突變情況，與資料庫進行比對，結合模擬功能驗證等等，分析目標突變是否存在實際意義。
4）結果解讀：結合受檢者臨床實際情況，進行個性化分析，給予建議。

那麼，不同的單位進行基因測序，實際上上述的四個層面，都會有不同的差異，這種差異也是巨大的，自然會導致結果的不同。

一、樣本採集和基因測序：這裡可以結合樓上兩位講的內容，樣本採集的環境和保存不同，會直接影響樣本的質量。即采即用與采了之後冰箱放個一年再用能可能測序出來的結果就不一致了。另外測序儀也是不一樣的，目前分為一代二代三代。一代測序以sanger為主，是一種目標性比較明確的測序手段，在測序前必須明確要檢測哪些片段，設計相應的引物，才能夠進行檢測。二代測序即高通量測序技術，可以不需要特定的目標片段，整體測序之後再根據自己需要進行分析，這裡以Hiseq、Solexa等等為主。第三代則是邊合成邊測序和測序儀小型化，貌似比較成熟的就proton（這裡不太確定proton是不是屬於第三代），目前應用還比較少。

所以，根據測序儀器的不同，結果已經會不一樣了。如果有個僅用sanger測序來進行健康體檢服務的公司，那麼必坑爹無疑。僅通過sanger測序來確定受檢者的健康質量，等同於只根據受檢者白頭髮的數量來斷定受檢者的年齡一樣，非常的不嚴謹。（插一句，sanger測序在臨床檢測上面還是有很大的應用空間，例如地貧基因的檢測，血友病基因的檢測等等，只要檢測片段不大，sanger絕對是最優選擇，並且還有相應醫療試劑資質）。目前大部分的健康基因檢測，至少都用二代測序儀，目前最成熟最快的是Hiseq2500。至於三代測序，proton我聽說沒太穩定。就不評論了。

二、信息分析。這個地方有一個很重要的概念，測序深度。測序深度的大致意思是對目標片段進行測序的過程中，平均會檢測到的有意義的次數。一個人的遺傳數據大概是3.2G，那麼進行測序深度為十的測序，就需要產生32G的有意義的數據，再進行信息分析。測序深度的不同會導致結果的不一致，例如某人攜帶一個罕見致病突變，這個突變在他身體內發生率就10%左右，即通過10倍測序，只會有一次測出這個突變，那麼問題就來了：這個發現的突變到底是測序誤差還是受檢者真實攜帶的。所以目前在基因組學研究中，通常用的是50倍測序，而臨床檢測，建議到80倍，甚至200倍測序深度才能夠進行有效解讀。

再回到信息分析的概念中，一個人有3.2G的數據，測序拿到320G（一百層深度測序），這320G的數據都是碎片狀的，需要通過計算機軟體結合相應的演算法進行篩選和分析。現在一般拼接的軟體都比較成熟，Hiseq和Proton也有自帶的軟體，應該問題不大。

所以在第二個環節，主要看測序公司的靠譜程度，比較有良心的一般都會選擇50倍以上的測序深度來進行檢測，如果那個30倍的來進行檢測，只能呵呵了。並且，測序深度這個重要數值一般外行是不了解的，普通受檢者也不會問的，比較容易被坑。

三、突變分析，這裡也是一個大坑。通過上面說的，採集了合格的樣本，用合適的測序儀進行測序，靠譜的測序深度，用靠譜的軟體和人員進行信息拼接，拿到了受檢者的精確基因信息了，下一步是解讀。

怎麼解讀呢？這裡還是先說概念：突變大致分為無義突變、非致病突變和致病突變。每個人身上都有非常多的突變，絕大多數的突變都是無意義的突變，即有沒有這些突變身體都不受影響。其他的有意義的突變之中又分為致病突變和非致病突變，非致病突變決定人的一些常見性狀，例如單雙眼皮，眼睛顏色，頭髮卷直等等，而致病突變則有導致攜帶者患病的可能性。

這裡存在一個問題，我們知道了受檢者的突變情況，那麼怎麼判定某個突變就是上述三種突變的類型？目前來說最佳的策略還是資料庫比對。國際上有三大資料庫，分別在美國、歐洲和日本（我國的即國家基因庫，在建）。這三大資料庫中收錄了全球科研及臨床工作者發現的突變。那麼就可以將受檢者的突變放入資料庫中檢索，如果發現了吻合的情況，就可以基本確定受檢者攜帶了某個致病突變（這裡為了簡化，不討論致病突變和疑似致病突變的區別）。但是相比於未發現或者未確認的致病突變，已知並通過驗證上傳資料庫的致病突變還是太少，那怎麼辦呢？可以進行反向篩選。即將受檢者的突變放入正常人的突變數據中進行比對，從而剔除掉高頻突變。例如受檢者有一個突變，這個突變在人群中，超過一半的人都攜帶了這個同樣的突變，並且這些人都沒有明顯的疾病，這樣一來就可以認為這個突變很大可能是不致病的，可能是一個無義突變或者非致病突變，展示不需要分析。這樣挨個比對（其實也是軟體比對），再剔除掉一大部分，剩下的就是受檢者自己攜帶了，這些突變背景庫（正常人群組成的資料庫）和致病庫裡面都沒有相關信息，再進行後續分析。

剩下的突變進行分析就相當蛋疼，一般來說是軟體模擬，即模擬這個突變的基因進行表達，看結果會不會導致蛋白組合失敗等等，來分析突變是否會對人體有害。往往用不同的軟體，結果已經不一致。更不用說前面那麼冗長的比對過程中會不會出現什麼差錯。

在第三步中，如果提供服務的公司將數據拿進國際庫進行比對，已經是不錯的了。要是還拿去進行背景庫比對，簡直是業界良心了。至於最後的那種功能模擬……即使公司做了也不會告知受檢者，裡面的不確定因素太多。並且大多數接受健康體檢的受檢者本身都是大致健康的（沒有患嚴重疾病），如果通過軟體分析出一個突變會致病的結果，一不知道軟體靠譜程度，二不知道會不會發病，三也不知道啥時候發病，四更可能是傳給後代才發病。這麼多不確定，怎麼告知受檢者，告知了也是找打。

這裡的話，一般服務公司的做法是，自己構建一個資料庫，把科研和臨床上一些已經確認的突變位點放入其中。受檢者測序完的結果就和這個資料庫進行比對，對上的就是檢出陽性了，對不上就是非發現可疑突變。靠譜么？多少還有點靠譜，不算太不靠譜。

四、結果解讀。這個也比較難，一般，至少需要持遺傳諮詢拍照的醫生可以做，國外情況不清除，國內的企業同時擁有這種專業醫生並且測序技術、分析技術過關的沒有幾個。這裡就不具體分析了。

綜上，基因測序體檢服務，目前看來，我認為還未到非常成熟的階段，可以排除一些病因非常明確的疾病，但是拿來做健康預測還是有些問題，所以必須結合現有的常見技術手段。打個比方，基因測序體檢，等同於我要分析一個湖中所有魚的分布和種類情況，我一網撈了一堆魚上來（測序技術落後的就只能釣魚，測序夠兇狠的直接把整個湖排干），但是我只認識鯽魚和鯉魚（資料庫越牛認識的魚越多，但是大家都肯定認不全），所以我只分析鯽魚鯉魚的數量，來判斷整個湖的情況（靠譜公司的會說：「湖裡面什麼什麼魚的情況是怎樣怎樣的……」，不靠譜的公司直接說整個湖是怎樣怎樣的）。

如果問，怎樣才能讓這個服務靠譜，簡單來說，就是先搞懂所有的魚，再用靠譜的技術捕魚、分析魚，進而分析湖的情況。

最後加一句，如果有哪個公司號稱可以用基因測序的手段分析一個人的二型糖尿病、肥胖、性格、天賦。十有八九都是坑爹。

處女答，謝謝。

以上。

還是要補充一下，這些疾病大多都是多基因控制的遺傳效應加上環境的共同作用，很多疾病本身研究都沒有搞明白，你去雜誌上有時就會看到有些矛盾的試驗結果，再加上不同的統計學不同的方法和參數設置都會帶來最後結果的差別，這時可以用混沌理論去解釋了，有時候初始條件的細微差別可能也會導致結果的巨大差異。

當今生命科學數據和信息幾乎全部公開，但是還是會存在一些公司有一些自己的研究結果加入其中，也存在資料庫和晶元更新快慢的問題，如何劃定高危基因和SNP位點，設定閾值，統計分析的方法，差異有很多。而且通常測定也會影響結果，

OMIM - Online Mendelian Inheritance in Man 人類孟德爾遺傳資料庫

另外，大多數人都還是忽視了，其實是還是有一些疾病這幾家公司一致性不錯的，這篇文章只是重點去找出來差異比較大的。她的家族裡的疾病才是重點關注的。但是描述一個故事，需要的恰恰是找出大家所關注的和差異比較大的。實際上對於有些遺傳疾病的檢測已經非常成熟和準確了，尤其是對於單個基因遺傳病，一個基因的突變因此的疾病，只需要檢測這個突變。有的疾病存在主效基因，可是大多數疾病都不是那麼簡單，大部分是通過特定位點連C鎖的來分析潛在得病危險。可是這些疾病可能是SNP（單核苷酸變異）、（CNV）拷貝數變異和表觀遺傳等等影響。比如文章裡面提到的牛皮癬（Psoriasis）就帶有表觀遺傳的影響，。（http://www.nature.com/jid/journal/v132/n3-1/full/jid2011364a.html）

目前的DNA Test對於大多數疾病達到的目的只能是測定疾病的潛在威脅，對於潛在的危險，如何調整飲食、以及生活習慣是關鍵，像Angelina Julie這種極端的做法，就是完全拋棄了環境影響，因為這些疾病是基因和環境相互的結果，環境其實在其中起到了很關鍵的作用。家族疾病的另外一個原因是他們生活在相同和相似的環境中，有相似的生活習慣。

順便搜了一下測DNA的這位美女，她現在讀研究生物倫理學的，本身就是一個自由記者，經常發表文章，這篇文章是她自己寫的，很厲害而且影響力不小的文章，相信這個選擇三家公司進行的測試也不僅僅是為了檢測自己的遺傳疾病，她曾經寫了一本有名的反烏托邦驚悚小說叫做 LIVING PROOF。

Kira Peikoff-Author of Living Proof
https://www.facebook.com/kirapeikoff
Kira Peikoff
Living Proof: Kira Peikoff: 9780765367488: Amazon.com: Books

謝邀，
沒時間仔細看那篇報道，大概看了一下簡單說幾句吧。

首先講下目前測序可以確診的範圍，目前絕大多數基因是怎樣影響人的表型都是未知的，只有極少數單基因疾病算研究的比較透徹的，可以通過測序來檢測是否有致病突變，這在臨床上已經有應用了；有些複雜些的多基因疾病，如果存在比較明確的某個基因對某個通路是至關重要的，那由這個基因導致的疾病也可以通過測序檢測到。

除了以上兩種可以確診，其餘基本都是所謂的熱點研究，方法也不限於測序，其實用的多的往往是晶元，因為只需要做若干個點，成本更低。但熱點研究其實不是很靠譜，真正的熱點需要大量的統計數據來證實，像乳腺癌的BRAC和HER2等基因算比較靠譜的熱點了，但即使是這種很靠譜的熱點，也不是100%是致病的（正是因為多基因疾病牽涉的東西太多太複雜，根本就沒有研究透徹，只是發現了一點規律就算做是熱點了，然後就有人來拿這些算算髮病概率等等），說到這，你可以想像那些不靠譜的熱點是有多不靠譜了，算出來的發病概率自然是五花八門。

最後總結一下，如果測序公司都算還有良心的話，測序結果應該基本是相同的，即使不同平台也不會有太大差別；能得出不同的分析結果，基本就是因為不同公司推算髮病概率的演算法不一樣。（個人認為對某些不靠譜又非常複雜的多基因疾病熱點去算髮病概率就是吃飽了撐的，沒有多少實際意義，有這功夫還不如多研究一些更本質的東西）

我覺得這篇文章就是討論為什麼結果大相徑庭的。而且測序誤差---例如本來是A的地方測成了G，所產生的不同並不是導致結果不同的主要原因。

不同公司花費不同，測量的疾病也不盡相同

23andMe』s saliva test kit, which for $99 promised a report on more than 240 health conditions and traits
Genetic Testing Laboratories and Pathway Genomics. G.T.L. charged $285 for a report on 25 disease risks
Pathway charged $399 for a report on 24 disease risks.

沒有統一的工業標準。不同公司所用方法不同

a lack of industry standards for weighing risk factors and defining terminology.

測量的SNP數量有限
使用不同的模型解釋相同的疾病成因

Scientists have identified about 10 million SNPs within our three billion nucleotides. But an entire genome sequencing — looking at all three billion nucleotides — would cost around $3,000; the tests I took examined fewer than a million SNPs.
my tests sometimes relied on different SNPs to assess the same condition

缺少可做比較的綜合數據集

「Your results are not the least bit surprising,」 he told me. 「Anything short of sequencing is going to be short on accuracy — and even then, there』s almost no comprehensive data sets to compare to.」

基因在疾病中扮演的作用是有限的，環境起了很重要的作用。

the causes of most common diseases remain unknown. Genes account for just 5 to 20 percent of the whole picture.

已發現能歸因於某些基因的疾病很少

There are only 23 diseases that start in adulthood, can be treated, and for which highly predictive tests exist. All are rare, with hereditary breast cancer the most common.

最後的建議

The tests 「may be interesting as a kind of entertainment,」 Dr. Caplan said, 「but do not take them seriously yet in driving your health care or your lifestyle.」
He added: 「If you want to spend money wisely to protect your health and you have a few hundred dollars, buy a scale, stand on it, and act accordingly.」

結論就是：老老實實鍛煉，別亂熬夜無規律進食。別信這些結果。

最後推薦一篇文章：真理在縮水，還是上帝在擲骰子？

謝謝邀請。

非常重要而且首先應該提到的一點是這個妹子很正，接下來說幾句閑話。

正如前面幾位同僚所說的，實際上目前通過基因組測序來預測疾病的辦法還是很不可靠的。不可靠的原因，結合幾位同僚的文字和自己的理解，我大概總結四點：

i. 大多數疾病的遺傳/基因組貢獻很有限
ii. 使用的測序技術還需要更準確
iii. 個體基因組疾病預測的計算辦法還需要統一的行業規範
iv. 風險預測僅僅是一個概率，如何解讀需要有一個客觀的認識。

i. 遺傳對大多數疾病性狀的貢獻只是有限的部分。
(1). 在探討基因測序之前，我想先解釋，通過基因組,i.e., genome/DNA, 來預測疾病的大前提是，這個疾病具有相當的可以遺傳性。否則的話這類疾病性狀將涉及到中心法則中更高層的轉錄，轉錄調控和蛋白質翻譯這些與時空相結合的「基因表達」過程。這些複雜的過程, i.e., 表觀遺傳學，epigeneitcs與DNA本身的序列並沒有關係，而於生物個體當時的時空環境密切相關。因此，通過DNA來預測疾病的重要前提是，該疾病性狀可以遺傳，即遺傳率達到一定值（通常&>30%認為是中等），那麼檢測在DNA水平上的變化，即所謂的SNP相關檢測，才對該疾病性狀有意義。
(2). 大多數疾病，其遺傳對其造成的影響本身就是有限的。假如一個疾病遺傳的貢獻能夠達到50%以上已經能夠認為是很大了，而一個遺傳位點SNP對於一個疾病的貢獻如果能達到「遺傳基礎內的20%"就算是非常驚人了。也就是說這個非常驚人的位點對一個非常有遺傳率的疾病的總貢獻率有50%*20%=10%。剩下還有50%-10%的複雜遺傳作用，還有另外50%的環境以及環境與遺傳的互作。這樣看來，即便是能夠發現一些疾病的準確的遺傳位點，這些位點對於疾病的控制力實際上也非常有限。當然我們對遺傳能夠絕對控制的疾病我們已經了解不少了，不過就像其他同仁提到的，這是很少數情況。非常著名的例子，前面的同仁也提到了，有乳腺癌的BRAC。大美女安吉麗娜朱莉因為檢測到這個基因的突變（導致高風險乳腺癌）切除了雙乳，也使得個體基因組檢測名聲大噪。雖然我個人認為這不是非常明智的舉動（我又不是她丈夫who cares），不過一個基因能在某個疾病里有這麼大的貢獻，也算是非常罕見了。而且考慮到人類經過了不斷的進化過程，這些遺傳率很大的疾病在之前非常強的自然選擇里下存活率非常低，缺陷基因或多或少被淘汰了。

ii.文章中，幾個大公司使用的個體遺傳檢測技術, i.e., SNP chip, 來篩選疾病位點並不夠準確。
正如文章本身和其他幾位同僚所提到的，這些公司使用的辦法，只涵蓋了1千萬個位點，而這一千萬個位點存在於整個人類基因組約30億個核苷酸序列中，所以這些公司所測的位點大概佔了0.033%的絕對個體基因組信息。雖然這些基因組位點是整合了之前所發表數據，有很大指引度的高度疾病關聯「基因組標記」，但是沒考慮進來的&>99%的絕對基因組信息難道就一點沒用了嗎？個體基因組信息非常的特殊化，每個人的基因圖譜本身就非常不一樣，常規學術界的疾病關聯位點是通過【有限的基因位點】+【大量的個體】來得出的結論，而且通常這些大量的個體的【系譜信息（pedigree data）】而個體基因組預測只有一個人的基因組信息的時候，就應該擴大基因測序的涵蓋率，而不僅僅局限於常規的位點，我認為這樣才能提高個體基因組預測疾病的準確性。當然整個人類基因組的信息非常大，雖然整個基因組測序已經非常方便，但如何分析這些數據還是正在研究的問題。

iii.個體基因組測序來預測疾病還沒有形成行業規範，各個公司使用不同的測序辦法，基因標記，人類基因組資料庫和計算辦法來預測疾病，所以同樣的基因組信息得出不一樣的結論。
各公司使用不同的測序技術，產生的個體基因組數據本身就有差異。在此之上，正如文章中提到的，不同的公司使用不同的基因標記來預測疾病，例如coronary heart disease，所提及的三家公司使用了4-15個標記，每家公司都使用的完全不同的標記，還沒有重合，結果自然非常不一樣。每家公司對於這些遺傳疾病的平均發生率也有不同的計算評價，例如23andME評價肥胖的平均發生率是59%，而GTL計算的是30%。還沒有開始測序就已經有了大約30%的不同結果，那麼最後給出的報告有很大差異也並不會讓人驚奇。

iv.即便是預測是準確的，預測也僅僅是預測，拋硬幣正反面幾率是50%，你拋了一個正面下次就一定是反面嗎？
個體基因組疾病預測，僅僅是預測，如何解讀這個數字也必須非常小心。即便考慮遺傳占絕對治病因素，測序方法完全準確，計算風險方式也都統一(I hardly think so)，給出風險預測的數字就可以相信嗎？到目前為止其他領域非常精確的數學模型能預測的變數還是非常有限的，在遺傳一塊的意義就更有待商榷了。「如果你攜帶此基因，你得糖尿病風險的幾率比沒有攜帶的高出20%」，這句話到底有多大意義，需要仔細思考才能得出結論。還有，給出的風險數字僅僅是一個概率，可能對這個數字更感興趣的人是你的保險公司而不是你個人（這個以後很難說也是熱門行業）。實際上每個人應該對自己的基因組信息持非常謹慎的態度，可能它對別人的用處遠大於對你自己的用處（如果你真有遺傳疾病，你目前自己很難治癒，而政策制定者可能會喜歡淘汰那些有遺傳缺陷的人）。

綜上所述，就文章中的情況來看，個體基因組預測疾病的辦法可靠性還非常低。其原因大致有：i.大多數疾病的遺傳/基因組貢獻很有限. ii. 使用的測序技術還需要更準確. iii. 個體基因組疾病預測的計算辦法還沒有統一的行業規範. iv.風險預測僅僅是一個概率，如何解讀需要有一個客觀的認識。但是我個人任然認為這是一個有前景的行業，當然也會引起很多的爭議。隨著生物技術的發展各種測序和統計技術會更先進，產生的數據會更全面，到時候預測成本會更低廉，準確率也會提高，屆時可能要考慮的就是如果防止自己的基因組信息泄露了（只需要非常簡單的取樣就能給你測序）。

確實不靠譜，現在賣這種服務的公司都是不靠譜的。就好象拿宋朝的工程技術去發明登月火箭。

瀉藥
對於個人測序情況及醫院方面不是很了解，但是微生物群落多樣性測序也在一定程度上存在這樣的問題。因為不了解你的試驗目的，只能根據我的經驗給予拙見，不合理之處大家共同探討。
舉個例子，通過環境樣本來測群落結構
1、環境樣本到上機測序前的差異，基因組DNA的提取，PCR擴增和純化，不同公司的引物和引物體系可能不同，提取效果也存在差異
2、上機測序，測序平台不同，每種平台有其自身特點，上機時用到的各種試劑也會有影響。
3、得到序列後，如何來剔除不好的，用什麼程序比對，用什麼資料庫比對。Qiime和Mothur的結果不同，silva和NCBI資料庫導致差異
4、結果分析時的方法。如利用CCA分析時用R和Canoco的結果就不一樣
總之，不同公司的結果差異是必然的。你所需要關注的是這些差異有多大，這些結果的產生流程是怎樣的，那些公司的結果更具有權威性。一般來說，大方面的差異是很少出現的，比如環境中那些物種佔優勢，他們的大概比例；而那些稀有種的類群和比例有可能因公司而異。
需要根據試驗目的在測序之前有充分的了解，然後在各個公司之間取捨就好。若是你非要讓所有公司的結果（數據方面）都一致，在我看來目前微生物多樣性的領域還不現實

結論不同有兩個原因：
1，各個公司所參考的文獻數據不一樣，導致對snp的定義不一樣或者演算法不一樣。
2，Illumina的晶元號稱結果重檢率在99.89%？左右，100萬個位點錯1100個。萬一有落在參考位點上的，必然結果會不一樣。

關於是否有意義，可能對於支持者和反對者來說，目前都沒有非常確鑿的證據。但是我相信，至少大家都會一定程度上認可，技術完全成熟的時候，基因檢測是必須的，處於診斷的上游。

有人認為朱莉很誇張。我只能說你們不了解乳腺癌和卵巢癌，乳腺癌目前有很多藥物包括Her2靶點的新一代TDM-1可以治療，但依然逃不掉複發轉移死亡的結局。而卵巢癌則更可怕，其預後非常差，是一種很致命的癌症（癌症的惡性程度差別很大，比較容易治癒的是睾丸癌，甲狀腺癌等，比較厲害的如肺癌，卵巢癌等）。而作為一個80%幾率罹患這兩種癌症的人，朱莉的做法無疑十分非常明智，只不過目前其他有同樣基因缺陷的人沒有這個條件而已。

一項新的技術誕生之初必然很多人反對，而也正是這些反對會讓新技術越來越強大。

各個公司使用的人群基線資料庫不同，那麼客戶與「正常值」的比較結果當然不同。測序或者定點基因檢測並不難，難的是大人群資料庫的建立以提供精準的預測結果

下面這段引用內容就是答案嗎？既然這些公司的低成本解決方案並非全基因組測序，漏掉了 99.9％的數據，根據結果得出來的分析和建議也大型徑庭甚至矛盾，那這些服務的意義是什麼呢？消費怎麼知道自己是否應該選擇相信，或者是選擇相信哪家公司的結果？

... The genetic testing that these three companies offer is premised on reading segments of DNA called SNPs (pronounced snips), for single nucleotide polymorphisms. But these segments, which have been linked to diseases in research studies, vary among people.

Scientists have identified about 10 million SNPs within our three billion nucleotides. But an entire genome sequencing — looking at all three billion nucleotides — would cost around $3,000; the tests I took examined fewer than a million SNPs.

「Imagine if you took a book and you only looked at the first letter of every other page,」 said Dr. Robert Klitzman, a bioethicist and professor of clinical psychiatry at Columbia. (I am a graduate student there in his Master of Bioethics program.) 「You』re missing 99.9 percent of the letters that make the genome. The information is going to be limited.」

Companies choose which SNPs to read. By comparing the technical reports provided with my results, I found that my tests sometimes relied on different SNPs to assess the same condition, like coronary heart disease. Each test studied four to 15 markers, with almost zero overlap, though two tests reached similar conclusions about my odds...

In the case of rheumatoid arthritis, though, the tests examined the same five markers, plus a few others, and delivered contradictory interpretations.

via I Had My DNA Picture Taken, With Varying Results — nytimes

不同公司做基因篩查，找的snp很可能差異很大，結果不同很正常。如果同一份樣品分別送華大，諾禾，還有自己測，都用hiseq2000平台，建一樣的庫，一樣的拼接方法，差異會有，但是不會太大。

記得做過一篇考研英語閱讀，就是關於基因檢測的。裡面有一段說各大公司的基因測序的結果不同可能是因為他們所基於的「庫」(好像是這個單詞，記不太清了)不同。每個公司的「庫」不同我的理解就是每個公司的資源庫不同，既然資源庫不同那麼結果可能就會有偏差
不是相關專業的學生，僅憑經驗回答。

2009年考研英語第二篇講的就是基因檢測的問題。。下面是部分段落翻譯

紐約大學的社會學家特洛伊－達斯特說「聲稱自己做家譜檢測的人們所吹噓的精確是偽精確」。他指出每個人都有多個祖先，僅上溯幾百年，祖先的數目可達百位之多。然而大部分的家譜檢測只考慮單一的譜系——同一父系的男性遺傳的y染色體，或者僅通過母親傳遞給子女的線粒體DNA。這種DNA只能揭示一兩位祖先的基因信息，而僅上溯三代，每個人還有（檢驗之外的）六位曾祖。上溯四代，還有十四位高祖的信息被遺漏。

批評者還指出，商業基因檢測的準確率取決於用於樣本對比的參考資料庫。很多公司採用的資料庫不是基於系統收集的數據，而是基於不同研究項目信息的混雜。這意味著某個DNA資料庫有來自某些地區的大量數據，但缺乏其他地區的數據。因此，針對同一個人的檢測結果會因為處理研究結果的公司不同而存在差異。另外，公司用於判定血親關係的計算機程序可能申請了專利保護從而不接受同行評審或外界評估。

想看原文的自行搜索 Scientific American（科學美國人）「社會與政策」板塊2008年11月14日題為Who"s Your Daddy? The Answer May Be at the Drugstore（誰是你的父親？在藥店可能找到答案）的文章。

如果樣品質量穩定（包括純度、時間點等），深度足夠的話，測序結果應該是高度重複的。事實上，隨著測序成本的下降，在一些測序做得很多的實驗室里，測序實驗的成本已經低於了數據存儲的成本。所以對一些實驗，只存儲樣品，不存儲數據（需要的時候再測一遍）。

至於結果的解讀，不同的分析演算法會得出不同的結論，不同的分析人員也有不同的著重點，生物學或者醫學背景的研究人員和純quantitative 背景的人看問題的方式不同，得出的結論也不同。

謝邀。
1.即使是同一家公司也可能給出不同的分析結果，目前基因診斷基因治療還只是活躍在文獻上。
2.即使診斷結果不同（所謂矛盾只是數據的差異），都是基於科學的方法，說明是可預測的，這就是意義。

基因測序目前的準確度還不夠高，有時候不同機構得出結果大相徑庭有以下幾個原因：

1. 多基因表達的存在使得很多病症基因診斷複雜性太高
非常少的疾病是由一個或幾個基因能解釋的，大多數疾病均為遺傳因素和環境因素互相作用所致，比如關注很高的癌症或精神疾病，相關基因多大幾百個甚至上千，基因檢測不僅要完成所有基因的檢測，還需要考慮基因之間的相互作用，複雜程度及檢測成本均很高，量化困難，所以不同的機構結果可能不相同，可靠性或穩定性均下降。

2. 先天性疾病準確度高，慢性病風險預測目前還是非常模糊的階段，只能做日常保健提示，還達不到臨床水平。

3. 表觀遺傳使現象更加撲朔迷離。表觀遺傳是指基因序列不發生變化，但基因的表達卻發生了可遺傳的改變。表觀遺傳通過甲基化來影響基因的表達，這種現象使得基因測序的預測能力進一步下降。

4. 目前測序本身的精度就有待提高，演算法的優化有待提高。基因測序的精度依賴特定的演算法，因為基因測序本身不能預測發病率，我們只能從測序知道自身身上存在哪些基因，哪些突變了，然後根據這些信息，這些技術都可以得到提高，但是如果分析依據的研究數據集和臨床數據判定本身就有爭議，那就真的無語了。

就根本上說，人們雖然能做基因組測序，但距離知道對於每一段基因究竟能代表什麼還差很遠，給出不同的結論完全不奇怪。

大家談基因檢測更多的討論的是疾病遺傳易感風險評估，其實基因檢測更多的是偏臨床的應用，比如無創產前唐氏篩查，胚胎植入前遺傳篩查，腫瘤靶向藥物篩查，化療藥物敏感性和毒副作用，其他各類慢性病患者的安全用藥檢測（主要是不同人對藥物的代謝能力不同）還有面向健康人群的基因檢測，比如基因能力基因檢測的糖尿病，心血管疾病，腫瘤等遺傳風險評估。

基本的報告，本身是不斷的迭代和更新的，當前的報告基於當前的研究，如果每家的報告不同，很簡單，給出相關的依據（文獻）來。國內的基因檢測大部分不給數據，這是很大的問題。
http://wegene.com提供23andme和中華8晶元的數據報告，有興趣的可以看看。