【高管聲音】基因測序,風口上的思考(二):基因測序的誤區和瓶頸

基因測序無疑是未來看好的技術之一,但其真實價值幾何?什麼樣的創業項目不值得投資?什麼樣的技術才有護城河?什麼樣的應用方向才可能正確?基因測序的前景還有哪些瓶頸?作為基因測序領域的資深從業者,Life Technologies(現為Thermo Fisher收購)公司全國臨床與科研事業部銷售總監、Thermo Fisher公司全國臨床市場戰略總監柴映爽寫了一系列文章,對上述問題進行了深入剖析。繼第一篇文章《基因測序市場格局介紹》之後,以下為柴映爽系列文章的第二篇:

二、基因測序的誤區和瓶頸

1.水晶球只是童話——風險評估預測為何不靠譜

人類對不確定性的恐懼和好奇一直存在,基因測序可否用來做患病風險評估,成為一個預測未來的水晶球?理論上來講是可以的,反正人生都是在各種概率中前行。但實際上能用於指導實踐還是有很多疑問。首先要確定個體基因測序的結果是否偏離了正常人群,就要有一個統一、科學、標準的資料庫,遺憾的是現在還沒有。大部分公司的做法是自己構建資料庫,加入臨床上確認的和科研上研究比較多的一些突變位點,受檢者測序後和這個資料庫進行比對,看看有沒有出現這些突變。然後根據這些突變發生的情況,給出一個患病的百分比概率。但是,問題在於:1)這個資料庫是否可靠,很難證明。有相關性也不代表就是因果;2)已明確和臨床疾病有關的突變實際上是相當少的,很多突變即使有了也不一定就意味著會發病;3)除了遺傳病(如罕見病)以外,大部分疾病是多基因相關,並且和後天環境也很有關係,單靠基因測序並不能夠完全模擬發病的所有相關因素;4)這個百分比概率是用什麼軟體模型算出來的,軟體是否靠譜,很難說。即便說個體的患病風險比正常人群高了5個百分點,是否說該個體就有更高的患病可能,很值得商榷,對臨床也沒有任何指導意義,概率並不能用於進入臨床診療標準。基於上述原因,目前幾乎每一家公司測出來的疾病風險都不同。目前的風險評估預測,除了影響心情以外,沒什麼實際意義。

風險評估預測不靠譜

至於一些什麼兒童性格基因和天賦基因商業檢測,更加荒唐。學術界至今沒有公認哪個基因跟天賦有必然聯繫,拿著一些發表的探索性研究文章,就說是業界證實的結果,忽悠行業外的老百姓賺錢,既不科學,也不道德。

2. 是否應該進行全基因組測序?

從科研角度來說,完全沒有問題,但在臨床應用方面就不是了。除了遺傳病以外,目前很多基因和疾病的關係都只是「可能」,還沒有定論,即便是BRCA1,也只能說近乎「公認」跟遺傳性的乳腺癌有關。一堆解釋不清的測序結果,對醫生和病人來說都沒有意義,病人卻因此要承擔更高的檢測成本,未來不會得到衛生政策部門的贊同。檢測某腫瘤,是否一定要測一大群基因?和腫瘤的關係都明確相關嗎?這些基因對該腫瘤的診治意義有多大?臨床診斷指標,「多」不重要,「明確」才最重要,有多個明確相關指標,則是好上加好,利於綜合判斷,而做多少檢測,還要從臨床實際判斷出發。這就好像你發燒咳嗽到醫院去看病,醫生除了給你驗血常規以外,又給你查生化全套,又給你查SARS病毒,又讓你去做包括PET CT在內的所有影像學檢查看看是不是癌症,末了再來個骨髓穿刺查白血病,因為癌症和白血病也可能引起發熱,會不會有人接受呢?具體工作中,醫生還是會結合病人主訴、流行病學資料、病人經濟能力、生活行為、前期治療觀察等因素,確定首選檢查手段,根據經驗分步進行鑒別診斷。所以,全基因組測序的結果,目前給臨床帶來的無所適從要多於指導意義。更不用說應該測多少倍的深度,這方面連個標準都沒有。各種全基因組測序資料庫,跟大量的重要臨床數據(如腫瘤大小,家族史,藥物使用,其他診斷數據)沒有足夠關聯,因此未來也不一定有用。

醫生的診療,會包括通行的標準診療和標準流程之外的探索性診療兩部分。後者是醫學進步的動力,但在當前中國的醫患環境下越來越少。儘管如此,對於標準診療無解的病人,醫生會嘗試非常規的診療尋找突破,這種極端情況下全基因組測序是有一定價值的。我們有時會見到這樣的例子,無法確診或治癒的病例,通過測全基因組後發現了某個突變,根據該基因突變對應的蛋白質功能和表觀性狀,最終得到確診或是找到了某種對應的藥物(用於其他疾病的或是還沒上市的)。但是也有測了全基因組什麼辦法也沒找到的,比如說喬布斯同志。這種診療不能成為目前醫療的主體,因為不確定性太多,它沒有辦法替代現行的醫療模式。

3. 任重而道遠——生物信息學的瓶頸

高通量測序是通過把提取的樣品DNA打成小片段,在機器上進行大量平行測序,然後將讀取的序列信息拼接成完整序列,和參考序列進行比對,這裡需要很多的生物信息學工作。因此,在拼接的過程中難免有演算法誤差,另外打碎DNA片段的實驗步驟也有重複性的問題。由於突變位點不是每一次測序都能測到,因此需要測很多次,有時候甚至測到上千次,這也是高通量測序會產生海量數據的原因。測到目標區域的平均次數稱為測序深度,如測100次就稱為100×(倍)的測序深度,專業一點來說是測到的鹼基總量除以基因組鹼基數量的的大小。患者得到的數據,到底是30×還是100×還是2000×測序來的,一般人不知道。而測序後通過生物信息學分析出的突變,是真實存在還是測序產生的誤差,也見仁見智。目前來說,到底要測多少倍才算比較准,都是按照業界通行的理解來進行的,在臨床應用上尚沒有法定的標準,也給如何統一各家公司自己的資料庫出了個難題。如果這個資料庫要用於治療目的,那麼是在什麼臨床環境下測的數據,也很少有人提及。

另一個是海量數據帶來的計算機存儲問題。人類基因組3.2個G,測50倍的通量就要160G,光數據存儲一個小硬碟就用掉了,想發展大數據,搞雲計算來比對,以現在的網路傳遞起來還是很慢的。做科研還好,但在臨床上,基因組數據帶來的效果還不足以無視這些額外產生的計算機集群負擔,有點像互聯網之初要用Modem等待漫長的滴答音後才能接通Internet一樣,影響了公眾對互聯網的接受度。這方面的瓶頸也許要等到新的技術出現才會突破,如新的圖形存儲格式,新的演算法,新的通信協議,等等。或是新的測序技術出現將現有的生物信息學過程徹底拋棄。

目前的生物信息學解讀主要還是側重於測序結果的解讀,隨著HTML5協議的出現,可視化的基因組學瀏覽器已經有了很多發展,界面更加直觀,也減輕了很多後台伺服器的負荷,但是還是面向專業技術人員的,並沒有完全發展到臨床信息的解讀,因為這個同時需要很深的臨床專業知識。僅僅是基因測序的結果拿給臨床醫生看,可以說幾乎沒有人看得懂,在臨床的應用程度可想而知,更不用提醫生如何向病人解釋他為何根據基因測序結果要採取某種臨床干預。大多數臨床醫生更希望把基因測序作為一種標準化操作工具,而非了解該工具本身。而目前基因測序的數據結果到臨床醫生工作中的直觀指導,還存在相當的距離,基因組數據無法被醫生搜索、共享和理解。臨床客戶的兩個基本訴求:「安全」和「標準」,基因測序尚不能實現。數據格式標準不能統一,臨床指征與基因檢測結果關係的專業資料庫的缺失,使得基因測序在臨床應用上受到生物信息學的很大束縛。

生物醫學研究會產生海量數據

4. 腫瘤基因測序難以大範圍推廣

腫瘤的基因測序是當下的一個熱點。由於腫瘤和基因組有一定的關係,使得行業外產生了很高的期望值。但它有兩方面的主要瓶頸:臨床機理和臨床操作。目前市場上腫瘤基因測序有腫瘤的靶向治療指導和腫瘤的易感性基因檢測。腫瘤的易感性基因檢測存在相當大的爭議,嚴格來說沒有臨床價值,因為腫瘤與基因關係的基礎理論仍然不足,可臨床確認為高度腫瘤相關生物標記物的基因幾乎沒有,單是「腫瘤易感性基因」這個有因果意味的定義就很有問題,作為腫瘤的大面積常規篩查說服力有限,即便做了,基因結果和腫瘤的確切關係也根本說不清楚。從這個角度來說,所謂腫瘤易感性基因檢測不是一個合理的方向。腫瘤的的家族史倒是跟遺傳有關,但像遺傳性乳腺癌檢測與其說是腫瘤基因檢測,不如說是廣義的遺傳病基因檢測更好解釋些。相對而言,用於靶向用藥指導的意義比較明確,但這個市場會被定量PCR和常規一代測序分走一些,另外人種和地域可能會影響對同一基因的突變位點的選擇,沒有標準。現在的靶向藥物類別不多,進入標準指南的就是肺癌的EGFR和ALK基因,轉移性結直腸癌的kras基因,和黑色素瘤的braf基因檢測,其他的基因靶點檢測都屬於醫院自行開展,測算市場剛性需求時比較容易有水分。一個與學術無關的現象是,即便基因檢測結果表明該藥物可能無效,病人若沒有其他選擇,還是可能會抱著試一試的心態使用該藥物,使得基因檢測的意義可有可無,導致醫生做基因檢測的動力下降或動機改變。

在臨床操作層面,目前腫瘤基因測序沒有專門的收費標準,基本上都是套用按位點做基因測試的收費標準來的,各省物價,一個位點在250-600元不等,這個價格對高通量基因測序來說不合算,但由於高通量測序可在成本不變的情況下一次性測很多位點,因此一般來說是按照多個位點進行收費,限於病人經濟承受能力,一般市場收費在4000-8000元不等。這方面該測多少位點,收費怎麼計算,還缺少相關的政策。另外,腫瘤基因檢測臨床實施並不方便(血液腫瘤除外),區別正常突變和腫瘤基因突變對人員技術能力要求較高。由於腫瘤的基因組不穩定,常產生耐葯突變,作為療效檢測的話,需對腫瘤病人多次腫瘤部位取樣活檢,無疑增加了病人的痛苦和操作難度。而且,是否要同時取癌旁正常組織一同測序,這部分收費是否要病人承擔,政策上都沒有定論。

最近液體活檢受到重視,是指在外周血中尋找脫落或凋亡釋放的腫瘤細胞DNA(ctDNA)進行基因測序。這種取樣方式大大好於組織取樣,長遠來說可能適合癌症複發的早期檢測,但距離臨床應用還比較遙遠。循環腫瘤細胞DNA是不完整的DNA碎片,需要大量基因測序,大量的生物計算拼接,誤差不好控制。還有怎樣確保減少假陽性,和腫瘤目前的TNM分期如何對應,這些技術問題都需要時間。一個現實問題是:如果ctDNA結果提示腫瘤,但病人去做了PET-CT也沒有發現病灶,病人該怎麼辦。相對而言,尋找循環腫瘤細胞(CTC)輔助以基因測序驗證可能是一個比較有希望的方案。CTC可以得到完整的腫瘤基因組,作為診斷指標在臨床上也容易界定,不過如何保證CTC的捕獲效率,目前沒有最理想的方法。

總之,腫瘤的機理過於複雜,基因測序和實施臨床干預還不能順利對接,操作層面和政策層面還有很多困難,遠非理想的應用狀態。從遠景來說,隨著靶向藥物的開發和腫瘤免疫的進展,基因檢測的需求長期存在。但目前還受制於大數據如何積累,如何搜集標準標本,如何建立大分析平台,短期內無法解決。一部分臨床需要的基因檢測用更簡單便宜的PCR或FISH即可解決問題,並不需要高通量測序。當下很多人熱衷於用科研思路去解決臨床問題,但醫療不同於科研,必須考慮很多的社會人文因素。而腫瘤這樣一個熱點市場,作為一個公司要長期生存的話單純依賴這方面業務需要謹慎。等到這些瓶頸解決有希望盈利的時候可能又出現新的替代技術了,這是一個受到很多關注但技術路線變化可能性非常大的市場。

4.最大的瓶頸—全社會的認知和現行醫療體制

醫學本身並不是面向大眾的科學,基因科學更加小眾。基因與疾病的關聯的社會認識程度還不高。大部分患者、醫生、政策部門、投資人,都不是很了解基因測序的知識。普通老百姓很難說清楚基因是怎麼回事,有些人還以為遺傳病就是精神病,大量臨床醫生對基因測序的理論基礎也很難理解,何況這個技術還在不斷更新。在這樣一個現實環境下,基因測序在未被充分檢驗之前就投入了醫療這個高度監管行業的應用,某種程度上講是危險的,對基因測序技術應用的誤讀誤用,會影響其本身健康發展,損害它作為一種新的技術所需要成長的空間,會出現劣幣驅逐良幣的現象。全社會還需要更多參與到基因科技的普及中。

由於互聯網的發展帶來信息量的大增,今天患者越來越參與到對他們自身診療的決策過程中,知識程度的不對稱和診療話語權的分配無法協調,也是今天醫患矛盾的原因之一。這是一個傳統醫療體制正在變化的時代,基因測序若得不到正確的理解和實施,會被拔苗助長,最終和體制不能結合而失去發展。基因測序用於臨床干預來說很多結果還很模糊,又不能帶來健康行為的根本改變,相關的法規也還缺失。臨床診療過程需要的是基因測序的臨床解讀而非技術解讀,但目前實施醫療的主體——醫院和臨床醫生,對這一傳統醫學知識體系之外的技術還需要學習,而基因測序的檢測提供者只提供技術,臨床應用責任因為缺乏相應法律保護而沒有承擔主體,這一體制瓶頸約束了基因測序的發展,需要政策制定者的智慧。

為了解決基因測序結果到臨床應用的連接問題,2015年成立了中國遺傳學會遺傳諮詢分會,開始了遺傳諮詢師的定期培訓班,邁出了開拓性的一步。但如何應用於醫療實踐,還缺少合理的制度支持。如何對臨床標本的基因檢測結果進行標準化描述、評估和溯源,是當下醫療體制的瓶頸。生老病死是人類最重要的問題,在相應的瓶頸沒有突破之前,基因測序只適合少部分地用於醫療實踐,絕不適合在全社會推廣應用。

2015年2月9日,中國遺傳學會遺傳諮詢分會正式成立,同時首屆學術研討會也成功舉辦。

未完待續,精彩內容請關注後續系列報道:

基因測序,風口上的思考(三):什麼才是護城河?

基因測序,風口上的思考(四):對未來的預測和建議

作者介紹:

本文作者柴映爽,上海醫科大學預防醫學專業學士和國家CDC病毒所基因工程學碩士。曾在歐美製葯公司工作,2004年初進入Life Technologies 的前身Applied Biosystems公司工作至今,見證了十年來中國基因科學和分子診斷的飛速發展。個人興趣在於研究基因科學的最新成就,致力於推動成熟的基因科學成果進入中國分子診斷市場並得到健康持續的發展,使得中國的患者能夠受益於最新的分子診斷技術。

本文僅代表作者個人觀點,與作者所供職機構無關。


推薦閱讀:

日誌電影《阿凡達》原聲音樂專輯
生命工程 久久為功(聲音·從嚴治黨新起點)
閉上眼 | 你聽,這座城市的聲音
只有喵星人能聽懂的聲音是怎樣的?
我是歌手,誰有好聲音?

TAG:基因 | 聲音 | 思考 | 誤區 | 瓶頸 | 高管 | 測序 | 風口 |