循證醫學、精準醫學和大數據研究,讀一讀專家的精彩觀點!

循證醫學、精準醫學和大數據研究,讀一讀專家的精彩觀點!

本篇文章的內容轉自《中華流行病學雜誌》2018年第39卷第1期,作者為唐金陵教授和李立明教授,原題目為《關於循證醫學、精準醫學和大數據研究的幾點看法》。想將這篇文章分享給醫咖會的用戶們,希望大家能從領域大咖的見解中有所收穫,進一步指導未來的醫學研究之路。

一、循證醫學中的情與理

循證醫學呼籲醫學實踐須基於現有最好的應用型(而不是基礎型)研究證據。沒有循證醫學的敦促,醫學研究就多會停留在理論上;沒有循證醫學的反饋,醫學研究可能會偏離正確的軌道;沒有循證醫學這張盾牌,資本就會更肆無忌憚地讓醫學為利潤服務。然而,在肯定證據在醫學決策中重要性的同時,還必須強調證據本身並不是決策,決策還必須兼顧現有資源的多寡、患者的需要和價值取向。

如果把證據稱為理,證據以外可以影響決策的因素就是情。如果理是科學發現的客觀事實(如一個藥物被證明有效),情就是人們如何利用這些事實的主觀情感和好惡。醫學決策,情與理缺一不可。在20世紀90年代循證醫學初期,人們對醫學應用型(主要是流行病學)研究及其產生的科學證據認識不足、重視不夠,有必要特別突出證據在決策中的重要性。但是在證據和指南被視為「綁架」了醫學實踐的今天,有必要重申或特別關注其他因素在決策中不可或缺的作用,儘管目前還有很多醫學指南和實踐並非基於證據。

研究證明一個藥物有效,這是理。理是中性的、穩定的,具有普遍性,展示了決策選擇的可能效果。證據無疑應該滲透到每一種決策中,證據存在時,忽視證據是無知和不負責任的行為。但是,對循證醫學的很多誤解和誤用,多是因為把證據等同於行動,過度強調了證據在決策中的作用

我們可以造出原子彈,但有了原子彈不等於就可以殺戮,否則就是決策中對情的忽視。證據在決策中的作用就是告知真相,當證據被清晰地呈現出來時,它在決策中的全部作用就已經完成了。證據不會告訴你做不做、做什麼,是人在做選擇和決定。

葯有效,吃不吃?取決於情。情的核心是支撐人們行動抉擇的價值觀,價值觀決定了人們的好惡和需要、對事物重要性和意義的判斷,以及對有限資源(如人力、物力、時間、金錢)的分配意向等。人們的價值觀雖然不同,卻沒有嚴格的錯對之分。情因人而異,面對中性不變的理,不同的人會做出不同的抉擇。

循證醫學的走樣,也多因情的濫用和自作多情。忽視證據的存在是情的濫用;只認理不認人,違背當事人意願的決策是自作多情。降血壓藥物治療100個高血壓患者,5年內大約可以預防3例心肌梗死或腦卒中事件,費用不高,副作用不大。癌症靶向藥物能延長生存幾個月,但治療所需費用可達幾十萬甚至上百萬元人民幣。治還是不治?沒有絕對正確的答案,依情而定,因人而異。

其實,證據也非完全無情。以治療為例,為什麼人們研發了一些治療方法而不是另一些?為什麼評估了一些治療方法而不是另一些?為什麼選用了一些結局而不是另一些?為什麼發明了一些測量而不是另一些?為什麼在這些人群中評估而不是另一些?其實,科學探索真理過程中的每一步選擇或多或少都有價值觀的導向。

甚至在什麼是疾病這個醫學最根本的問題上,也不完全由真理決定,也有人情。高血壓、高血脂、糖尿病的診斷切點應該放到哪裡?腫塊多大的癌變才算癌症?沒有絕對的客觀標準。疾病不是一個絕對客觀、黑白分明的事實,如何定義疾病,通常需要人的主觀抉擇。主觀性介入的地方,就是情之所系的地方。

由於不同人群情的變化與不同,多數關於是否應該干預的「僵硬的」國際共識和指南都是可被質疑的。合理的治療應該是在合適的地點、時間,由合適的提供者,給予患者可負擔並願意接受的安全、有效的治療。「合理」就是既依據於「理」,也合乎於「情」。與指南恰好相悖,因為情的多變,合理的治療必然因人而異,只能是個體化的決策。

我們強調合理醫療,是因為有很多不合理的亂象。為什麼已經循證了還有亂象?就是因為在科學探索及證據應用中小視了「情」的作用,或是「亂」用了情。不合理的亂象背後經常有利益的影子。無論如何,醫學都不能丟掉它的初衷:患者利益第一。只有這樣,醫學的路才不會走得太偏。

另外,有人認為,循證醫學否定了直覺、經驗和假設,把隨機對照試驗(RCT)和Meta分析或臨床研究等同於循證醫學,把統計學意義等同於臨床意義,過於信任統計數字,用證據逼迫醫生做不該做的事情,這些認識和批評多是源於對循證醫學的誤解。

也有人認為,循證醫學中人文關懷不足,RCT和指南被商業利益利用,進而引起過度診斷和過度治療,例如有些靶向抗癌藥物效果很小、費用很高、喊得很響,這些問題多是循證醫學被誤用的結果。對循證醫學的誤解和誤用不是循證醫學本身的問題,而是使用者的問題。

也有人指出,RCT中的患者不能代表所有患者,研究顯示的平均結果不能精準到每個患者,RCT和Meta分析有自身的問題,研究中還可能存在偏倚、誤導、甚至偽造的結果,這些問題反映的是整個現代醫學和醫學研究的局限性及其有關的不良的人為因素,尚沒有比循證醫學指出的更好的解決方案

二、精準醫學

不等於孤注一擲的DNA測序

20世紀後,慢性病成為人類疾病的主要負擔,但是慢性病的防治遠沒有抗生素和疫苗應對傳染病那麼精準有效。例如,研究證據顯示,100個患者服用抗高血壓藥物5年,只有3人因治療可預防冠心病和中風,對其餘97人無效。在絕大部分治療的患者中無效,說明治療很不精準。抗癌治療、降脂葯、降糖葯等也都不精準。找到那幾個為數不多的對藥物有反應的患者就成了現代醫學的夢,精準醫學應運而生。如果前面談的主要是依據價值觀的個體化治療,而精準醫學則是希望在生物學意義上的個體化

20世紀生物醫學最偉大的突破莫過於發現了人類遺傳物質DNA的雙螺旋結構,解開了人類遺傳的密碼。DNA測序可以發現疾病的易感基因,把預防做得更精準,也可以發現對治療產生反應的相關基因,把治療做得更精準。20世紀70年代PCR誕生後,最紅火的醫學研究應是與基因相關的研究,為攻克癌症和心血管病預示了無限的前景,我們把大部分生物醫學研究資源都用在了相關研究上。

精準醫學的最初願景是希望通過基因測序這個全新的技術,找到對防治敏感的患者,進而大大提高防治的精準,提高防治效果。但是,很多人一開始就懷疑基因組學技術本身可以獨立而圓滿地解決防治精準的問題。因此,人們在精準醫學裡又注入了其他新技術,如蛋白組學、代謝組學和腸道菌組學。進而在精準醫學裡納入影響防治效果的傳統因素和技術就成了必然,這些因素包括年齡、性別、家族史、疾病亞型,以及傳統的病理、生理、生化、免疫、影像檢查等。

因此,當很多人還在認真揣摩精準醫學到底是什麼的時候,首先推出精準醫學的美國把精準醫學的旗艦項目(The Precision Medicine Initiative Cohort Program)改名為「我們所有人的研究項目」 (All of Us Research Program)。這個從基因測序出發的精準醫學本質上已變成一個典型的流行病學隊列研究,基因特徵不過是可測量的一種暴露因素而已。在眾多因素之中,基因是否可以超越其他因素而勝出,還是未知數。

其實,除了納入新的測量因素之外,精準醫學不過是老葯裝新瓶,並不是什麼新思想。逐步邁向診斷和防治的精準一直都是醫學追求的目標,是醫學最根本的目的所在,也是醫學每一次重大進步的標誌性特徵。然而,醫學的精準絕不只是基因層面的精準,也絕不是有了基因測量之後才可以精準。例如,自19世紀中葉起,微生物的發現及其檢查方法的出現就是人類診治傳染病的一次革命性的精準,X線等影像技術是向活體內探測和定位的另一種革命性的精準。

廣義地講,認識到疾病的特異癥狀和體征,發明溫度計、聽診器、X線、超聲波、CT、內窺鏡、顯微鏡,以及生理、生化、病理、微生物、免疫檢查等方法,都是醫學邁向精準的步伐。有了這些手段,已可將很多疾病的診斷和治療把握得十分精準,尤其在防治傳染病上,取得了有目共睹的成就。例如疫苗預防傳染病、血型鑒定與輸血,以及影像定位與外科手術。

而且醫學的精準已在人類認知的不同層面全面展開。例如,用CT確定骨折部位是大體解剖層面的精準,用內窺鏡確定疾病的部位是在器官層面上的精準,確定癌症細胞類型是在細胞層面的精準,測量抗體確定感染菌型是分子層面的精準,基因標誌物則是在基因層面的精準。

這些檢查方法提高了診斷的精準,也提高了預後預測的精準,但診斷和預後的精準不等於防治的精準,而最終醫學需要的是防治的精準。基因檢查(包括目前和未來任何其他新的檢查技術和方法)帶來的診斷上的精準是否可以帶來防治的精準是一個必須追究的問題。從提升防治效果的意義上,基因檢查也許會再一次帶來驚喜。

但目前來看,精準醫學標誌性成果的靶向抗癌藥物,最多也只可延長生存幾個月,遠沒有微生物和影像相關技術那樣真正掀起了一場防治的精準革命。醫學一定會有新的奇蹟出現,但對於基因診斷我們是否過於樂觀,是否應把所有雞蛋都放進一個籃子?精準醫學後來的退讓、調整和「變味」,正是這種擔憂和質疑所產生的結果。

美國精準醫學的旗艦項目本質上是一個同時考量很多因素的大型隊列研究(PMI 2016)。在探索慢性病病因上,20世紀中葉人類就開始了大型隊列研究,4萬人的英國醫生研究(British Doctors Cohort)揭示了吸煙和肺癌的關係,長達70年的佛明翰心臟研究(Framingham Heart Study)揭示了心血管病的主要危險因素。2004年,中國開展了50萬人的慢性病隊列研究(China Kadoorie Biobank Study),並採集了生物遺傳標本。

這些研究結果已使肺癌和心血管病的預防變得更加精準。在評估療效上,類似大型隊列研究的是大型隨機對照臨床試驗。因此,精確醫學的隊列研究也不是新生事物,無非是納入的人數越來越多,納入因素的種類越來越多。

為什麼需要更多人數的研究呢?科學研究的一個重要特徵是,研究的效應或效果越小,需要的樣本量就越大,所形成的研究就越大。白內障手術可使患者馬上重見光明,治療幾個患者就足以說明問題。100人服用阿司匹林10年可預防1例冠心病、中風或死亡,需要上萬人來驗證。這樣的效果無論如何都算不上是個驚喜,更談不上精準。因此,一個悖論就出現了:需要的研究越大,其證明的防治的平均作用就越小,就越不精準。

一個危險因素作用的大小可以用相對危險度來衡量。在英國,吸煙和肺癌關係的相對危險度約為15,大約93%[(15-1)/15]的肺癌都是吸煙引起的,如果根除吸煙,可在吸煙者中預防93%的肺癌。即使這樣,很多人對吸煙的害處仍不以為然。那麼,一個相對危險度低於1.5的基因對指導預防和治療的價值會有多大?值得拷問。更不用說圍繞一個基因採取措施的複雜性和可能的負面後果。

然而,人們對基因抱持的期望遠遠大於對戒煙好處的認可。由於自身能力的局限,人類會相信神明,越是不可思議的越可能被奉為神明,雖然常識更有可能是對的。這使人類有時會集體變得盲目。那條藏著我們每一個人生命密碼的DNA鏈太神奇了,我們無法不把它奉若神明。

這條握著我們命根子的DNA鏈真的握著我們的所有命運嗎?包括疾病、康復和長壽?關於命運有一個悖論:當我們預測到命運時,命運就會轉變。這有點兒像量子力學裡薛定諤貓的味道。當我們知道未來會大富大貴時,我們會放鬆努力,大富大貴也許不會再來;當我們知道未來生活艱辛時,我們會努力工作,命運會因此而轉變。如果基因決定了我們必然會長壽,為什麼還不胡吃海塞?如果這條DNA鏈真的握著我們的所有命運,它為什麼掌握不了自己的全部命運,還要用這七尺肉身把它重重保護?我們這個肉身在大千世界裡又會走過怎樣的命運軌跡?我們懷疑這條DNA鏈真的都能說清楚。

人大於構成他的物質基本元素的總和,因此還原論不是唯一可勝出的方略。如果基因這條路只是很多通路中的一條,孤注一擲的代價就太大了。即使精準醫學有無限的前景,但它是否可以精準地指導治療,最終還必須通過人群研究進行驗證

首先,精準到每一個人經常是不必要的,因為人之間存有共性;精準到每一個人可能只是一種理論設想,因為它很難通過重複而得到驗證,除非療效極大極明顯。其次,如果可以精準到亞組,驗證一個基因標誌物是否可以在一個亞組人群有效地預測療效,隨機對照試驗仍然是最可靠的方法。比如,將KRAS野生型和突變型的結腸癌患者分別隨機分配到治療組和對照組,然後比較靶向抗癌藥在KRAS野生型和突變型亞組患者中療效的區別(即交互作用),就屬於這類研究。這樣的研究最終又構成了有關療效的科學證據,必應納入循證醫學實踐。

由此可見,精準醫學與循證醫學是互補關係,不是替代關係,精準醫學的研究結果也是循證醫學的科學證據。認為循證醫學是概率性的,是不精準的,終究要被精準醫學替代,這個說法是不現實的。歷史經驗顯示,百分之百有效只是概率有效的一種不常見的極端形式。

最後,精準醫學未必是最好的模式。公共衛生措施多強調共性和標準化,如對抗傳染病的排污、供水、消毒、隔離等措施,效果有目共睹,而且具有更高的公益性和公平性。其實,個性與共性,或特殊性與一般性,是一對矛盾的兩個方面。即使是個體干預,針對共性的方法往往也是最有效的,如抗生素和疫苗。當強調個性化治療的時候,往往是因為還沒有掌握事物的共性,沒有抓住根本矛盾,效果說不清楚,因此希望用靈活多變的方式來尋找解決問題的突破口。

三、大數據的統計精確性

不等於科學可信性

計算機和互聯網給數據的儲存、處理和分析帶來了前所未有的方便,大量常規收集的數據給科學研究帶來了極大的方便,大數據時代到來,為循證醫學產生證據提供了前所未有的新契機,也成了精準醫學賴以發展的重要途徑。之前,由於資源的限制,科學研究只能在一個有限的樣本里完成,當樣本量足夠大時,基於樣本的觀察就可以準確地推論總體。有人聲稱,基於大數據的研究,不再需要關心樣本,因為我們有了總體。直接研究總體似乎是大數據研究最突出的優勢。

然而,代表總體這個優勢只是一個虛妄的承諾。代表性僅僅是一個相對於樣本來源的有限總體的抽象概念,主要取決於抽樣方法。如果說總體是這個世界上所有有關個體的總和,那麼沒有一個資料庫可以代表這個總體。一個醫院的患者不能代表一個城市裡所有患者的總體,一個城市裡所有醫院的患者也不能代表這個國家裡所有患者的總體,一個國家裡所有的患者也不能代表全世界所有患者的總體,目前全世界的所有患者也不能代表時間長河裡這個世界上所有的患者。

因此,總體是相對的,也是有限的。繼而,所有資料庫的代表性也是相對的,有局限性的。因此,基於所謂總體的觀察結論也不能保證外推時必然不會失敗。另外,所謂代表性廣,經常的結果是導致嚴重的實踐錯誤。例如,如果一個藥物在一種患者5%的亞組中有效,最好的研究是那些只代表這5%亞組患者的樣本,而不是代表所有這類患者的樣本。把研究擴展到這5%以外的患者,看似拓寬了代表性,其後果是這個藥物將被錯誤地用於大量無效的人群,而且代表性越寬泛,這個錯誤的比例就越大,就背離精準醫學越遠。

其實,人類過去所有的研究和對總體的推論都是基於樣本的,也根本沒有必要基於總體。我們從來沒有通過觀察這個世界上所有的男女之後才能說出男女之間的差別;我們也不可能觀察到世界上所有的男女,因為我們無法觀察已經去世的人,也無法觀察還沒有出生的人。如果真的要等到觀察了總體里所有的人,我們只能永遠等下去,永遠都不會有結論。同理,我們也不會把世界上所有的茅台酒都喝了,才會知道茅台的滋味。對樣本的研究就夠了,而且我們也只能研究樣本。

有人說因為大數據涵蓋了總體,只關注關聯關係就夠了,不需要追究它是否存在真實的因果關係。對於醫學,這是一個更危險的信號。吸煙可以引起肺癌,抗高血壓藥物可以降低心血管病的風險,這是因為它們之間存在因果關係。因此,戒煙可以預防癌症,抗高血壓葯可以預防心血管病。然而,吸煙者常會攜帶火機,火機也會與肺癌有關聯,但一個人不會因為扔了火機就會預防癌症,因為它們之間不存在因果關係。

確立病因和疾病以及治療和效果之間的因果關係是醫學研究的重要內容,人類發展了一整套人群研究的理論和方法,目的在於控制偏倚和混雜,使發現的關聯關係更可能是真實的因果關係,使切斷原因可以防止結果發生成為可能。如果醫學防治措施是建立在一堆不知因果本質的關聯關係之上,則根本無法保證防治的效果。忽視關聯和因果關係的區別,就等於否定現今所有流行病學研究方法的發展和進步,包括觀察性研究中對混雜的控制以及隨機對照試驗里隨機分組和盲法的科學性。

樣本量大,只能降低隨機誤差,提高結果的精確性,不能彌補研究設計上的不足,不能降低系統誤差,不能提高結果的可信性。可信性和精確性就如同工具精密度與研究者人數的關係。隨機對照試驗就如同一台高倍精密的顯微鏡,觀察性研究就如同人的肉眼,顯微鏡看不到有細菌,肉眼也必定看不到,如果說肉眼看到了一定是假的,再多人說看到了也是假的。內部真實性是外推性的前提,認為只關注關聯就夠了,是對發展已久的現代醫學應用型研究理論和方法的漠視。

正是由於對樣本量的過於關注、對因果關係的漠視,以及對人群研究科學原理的認識不足,有人提出基於大數據的現實世界觀察性研究來評估療效,並認為以此就可以取代隨機對照試驗成為對療效的最終確認。然而,這樣的現實世界研究(無論是否基於大數據)與隨機對照試驗的根本區別不是樣本量,也不在於對PICOS(population,intervention,comparator,outcome,setting,即:人群、干預、對照干預、結局、干預環境)等因素的限制程度。如果真的需要,隨機對照試驗也完全可以擁有很大的樣本量,也可以在切合實際的PICOS組合下進行。二者的本質區別在於對偏倚和混雜的控制,也就是觀察和實驗的區別,是科學性高低的區別。換言之,隨機對照試驗結論的可信性遠遠高於現實世界研究。因此,從療效的重要性和研究結果的可信性上看,現實世界的觀察性研究終究不能取代實驗性的隨機對照試驗在確認療效中的根本作用。

除此之外,那些本來就只能通過觀察性研究來回答的醫學問題,大數據現實世界研究完全可以與特別組織的具體研究媲美,很多方面甚至遠遠優於後者。這些研究問題包括了干預效果以外的絕大部分與醫學實踐有關的問題,如疾病病因、診斷、疾病的轉歸和預後、慢性罕見副作用、甚至患病率和發病率(如果數據涵蓋了有限總體里的所有成員),以及醫學干預的經濟學評價等。

即使是關於療效,大數據在產生研究假設和初步探索效果上,也擁有巨大的潛力,也完全可以用來支持實效RCT(pragmatic RCT)的開展。在病因研究方面,大數據提供了無數前所未有的新的危險因素,大大拓寬了潛在危險因素的圖譜,進而擴大了可用的預防措施的範圍。對於醫療衛生管理,大數據則更是一個前所未有的機遇。值得注意的是,大數據中各種測量的準確度、精確度和完整性,以及同一因素測量方法在不同時期和不同機構的一致性,可能是目前限制利用這些數據的重要障礙之一。

最後,樣本量甚至研究質量都不是決定一項研究是否具有意義的關鍵,研究的意義首先取決於研究問題的意義。我們每個人每天都面對著海量的數據和信息,就像走進一個大森林,樹木本身並不能告訴你它們的用途,需要人提出問題。

四、結語

循證醫學既強調理也重視情,是現今最好的醫學決策模式。但是,很多藥物的平均有效率很低,如何找到那幾個為數不多的對治療有反應的患者,是整個現代醫學的難題。然而,科學突破需要時間和積累,且往往不是計劃攻關的結果,多發生在不經意的地方。顯微鏡的出現、歐洲產褥熱的控制、倫敦霍亂的控制、發現微生物可以致病、發現抗生素和疫苗等,都是如此,用了幾百年的時間,帶有很大的偶然性。

人類用了幾千年甚至更長的時間才攻克了傳染病,面對流行不到100年的慢性病,也許我們太急於解決問題了。精準醫學希望利用最新的醫學技術,最終把治療做得精準,但是並非指日可待。其實完全個體化的治療只是一個理論可能性,既往成功的精準防治(如疫苗)往往不是針對每一個人採取不同的措施,而是針對個體間的共性或基本矛盾採取的相同的措施。而且,影響健康的因素遠不止於醫療,我們群體健康的決定因素遠遠超出了基因和臨床照護,精準醫學不是唯一的出路。

大數據的確提供了醫學研究的新途徑,但認為可以研究總體並無需追究因果本質,則混淆了隨機誤差和偏倚,混淆了統計學顯著性和科學真實性,否定了人類幾百年來發展起來的醫學應用型(即流行病學)研究的原理和方法,是醫學研究的嚴重倒退。

然而,在科學領域,我們總應抱著開放的態度,因為科學的突破口很難預測。任何嘲笑別人的人都可能最終被嘲笑,任何希望預測未來的人都可能讓人大跌眼鏡。英國皇家協會前主席凱爾文曾預言,所有比空氣重的東西都不可能飛起來。愛因斯坦也曾說,沒有任何輕微的跡象表明人類會俘獲核能。100多年前,又有誰敢肯定塞麥爾維斯對產褥熱的調查和控制會開啟人類有效應對傳染病的大門。科學總會在不經意的地方爆出驚喜,本文謹希望以批評的方式激發起精準醫學和大數據研究蘊藏的真正潛力

志謝: 靳光付、李曉松、毛琛、王波、王束玫、楊祖耀閱讀了早期的稿件並提出了寶貴意見,馮琦協助整理了參考文獻 。

利益衝突: 無。

內容來源:唐金陵, 李立明. 關於循證醫學、精準醫學和大數據研究的幾點看法[J]. 中華流行病學雜誌, 2018, 39(1): 1-7

(想要及時獲得更多內容可關注「醫咖會」微信公眾號:傳播研究進展,探討臨床研究設計與醫學統計學方法)


推薦閱讀:

腫瘤精準醫學的「先鋒」——靶向藥物
美國「精準醫學」治療癌症效果顯著
心血管疾病的藥物精準醫學
尤永平教授:基於基因組學測序技術的精準醫學--腦膠質瘤的未來診療模式|【中華神外】2016年第五期「...

TAG:循證醫學 | 精準醫學 | 大數據時代 |