【循證醫學】你在醫院接受的治療有可能無效?

DAVID EPSTEIN

閱讀本文的微信版

首先,請聽一個喜劇結尾的故事:主人公是一位公司高管,今年61歲的他身體非常健康,除了血壓略高之外其他一切都好,並且還堅持鍛煉身體。但是接下來發生的一件事卻嚇到了他:在一個寒冷的冬日,他像往常一樣飯後散步,忽然一陣胸痛襲來,他急忙回到辦公室坐下,而胸痛又在轉瞬之間消失了。

那天夜裡,他想了很多:中年男子,高血壓,工作壓力大,胸部不適。第二天,他去了當地的急診室。醫生告訴他,他並沒有出現心梗,心電圖也完全正常。一切徵象都顯示他患有穩定型心絞痛——血氧供應不足引起心肌缺血導致胸痛,這種情況通常是動脈部分阻塞所致。

心內科醫生建議他立即做一個冠脈造影:將導管經動脈送到心臟,接著注射可以在X線下顯影的造影劑,以此尋找梗阻的位置。醫生建議,如果檢查發現梗阻,就需要給他上支架,即把一個金屬管子滑到冠狀動脈裡面撐開血管。

在急診室等待的時候,他掏出手機搜索「冠心病的治療」。他立即發現醫學期刊上說,一線治療方案應首選阿司匹林和降壓藥。出於慎重考慮,他向醫生反映了自己搜索到的內容,而醫生則顯得不置可否,讓他再「多做些功課」。沒有得到滿意的答覆,他便拒絕接受冠脈造影檢查,轉而去看了家庭醫生。

家庭醫生向他推薦了另一種動脈造影術,這種造影不需要使用導管而是使用多重X射線顯影。檢查顯示一支冠狀動脈已經部分阻塞,儘管心臟目前能夠正常泵血,但是通過該檢查無法判斷梗阻是否會引發更嚴重的後果。因此,家庭醫生同樣建議他做一個冠脈造影術,也許之後再植入支架。隨後,他預約了心臟科醫生做冠脈造影,但是當他嘗試在檢查前直接聯繫醫生的時候,卻被告知醫生在那之前沒空。當他看見聖路易斯華盛頓大學醫學院的大衛L.布朗(David L. Brown)教授時,他說自己被先前的醫生們說得倍感壓力,想要更多的信息。他表示在接受植入支架之前,自己願意嘗試所有非侵入性治療——嚴格規範飲食,哪怕辭掉緊張的工作。

這位高管能夠想到要獲取更多的信息已經證明他很聰明,同時,找到布朗醫生則證明他運氣非常好。布朗是RightCare聯盟的一員,RightCare是一個介於專業醫療保健機構和社區醫療服務之間的聯盟,聯盟旨在扭轉一種趨勢:醫療費用的提高並沒有帶來更好的醫療服務。布朗提出,RightCare正在「努力恢復醫療系統的平衡,使得每一位病患都能得到應有的救治,而不過度治療」。冠脈支架就是過度治療的典型例證。2012年,布朗與他人合著了一篇論文,該論文審查了每一個比較植入支架與保守治療的隨機臨床試驗。布朗發現穩定型心絞痛患者植入支架沒有對未來心梗的出現起到預防作用,對延長患者壽命也完全沒有幫助。布朗總結道,沒有心臟病發作的人不需要植入支架。(布朗還說,對於一些患者,支架可能會緩解部分患者的胸痛癥狀。)儘管如此,每年有成百上千名穩定型心絞痛患者接受支架治療,其中,五十分之一的患者在接受治療過程中會出現嚴重併發症,甚至死亡。

布朗向這位高管解釋道,他的冠脈阻塞情況影射的是潛在的全身系統的疾病,而單純的修復一條阻塞的血管並不會對整體情況的改善有任何幫助。人類的心血管系統可比廚房的水槽要複雜多了。聽從醫囑,他開始服用藥物並且改善飲食。三個月後,他的膽固醇水平明顯改善了,並且成功減掉了15磅,而胸痛則再也沒有出現過。

為什麼已經被研究證明無效或禁忌的治療方法卻被如此廣泛使用?

現在,請聽一個悲劇結尾的故事:在幫助那位公司高管後不久,布朗和他的同事們會診了一位來自密蘇里州小鎮的患者。他今年51歲,已經從霍奇金淋巴瘤成功康復,但是他的肺部由於放療和六個周期的化療而逐漸布滿瘢痕組織。 他正在自己的身體里窒息而死。 該名男子被轉移到布朗工作的巴恩斯猶太醫院接受肺移植。 但當男子抵達聖路易斯時,移植小組發現沒有辦法給他做手術。

四個月前,該患者因為呼吸困難到另一家醫院就診。在醫院裡,儘管他的病史現實接受過會引起瘢痕形成的淋巴瘤相關治療,接診的心臟科醫生依舊考慮他的呼吸困難可能是由於冠脈堵塞造成的。和當時給高管提供的意見一樣,醫生建議他做一個冠脈造影。但是,和那位高管不同的是,這位患者像多數病人一樣服從了醫囑,接受了檢查。結果顯示有一支冠狀動脈部分阻塞。因此,在沒有證據支持呼吸困難是由冠脈阻塞造成的情況下,醫生依舊給他裝了支架。實際上,患者的呼吸困難是由於肺部瘢痕組織引起的。 隨後,根據標準手術流程,這位患者開始服用抗凝葯,確保放置支架的地方不會形成血栓。但是那些抗凝葯會對手術帶來致命影響,即大幅增加移植手術過程中出血致死的風險。手術因此必須推遲進行。

與此同時,他的肺間質逐漸布滿瘢痕,就像流動的熔岩逐漸冷卻,最終硬化變成一塊毫無生氣的石頭。他成功地從晚期淋巴瘤中倖存下來,但到頭來卻被困在醫院——等待,到死都在等待停掉那為了完全沒有必要的支架而不得不服用的抗凝葯。

上面的故事中,兩位主人公的共同點是都不需要植入支架。在探索精神和一部智能手機的幫助下,其中一個人倖存下來。然而,更值得關注的是:為什麼已經被研究證明無效或禁忌的治療方法卻被如此廣泛使用?

當你去看醫生,你可能認為你接受的治療是循證支持的。當然了,如果你吃的葯,做的手術都無效的話就不會被如此普遍地使用了,不是嗎?

眾所周知,現代醫學取得了許多令人驚嘆的成就——先進的成像技術使得精密手術、常規器官移植變得可能,成熟的護理方法使得早產兒能夠健康成長,當然還有療效顯著的化療手段。患者接受已經被研究證明無效甚至危險的治療方案也已不足為奇。有時候,醫生就是沒有跟上科學的腳步。而另外一些時候呢,醫生明知道患者無需接受治療卻依舊為患者提供治療——僅僅為了錢,或者甚至只是因為患者慕名而來,主動要求醫生治療。一些治療方法是否真的有效還未得到證實就已經在臨床實踐了。還有些療法,最初得到證據支持,然後被更完善的研究證據推翻,卻依然作為醫療標準維持數年或數十年。

即使你服用的藥物在數以千計的患者身上被證明有效,也未必會對你有效。好消息是,它至少不會有害。一些最常見的藥物對於大多數服用它們的患者來說其實無益無害。

在科學毋庸置疑地證明某些主流醫學實踐無效之後,醫學界大概需要十年時間才會停止參考這些實踐標準。

2013年,十幾位來自全美各州的醫生進行了一項研究,他們重新審查了過去十年里(2001-2010年)刊登在《新英格蘭醫學雜誌》(New England Journal of Medicine, 以下簡稱NEJM)上的所有檢驗現行臨床實踐的文章,共363篇。從使用抗生素治療萊姆病(無效)到使用膠原海綿預防結直腸術後感染(引發更多感染)。《梅奧診所學報》(Mayo Clinic Proceedings)刊登了這項研究結果:146篇文獻顯示現行臨床實踐標準要麼完全無益,要麼甚至不如它取代的既往臨床實踐標準;138篇文獻支持現行臨床實踐;其餘79篇則無法給出確定信息。(事實上,作者的結論引起了許多不滿。)一些頗有爭議的臨床實踐可能影響著數百萬人的日常生活:糖尿病患者使用強效降壓藥物組合將血壓控制在較低水平被證明弊大於利,這種治療方法與使用常規降壓藥,將血壓維持在略高水平相比較,對預防心臟病發作或死亡無任何優勢。其他一些不太常見的臨床實踐(例如採用基因檢測手段確定一種常用的抗凝葯是否適用於某一患者)遇到的證明無效的證據儘管越來越多,在臨床上卻越來越受歡迎。這裡舉幾個違反我們直覺的例子:做心肺復甦的時候,聯合口對口呼吸並不比單獨胸部按壓更有效(急救指南里心肺復甦是口對口呼吸加上胸部按壓,每十五次按壓,呼吸兩次);醫生往往囑咐乳腺癌倖存者不要用水腫的胳膊負重,實際上,適當負重有助於水腫的緩解。

2012年,澳大利亞政府衛生與老齡化部進行了一項與上文類似的研究,旨在減少不必要的醫療措施。該研究回顧了過去十年的臨床實踐文獻,並從中揀出156例或不安全或無效的案例。不止如此,一個最新的回顧報告調查了48項不同的研究,涉及到13000名臨床醫生,觀察醫生如何看待疾病篩查。調查發現他們傾向於低估篩查存在的危害和高估可能帶來的收益; 《美國家庭醫生》(American Family Physician)的一篇社論提到,最近這些研究的一大特點就是它們與傳統醫療觀點在很大程度上相悖。

近期內,這種狀況不太可能改變。《21世紀治癒法案》(The 21st Century Cures Act)是罕見的兩黨法案,它由超過1400名遊說者推動,並於12月份簽署生效。這一法案降低了藥物的新用途、醫療器械營銷與批准的證明標準。此外,就在上個月,特朗普總統譴責了美國食品與藥品管理局(Food and Drug Administration, FDA)拒絕向臨終患者提供藥物的做法。他承諾削減FDA當前的規範數量:「我們要大刀闊斧的減……減80%也有可能。」為此,FDA局長熱門候選人之一、技術投資者吉姆·奧尼爾(Jim O』Neill)公開提議,藥物在顯示出效果前應當被批准。奧尼爾認為,「就讓人們自己承擔用藥的風險吧。」

所以,儘管美國人可以期待更多的藥物和設備迅速得到使用,但也應該預期到基於薄弱證據的治療所帶來的問題將加劇。在最近的一項統計資料中,兩名約翰·霍普金斯大學的醫生研究人員指出,新的《21世紀治癒法案》將使「FDA批准」變得遠不如從前可靠。1962年,國會提升了藥物批准的證據標準。這一舉措之前,有成千上萬的嬰兒伴隨著四肢畸形出生,他們的母親均在孕期服用過睡眠輔助藥物「反應停」。已退役的海軍少將史蒂文·加爾森(Steven Galson)曾在喬治·W·布希和巴拉克·奧巴馬兩任總統治下擔任美國衛生總署代理署長,他說1962年建立的加強審批程序是FDA對「健康最大的貢獻」。在此之前,「許多上市藥物並沒有標籤所示的效果。」

在創新與監管之間取得適當的平衡極其困難。但是藥物一經使用,即使面對相反的證據,它們也會繼續存在。2007年,以揭露低質量醫學科學研究而成名的斯坦福大學醫學研究員,統計學家約翰·約安尼季斯(John Ioannidis)在一項發表於《美國醫學協會雜誌》(Journal of the American Medical Association)的研究中提到,在科學毋庸置疑地證明某些主流醫學實踐無效之後,醫學界大概需要十年時間才會停止參考這些實踐標準。

美國腫瘤學家、《梅奧診所學報》的論文作者之一瓦內·普拉薩德(Vinay Prasad)指出,醫學界會很快採納證據不足的醫療實踐,但是當有力的證據粉碎之前的結果時,摒棄它們的過程則會變得緩慢。作為一名青年醫生,他的一次經歷讓他決心消滅無效的治療措施。那時,他還是一名住院醫師,其所在的團隊需要照顧一位患有穩定胸痛的女性患者。這位患者接受了支架手術,術中並發腦梗,導致了腦損傷。目前在俄勒岡健康與科學大學的普拉薩德在談及此事時,仍然心有餘悸。芝加哥大學的教授,亞當·西弗(Adam Cifu)醫生有著類似的經歷。西弗花了幾年時間說服新近絕經的患者為了心臟健康進行激素治療,在2000年左右每年就有9000多萬份該處方。結果一個精心設計的實驗表明,該療法對心臟並無益處,甚至有可能損害心臟。他說:「我不得不向那些患者撤回之前的所有決定。但是當你的患者說『我覺得你說得沒錯』,事情就真的棘手了。」西弗和普拉薩德在2015年合著了一本書:《終結醫療反轉》(Ending Medical Reversal),他們呼籲提升採納新醫學標準的證據門檻。在談及重複初步科研成果的過程以確保其可靠性時,普拉薩德表示:「我們的文化鼓勵新發現,其可重複性卻被拋諸腦後。」

克利夫蘭診所的心血管內科主任史蒂文·尼森(Steven Nissen)指出,至少支架濫用的情形有所改善。作為美國心臟病學會(ACC)的前任主席,他幫助建立了確定病情穩定患者接受支架植入的指南。(梅奧診所的心臟病專家戴維·霍爾姆斯(David Holmes)同樣是前ACC主席,他和尼森指出,服藥出現不良反應以及嚴重影響生活質量的持續胸痛的案例中,即使癥狀的短期減緩也會證明支架的作用。)多虧了這些指南,不必要的支架植入的出現頻率在2010年至2014年顯著降低。儘管如此,在一項針對全美1600多家醫院的最新評估中,有半數病情穩定的患者接受的支架植入,要麼不是很有必要,要麼乾脆完全沒有必要。「情形雖然有所改善,但還有進步的空間。」尼森認為,消除財務刺激也可以幫助改變行為。「我們這裡十幾位心臟內科醫生,他們做不做支架手術都領同樣的薪水。我認為這發揮了作用,並將不必要的治療措施維持在很低的水平。」

兩年前,三位彭博社的記者報道稱,紐約市西奈山醫院計劃通過「預約急診」的形式為患者提供支架手術,因為保險更有可能報銷急診手術的費用。(對於心臟病發作的患者來說,支架能夠救命。)西奈山醫院的導管室每年都會發布報告,吹噓醫院進行了多少例支架植入,以及附上患者的感激之詞,在報告中有一位77歲的患者奈利·羅德里格斯(Nelly Rodriguez)這樣寫道:「(我的醫生)安撫我說,只要我聽醫生的話,好好吃飯,不抽煙,我血管里的那些支架就會老老實實的,我也會健健康康的。」絕大多數案例中,即便把「不抽煙」和「健健康康的」中間那部分全部剔除,這句話也依然正確。

人體更像是聖經中的《約伯記》,而非家庭里的水管:人們並沒有發明它,它非常複雜,而人們對健康的因果關係普遍知之甚少。

當然,付薪水讓任何行業的人做錯事時,再讓他們作出正確的舉動就很難了。這背後的原因不僅僅是市場反常。在聖路易斯一個下雪的清晨,布朗在巴恩斯猶太醫院向大約80位醫生髮表了關於大查房的演講。演講伊始,他展示了接受他治療的那位公司高管的治療結果。接著,他出示了幾千位患者的數據,這些數據來源於隨機對照支架植入手術和非侵入性治療。數據表明,支架對病情穩定的患者沒有益處。布朗詢問在場的醫生是否仍然會把同那位高管相同診斷結果的患者送去接受心臟導管手術,繼而上支架。至少有一半的醫生表示仍會繼續,其中有些人還有些不好意思。布朗對在場各位的誠實回應表示很驚訝。一位與會者告訴他,「好吧,我們明白自己在幹什麼。」但,這是為什麼呢?

2007年,COURAGE臨床試驗表明,支架並沒有預防病情穩定的患者突發心臟病或死亡。在這項開創性的研究之後,加州大學舊金山分校的3位醫生協同幾位心內科醫生組織了一場90分鐘的專題小組討論來回答這一問題。他們虛構了一位患者,該患者至少有一條冠狀動脈狹窄,但是他沒有相關癥狀,接下來詢問在場醫生,是否會給他推薦做支架手術。幾乎每一位心內科醫生,其中包括收入不與檢查和操作掛鉤的醫生,都給出了相同的答案:他們清楚數據不支持手術介入,但仍會建議患者進行支架植入。各個小組主要圍繞以下四個主題來合理化他們的臨床行為:

(1)心內科醫生們回顧了暴斃患者的病情,這其中包括公眾皆知的慢跑王吉姆·菲克斯(Jim Fixx)的案例,他們擔心如果患者不做支架手術繼而病逝,自己將後悔不已。這項研究的作者總結稱,心內科醫生受到了「可得性啟發」的影響。「可得性啟發」是諾貝爾獎得主、心理學家阿莫斯·特維斯基(Amos Tversky)和丹尼爾·卡尼曼(Daniel Kahneman)創造的術語,指人類在本能上傾向於通過容易回憶的、顯著的例子作出決策,即使這個例子無關緊要,抑或極其罕見。

(2)心內科醫生相信支架可以緩解患者的焦慮。

(3)醫生認為,如果患者接受了支架然後病逝,那麼他們可以在官司中得到更好地辯護。其中一位醫生說道:「在加州,如果患者在兩年內出事了,(沒有進行醫療干預的)醫生會被成功起訴。」

(4)還有一個更普遍存在的問題:儘管有數據支持,心內科醫生仍無法想像支架並沒有起到效果:堵了就放支架,理所當然。

20世紀80年代末,有證據表明,與非侵入性治療相比,強行撐開血管的效果更差,而且更加危險。心內科醫生埃里克·托普(Eric Topol)為此提出「目視狹窄反射」(oculostenotic reflex)的說法,Oculo在拉丁語中是「眼睛」的意思,而stenotic則在希臘語中表「狹窄」,意同「狹窄的動脈」。其含義是:如果你看到阻塞,便會反射式地清理阻塞。托普描述道,「對於一些主張侵入性治療的心內科醫生而言,支架似乎是不可抗拒的誘惑。只要他們看到狹窄的動脈,便不假思索地將支架植入患者體內。數千名患者的隨機試驗證據則被忽視。」科學家稱支架植入為「生物贊同」(bio-plausible),即直覺認為它應該起作用。人體更像是聖經中的《約伯記》,而非家庭里的水管:人們並沒有發明它,它非常複雜,而人們對健康的因果關係普遍知之甚少。

很有可能,你或你的家人已經接受了看似「生物贊同」實則無效的醫療措施。

根據美國疾控中心的數據,約三分之一的美國成年人患有高血壓。血壓用來衡量血液在流動時對血管壁的壓力。血壓越高,你的心臟承擔的壓力就越大。高血壓的人罹患心臟病(在全國排第一位的健康殺手)和中風(位列第三)的風險將大大增加。

因此,不難理解詹姆斯·布萊克爵士(Sir James Black)在上世紀60年代因發現β-受體阻滯劑而獲得諾貝爾獎。β-受體阻滯劑能夠減慢心率,並降低血壓。諾貝爾委員會褒獎道:「(該發現)是自200年前發現洋地黃以來,心臟病藥物領域的最大突破。」阿替洛爾表現出顯著的降血壓作用之後,於1981年獲得FDA的批准,成為第一例獲批的β-受體阻滯劑。阿替洛爾開始成為標準的治療藥物,以及作為同其他血壓藥物比較的對照藥物。

1997年,一家瑞典醫院對9000餘名高血壓患者進行了隨機對照試驗,對照組使用阿替洛爾,試驗組則使用阿替洛爾競爭對手的降壓藥(該藥物設計初衷是穩定降壓持續至少四年)。與對照組相比,試驗組的死亡率(204:234)和中風率(232:309)均更低。但該研究還發現,兩種葯降下去的血壓值完全一樣,那麼為什麼廣受追捧的阿替洛爾沒有挽救更多人?這個不同尋常的結果促成了隨後的研究。通過比較阿替洛爾和糖丸發現,阿替洛爾並未預防心臟病發作,也沒有延長生命,它只是降低了血壓。2004年的一項臨床試驗通過分析針對24000名患者的8個隨機對照試驗得出結論:與不使用任何治療手段相比,阿替洛爾並不能減少心臟病發作,也不能阻止死亡;服用阿替洛爾的患者在臨終前的血壓值僅僅是看著健康而已。

路易斯維爾的心臟電生理專家約翰·曼德羅拉(John Mandrola)積極倡導健康的生活方式,他表示:「沒錯,我們能夠改變一兩個血壓值,但這不意味著患者真的受益了。當患者服用了藥物後看到血壓變了,就會認為自己的健康狀況得到了改善。在這樣的情形下,再讓患者改善生活方式就很難了。」

β-受體阻滯劑的整體情況很複雜。例如,一些β-受體阻滯劑能夠明顯降低心力衰竭患者中風和心臟病發作的風險。但是由Cochrane Collaboration(獨立國際研究組織,他們試圖綜合最佳可行研究)發表的一篇關於β-受體阻滯劑的最新綜述卻稱,「在與安慰劑對比後,不推薦將β-受體阻滯劑作為治療高血壓的一線藥物,因為其對中風的預防作用很小,而且也不能明顯降低死亡率和冠心病的發作率。」

研究人員們在《柳葉刀》雜誌上撰文質疑將阿替洛爾作為藥物的比較標準,並補充道,「與其他療法相比,接受阿替洛爾治療的患者出現中風的案例更多。」即便如此,一項發表在《美國醫學協會雜誌》的2012年的研究指出,目前為止,已經開具了3380多萬份阿替洛爾處方葯,其零售費用總計超過2.6億美元。是有一些證據表明,阿替洛爾可能會降低年輕患者中風的風險,但同時也有證據表明它會增加老年患者中風的風險,而該葯的主要消費群體則正是這些老年人。

根據ProPublica的醫療保險處方資料庫,阿替洛爾在2014年被列為260萬多位醫保受益人的處方,在3362例處方葯當中排名第31位。加州威斯敏斯特的家庭醫生黃征(Chinh Huynh,音譯),在2014年為65歲以上的患者開具了1100份阿替洛爾處方,因此成為全美最高產的處方醫師。就此事聯繫他的時候,他回復:「阿替洛爾是常見的高血壓葯,不是只有我在開這葯。」當被問及隨機對照試驗已經表明阿替洛爾無效,而他怎麼還繼續頻繁地開處方時,他說:「我讀了很多醫學雜誌,但我並沒有看到這些試驗。」

他補充道「這葯我的病人用著都挺好的」,並且請記者把相關文獻傳真給他。

華盛頓大學的心內科醫生布朗認為,醫生們一旦完成住院醫訓練,「這就變成一份工作了,醫生就會顧著掙錢,不太關注這一領域的發展。所以說,真正重大的改變必須是可以世代相繼的。」

一家專門為醫療業提供信息和技術服務的公司QuintilesIMS彙集的數據顯示,阿替洛爾的處方在過去的五年里平均每年下降了三百萬。按照這個速度,阿替洛爾在20年內便會停止銷售,因為高質量的臨床試驗已經表明它完全無效。

就像心血管系統並不是一個簡單的廚房水池,肌肉骨骼系統也不是一個模型玩具。事物的因果關係並不總是一目了然。

就拿膝蓋來說,它是所有關節中最讓人頭疼的。有一種治療方法叫做經關節鏡半月板部分切除術(arthroscopic partial meniscectomy,以下簡稱APM),每年累積進行大約五十萬次,總消費大約40億美金。半月板是一種給膝蓋提供保護和穩定作用的半月形的纖維軟骨,會隨著年齡的增長老化撕裂,而並非由急性創傷引起。APM通過清理破碎的半月板碎片並把軟骨削回半月狀來緩解半月板撕裂造成的疼痛。這可不是什麼非主流手術,這是近幾年來北半球最常見的手術之一。然而越來越多的證據表明APM對常見的關節疼痛並沒有作用。

這就像是膝關節版的目視狹窄反射:患者因為膝蓋痛看醫生,做了MRI顯示半月板撕裂,很自然地,患者想讓醫生修復它,外科醫生看到撕裂的半月板也想動刀子,然後送去做物理治療。患者的膝蓋痛確實好轉了,但不一定是因為手術。

為什麼即使當最有力的證據否定了一項常見的手術,還是無法帶來什麼改變呢?

一項2013年在美國七家醫院的45位患者中進行的研究顯示,物理療法加上APM 手術和單獨的物理療法的作用相同。另一項在兩家公立醫院和兩家物理療法診所進行的研究也發現了相同的結果。

一項在芬蘭五家骨科診所進行的研究對APM手術和「假手術」進行了比較。在這項研究中,醫生把關節疼痛患者帶進手術室,給他們開刀,假裝進行修復手術,然後縫合傷口。患者和他們的醫生都不知道哪些患者接受了真正的手術。一年之後,兩個實驗組的患者沒有任何區別,接受了假手術的患者和真手術的患者狀態一樣好。只有一點——長遠來看,真手術會增加膝關節炎的風險。同時,APM手術雖然安全,但是非常昂貴,而且手術加上物理療法比單獨物理療法有著更高的副作用風險。

50歲以上的成年人如果去做膝關節MRI,其中至少有三分之一的人的結果會顯示有不同程度半月板撕裂。這其中三分之二的人永遠都不會出現任何癥狀。(那些說自己膝蓋痛的有可能是因為膝關節炎引起的癥狀,而不是半月板撕裂。)如果不做MRI,他們永遠不會知道自己半月板有撕裂;但是一旦做了MRI,他們很可能會去為一個自己沒有的問題做一個沒有用的手術。

有安慰劑對照的臨床手術試驗無疑很難實踐。那麼問題來了:為什麼即使當最有力的證據否定了一項常見的手術,還是無法帶來什麼改變呢?

其中一個原因是,這些研究並沒有證明這項手術是無用的,它們只是在一大群不太可能會從這項手術中受益的人身上進行。就像我們人類一樣,半月板撕裂的分型分度也是種類繁多,即使是大數據研究也無法涵括所有的差異。有非常令人信服的證據顯示手術在一部分患者身上是有作用的。「我認為對於那些伴有持續劇痛和行動障礙,但是並非由關節炎引起疼痛的患者來說,這個手術極其有效。」匹茨堡著名的骨外科醫生約翰·克里斯多夫拉蒂(John Christoforetti)說到,「但對於那些普遍缺乏運動的美國人來說,他們的問題是慢性關節疼痛,並沒有伴隨關節活動障礙。他們大多數人的MRI都顯示有不同程度半月板撕裂,而手術不應該作為他們的首選治療手段。」

儘管如此,這項適應症本來很少的手術還是常常被濫用。而病人自己對此也有責任。根據外科醫生的經驗,很多病人會主動提出,甚至要求醫生給自己做這項手術。如果被拒絕他們就會去其他診所,直到遇到同意給他做手術的醫生。克里斯多夫拉蒂回憶說他遇到過一個長途跋涉專門來他這裡看病,但是「完全不適合做這項手術」的患者。儘管昂貴的手術費對他來說很誘人,他還是如實告訴患者及其丈夫這項手術對她來說並沒有效果。「她走的時候面帶微笑,」 克里斯多夫拉蒂說,「但是就在他們登記離開時,我的手機上收到了一條提示:她的丈夫在網站上給了我們差評,並留言說我是個非常不近人情的醫生,他連他的狗都不會送到我這裡來做手術。他們在網上看了一些資料,並且堅信自己需要這個手術而且我就是應該給她做這個手術的人。」

那麼外科醫生都怎麼做呢?「大部分同行都會說『給自己省點心,他們要做就給他們做唄。即使你給病人做了手術我們也不會鄙視你。你的銀行賬戶更不會不高興,所以就給他們做這個手術吧。』」 克里斯多夫拉蒂說。

隨機安慰劑對照試驗是循證醫學的金標準,但並非所有的RCT(Randomized clinical trials)都是平等的。即使在這個金標準下,出於好意的試驗操作有時也會混淆研究結果,目前研究癌症藥物效果而廣泛使用的「交叉試驗」尤其如此。

在癌症研究中,交叉試驗指的是如果一開始對照組中接受安慰劑治療的患者在試驗的過程中病情惡化,他們會被給予試驗藥物。因此,他們不再是真正的對照組。交叉試驗的好處是允許更多的重症患者得到試驗藥物; 缺點是這樣的研究可能會掩蓋被檢藥物的實際功效。

2010年,基於一項交叉試驗的結果,普羅文奇(Provenge)成為FDA批准的第一批癌症疫苗。癌症疫苗是免疫治療的一種形式,通過藥物刺激患者自身的免疫系統去攻擊癌細胞。眾所周知轉移癌的治療非常困難,而陸續開發過的其他癌症疫苗也是屢屢失敗,因此當FDA通過普羅文奇的時候,人們抱著極大的希望和熱情。一份科學論文把它譽為「帶我們步入新世界的大門」。然而,普羅文奇根本沒有阻止腫瘤生長,也很難知道它是否真的有效。

普羅文奇的批准基於「IMPACT研究」——一項最初為了檢查普羅文奇是否能抑制前列腺癌惡化的隨機安慰劑對照試驗。結果表明它並不能。在實驗的第三個半月,接受了普羅文奇的患者和接受安慰劑的患者的癌症進展程度相似。儘管如此,接受了普羅文奇的患者的中位存活時間比使用安慰劑患者的多四個月。然而,根據IMPACT試驗的研究方式,很難判斷普羅文奇是否真的能延長患者的生命。

由於普羅文奇沒有阻止腫瘤生長,許多一開始接受普羅文奇的患者後來也服用了多西他賽——一種治療晚期前列腺癌的化療藥物。另一方面,安慰劑組患者的癌症也在惡化,於是在延誤了治療時機之後,研究人員對這些患者進行了「交叉試驗」——提供給他們普羅文奇。他們的癌症仍在繼續惡化,再一次延誤治療之後,他們中的許多人也開始服用多西他賽。最終,安慰劑組服用了多西他賽的患者比普羅文奇組的要少一些,使用時間也要遲一些。這麼說來普羅文奇可能有效,但是誰都無法給出肯定的答案,我們不知道試驗組患者相對較長的存活時間是因為他們服用普羅文奇早一些,還是因為對照組服用多西他賽的時間遲一些。

普羅文奇獲得批准後的一年,聯邦政府的醫療保健研究和質量機構(Agency for Healthcare Research and Quality,以下簡稱AHRQ)發布了一份「技術評估」報告,其中提供了有關普羅文奇功效的所有證據。報告指出,有「適度」證據表明,普羅文奇有效,但同時也指出在這開創性臨床試驗初期獲得普羅文奇的許多患者也更早接受了化療,同時接受了更多的化療。該報告的結論是,普羅文奇「只有在患者同時接受大量化療的情況下」才有效。換句話說,目前尚不清楚試驗中哪種作用該歸功於普羅文奇,哪些又屬於化療。

「選擇服用多西他賽的人是由於他們的疾病當時在急劇惡化,所以其實試驗的隨機性已經被打破了。」AHRQ技術評估計劃主任愛麗絲·柏林納(Elise Berliner)說。倡導更高標準的預批准證據的腫瘤學家普拉薩德更不客氣:「就算試驗品是辣條,你也會得到類似的效果——你先給其中一組患者辣條,等他們的癌症惡化時再給他們真正的藥物。「

其實更深刻的問題並不是普羅文奇本身,而是他們獲得FDA批准的方式。FDA許可通過的很多治療方案,實際上基於並不能證明它們真正有效的臨床試驗。 「這是臨床試驗普遍存在的問題,」柏林納說,「藥物一旦被批准就很難再進行隨機對照試驗。」根據《美國醫學協會腫瘤學雜誌》(Journal of the American Medical Association Oncology)的一篇新文章,即使癌症藥物在試驗中有顯著效果,它們在現實應用中也往往無效或者效果甚微。也許因為試驗中的被試無法代表普通患者。柏林納希望擴大和改進以大量真實病人作為額外信息來源的註冊登記冊。她說:「我已經在這裡做這些報告做了十五年,現在這種情況讓我越來越沮喪了。」

理想情況下,表明一項治療方案有效的數據和表明其無效的數據受到的關注度應該和它們的科學嚴謹程度相關,在最早的探索階段也應如此。但是學術期刊,科學家和媒體都傾向於那些奪人眼球,宣稱找到了新的有效治療方案的研究。

2012年,來自加州大學洛杉磯分校的一組科學家在全世界被引用次數最多的期刊——NEJM上面發表了一篇文章。該研究顯示,通過對帕金森患者大腦中植入的電極進行腦深部刺激,可以顯著提高他們的空間記憶力。這份研究僅包含了7位被試,顯而易見樣本數很小,畢竟大腦裡面已經植入電極的人也就那麼多。《紐約時報》、《華爾街日報》以及生命科學網(LiveScience)分別以「研究探索使用電擊刺激改善記憶」、「顛覆記憶力的大腦研究」、「我的車停哪兒了——腦部治療有望增強空間記憶力」為題報道了這份研究。NEJM同期刊登了一篇社論,提到「這是一份基於小樣本,尚且需要重複驗證的初步研究,」不過值得注意的是,文中緊接著點到「看得出該研究經過精心設計。」

考慮到該研究可能造成的影響,來自哥倫比亞大學的生物醫學工程學教授,喬舒亞·雅各布(Joshua Jacobs)帶領了一隻國際化團隊嘗試使用大樣本複製原始研究結果。雅克布教授提到:「如果真的起作用了,這將成為幫助大家的重要工具。」為了保證統計結果更加可靠,該團隊用數年時間測試了49位被試。然而結果卻令這些科學家目瞪口呆:他們的研究顯示腦深部刺激實際上損害了空間記憶力。結果自然令人失望,然而他們也受到了鼓舞,因為他們發現腦深部刺激會在某種程度上影響記憶力,這個發現離搞明白如何使用該技術更近了一步,於是他們認為有必要將研究結果提交給NEJM。科學本該如此,眾所周知的是,陰性結果不能被順利發表就是誤導信息存在的主要原因之一。

一個不靠譜的科研發現越少受到公眾質疑,那它就越有可能化為深入人心的常識。

複製研究結果在去年成為科學界的香餑餑,究其原因,是大家日漸認識到其實絕大多數知名度很高的科研結果都未能被科學家們成功複製。十年前,斯坦福大學的約安尼季斯發表了一篇文章,警告科學界「大部分已發表的研究都是錯誤的」(2012年,他參與合著了一篇文章,其中提到你冰箱里幾乎所有的東西都已被科學證實同時能防癌及致癌。當然除了培根,毋庸置疑,它只會致癌。)約安尼季斯的先見之明使他的文章陸續被其他科研文獻引用,僅在2016年就達800多次。這裡想說的就是當前科學界對重複實驗結果存在的問題史無前例的敏感,因此,當雅各布和該研究的其他共同作者得知NEJM拒絕刊登他們成果的第一反應是困惑。

一位拒絕發表該文章的同行評審員(同行評審都是匿名進行)留下的反饋意見提到:「這篇文章要是說找到了一組能夠增強記憶的電刺激數據就有趣多了。」 換言之:這篇文章如果像原始研究一樣,報道的是陽性而不是陰性結果就好了。(去年春天,獨立媒體ProPublica對NEJM這種不願發表對之前研究結果產生質疑的文章的行為進行了猛烈抨擊。)另外一位同行評審員提到重複實驗中絕大多數被試腦部放置的電極位置和原始實驗不同。於是雅各布和其他作者又重新分析了那些腦部電極位置與原實驗完全一致的被試數據,然而這並沒有改變實驗結果。其中三位作者回信給NEJM,指出評審員回復中的錯誤,他們收到一個簡短的回信,提到拒絕發表該文章「並不是基於你們回信中提到的那位評審員的意見」,而是雜誌收到的文章太多了,已經超出他們發表文章的上限。這是大實話,特別是對這種影響力巨大的雜誌而言。不過在神經科學領域頗具影響力的雜誌《神經元》(Neuron)很快接受了他們的研究成果並在2017年1月予以發表。(相比原始研究,雅各布的科研成果並沒有引起太多關注,或者說完全沒有得到關注,僅《華爾街日報》一家媒體進行了報道。)

文章刊登在《神經元》的同一周,哥倫比亞大學組織了為期一天的討論會,主題為重複科研結果存在的問題。美國國家科學院主席和美國研究誠實辦公室主任分別發表了演講,NEJM的主編傑佛利·德拉任(Jeffrey Drazen)也位列講席。雅各布則坐在聽眾席。

在最後的問答環節,雅各布走到布置在聽眾席的麥克風前,他向德拉任問道,科研期刊是否應該有發表針對重要研究的高水平重複試驗的責任。他公開了NEJM拒絕刊登他的團隊研究成果的情況。德拉任拒絕討論雅各布的文章,但是他說「作為編輯,我們無能為力」,並且進一步提到,用他的原話就是,「『原告方』(指嘗試重複實驗的科研人員)應該和原始研究作者共同擔起探尋真相的責任,我們不是在找出誰對誰錯,我們的目的是確定我們需要知道什麼。答案就是,促進人類健康,就這麼簡單。」

雅各布並不認為答案「就這麼簡單」,他反倒覺得荒唐。在一個討論透明度和重複結果的會議上,德拉任似乎在說,作為傳播信息的主要媒介以及驗證科研結果重複性的重要平台,一份期刊的能力有限,而「原告」需要和所謂的「被告」一起去理清楚。有多少醫生、科學家、患者代言人和科普作家就是通過NEJM這類一流期刊實時跟進前沿發展的,一個不靠譜的科研發現越少受到公眾質疑,那它就越有可能化為深入人心的常識。

當然,無數的醫療創新在改善並且拯救生命,但是據美國國家衛生統計中心(National Center for Health Statistics)2017年1月的報道,即使科學家們在向醫療前沿不斷推進(同時推進的當然還有醫療費用),美國人的預期壽命還是有些許降低。

不過,還是有某個領域在強有力地、實實在在地提高人類預期壽命,這就是持續創新的公共衛生系統。

可以將醫療系統比作紅酒:價格和質量有時候並不成正比。回看歷史上所有的里程碑事件,即便像是脊髓灰質炎疫苗的問世,這類現代醫學史上最大的壯舉——對人類健康的影響,尚不及改善衛生狀況和食物保鮮的新技術帶來的改變。由於吸煙和不健康的生活習慣而引發的肺癌是目前死亡率最高的癌症,而在20世紀初期,幾乎沒有美國人會因為肺癌而離世。所幸的是,公眾壓力在不斷遏制吸煙行為,而肺癌死亡率也自90年代的高峰開始急劇下降。因為肺癌和吸煙率緊密相關,所以因肺癌而離世的人應該繼續減少,但是有一個20年的滯後期,即肺癌死亡率會在吸煙率下降後20年開始下降。

誠然,醫療領域的創新功不可沒,只不過更多的是公共衛生系統在大社會層面引領改變。大多數人不相信這一事實而已。

最常見的影響美國公眾健康的疾病大多由不良生活習慣引起:吸煙、營養攝入不均、缺乏鍛煉等等。2016年11月,一組來自麻省總醫院(Massachusetts General Hospital)的科學家將1987年到2008年間的四個不同健康研究的數萬組數據合併加以分析。他們發現,簡單且中等程度的生活習慣改變就能夠顯著降低心臟病風險。心臟病是目前美國人的頭號健康殺手,每四位因病離世的患者中,心臟病就要佔一席。確定有高家族風險因素的人群只要做到以下四點中的三點就能將患病風險減半:不抽煙(即便有吸煙史),不肥胖(儘管可能超重),一周鍛煉一次,多吃天然食物(水果、蔬菜、全麥類食品),少吃加工過的食品。哪怕僅滿足其中兩條也能明顯降低風險。同年八月,國際癌症研究機構發布的一項報告總結道目前發現肥胖和一系列癌症相關,包括甲狀腺癌、卵巢癌、肝癌和大腸癌。

與此同時,患者,甚至醫生自己有時候都不確定一般治療方法的有效程度,或者說不確定如何去準確的衡量、表達這類「程度」。格雷厄姆·沃克(Graham Walker)是舊金山的一位急診科醫生,他和其他幾位醫生志願者共同維護一家叫做「NNT」的網站,網站目的是幫助醫生和患者了解藥物的效果有多好,或者很多時候,有多沒用。「NNT」是「需要治療的病例數」(number needed to treat),展開一下就是為得到一例有利結果,即一位患者從藥物或者手術中受益,需要多少患者接受治療。幾乎所有的主流媒體,都會用「相對風險降低」來報道某種葯的效果。為了幫助理解,我們這裡虛構一個疾病——霍格沃茲病——舉例解釋NNT。某天你聽到收音機裡面說有種葯能夠降低20%的霍格沃茲病死亡率,聽著還不錯對嗎?不過,那句話的意思用白話描述是1000個罹患霍格沃茲病的人裡面有10人會不幸離世,我們給每個人都吃這個葯,結果呢?8個人會死去。於是,每五百個服用該藥物的患者當中,有一位可以受益,躲過霍格沃茲病造成的死亡。因此,這例當中需要治療的病例數就是500,這樣聽著還行。不過假設該葯的「發生一例不良反應所需治療的病例數」(number needed to harm,NNH)是20,並且不良反應還很嚴重,那意思就是每一個受益的患者背後有25個患者受到嚴重不良反應的影響。突然之間,這利弊得失就顯的不那麼明朗了。

現在我們考慮一個真實存在並且大家耳熟能詳的藥物:阿司匹林。對於為預防初次心臟病發作而每日服用阿司匹林的老年女性來講,它的NNT和NNH大約分別是872和436。意思是假設1000位老年女性連續十年,每日服用阿司匹林,那其中有11位可以真正避免心臟病發作的出現;同時,兩倍於受益人群的女性將會經歷一次嚴重的胃腸道出血——如果她們沒有服用阿司匹林就不會出現這種情況。和絕大多數葯一樣,阿司匹林並不能給大多數服用它的人群帶來明顯的好處或壞處。這條規律基本上適用於你藥箱里的所有藥物:無益無害。艾倫·蘇沙(Aron Sousa)是一位內科醫生,也是密歇根州立大學醫學院的高級副院長,他提到「絕大多數人糾結於醫學就是一個概率的科學」,至於那些常見的衡量標準,相對風險,他的看法是「太亂了,不僅藥物公司用這些概念,醫生也用。他們希望這可以讓自己的工作顯得更有效,並且他們真心認為患者需要吃這個葯,同時相對風險看起來比NNT要更引人注目。相對風險其實就是換個法子去說謊。」

即便是臨床已經證明非常有效的藥物,如果從NNT這個角度看,都顯得不是那麼振奮人心。15位鼻竇感染的患者使用抗生素,其中只有1人的癥狀會加快緩解,而同時有8人出現一系列不同的副反應。一個針對老年人使用助睡眠藥物的元分析發現,每13位使用安眠藥(比如唑匹旦)的老年人中,1人的睡眠情況得到改善,平均每晚的睡眠時間增加了25分鐘,同時有6人出現至少一種副反應,其中最嚴重的是增加了遭遇車禍的風險。

「目前存在一種認知失調,或者說是職業抑鬱,」沃克說道。「你自己會認為『我的天,我可是醫生,這些葯都能幫到大家,我要全部開給他們。』不過我差不多都認命了,特別是在急診醫學領域。如果我們真的想對大範圍的人群產生影響,我們就應該更強調飲食,強調運動和生活習慣的改變。說實話,在審慎地研究這些統計數據之前,我一直很難真正接受這一理念。」

公衛領域的歷史學家知道過去兩個世紀對預期壽命提高影響最大的措施起源於改善衛生、食品保鮮、檢疫隔離等領域的創新。從1880到1920,在被稱作「第一次公共衛生革命」期間,全民壽命得到顯著延長,而這遠遠早於抗生素或現代手術的應用。

90年代,美國癌症協會董事會宣布了一項國家挑戰,即從1990年的癌症患病高峰起,降低癌症發病率。值得鼓勵的是,全美因各種癌症死亡的人數自那時候起在不斷減少。美國人依舊有很多方式可以將癌症死亡率降回到30年代的水平。誠然,醫療領域的創新功不可沒,只不過更多的是公共衛生系統在大社會層面引領改變。大多數人不相信這一事實而已。

2014年,楊百翰大學的兩位科研人員進行了一場針對美國人的問卷調查。統計發現,一般成年人將自十九世紀中葉後期開始逐漸增加的預期壽命的80%歸功於現代醫學。「公眾群體基本上高估了現代醫學對增加預期壽命起的作用,」他們寫道,「而大部分人並不了解公共衛生及改善的社會狀況起到至關重要的作用。這種看法可能會阻礙公衛系統獲得撥款支持,同時可能造成作為金融界分支的醫療系統得到過多撥款,並且會對為控制醫療開支而做出的努力構成阻礙。」

這份訴求不是空穴來風。但是考慮一下最近在眾議院通過並得到廣泛讚譽,投入達63億美元的《21世紀治癒法案》。又有誰能跟一個自製定出來就是從某種程度上鼓勵癌症研究的法案去爭論呢?——有,還不少。打頭炮的是美國家庭醫師協會和美國公共衛生協會的高層,他們爭論的點是新法案將會從公共衛生領域移走35億美元,為研究新醫療技術、新藥物的科研提供資金,這其中就包括前副總統喬·拜登的「癌症登月計劃」。新法案會將原用於疫苗開發及戒煙運動的撥款移走,而這些都是已知可以預防疾病,並且進一步合理開發,也許終將能夠終結疾病的項目。新法案同時允許FDA根據觀察研究結果,甚至僅根據藥品公司提交的「綜述審查階段」的數據就許可通過藥物新的適用範圍。普拉薩德熱衷於公眾評論,並以言辭犀利著稱於推特,他發推提到「不喜歡這項新法案的人,要麼是研究藥品核准程序的,要麼是研究藥品安全的,要麼就是沒有收藥商錢的。」

也許那只是社交網路一貫的誇大其詞罷了。醫學研究,追根求源,就是對知識的不斷探求;最初發現的康庄大道突然變成死巷是醫學研究過程的特點,而不是缺陷。希望新的法案能夠真正意義的加快著實長期有效的新治療方式的問世。不過現在我們至少搞清楚了現代醫學給我們的一點教訓:無效的治療方式其實也「著實長期」存在著。

來源:The Atlanticn翻譯:Victoria T.Y.Zheng,EON,Rebecca,Erafat..n審校:Erafat..n編輯:EONn

推薦閱讀:

在國外旅行時生病別害怕,這篇文章可以幫到你 | 妙技
當老婆說生孩子後做-愛的感覺沒以前好了,怎麼辦?
國內金融和醫療民營系亂象叢生是監管不足嗎?
急性支氣管炎能不吃消炎藥么?
迅速緩解哮喘癥狀的那個「萬托林」氣霧劑對人體有副作用或者賴藥性嗎?

TAG:医学 | 循证医学 | 医疗 |