只有8個病例的觀察性研究,卻改變了醫學實踐
小咖有話說:不管是在討論群里,還是私信給小咖的問題中,都有人問過這樣的問題:「我的樣本量為xx,這個數量很小嗎?」。有位夥伴回復說:「病例對照研究中,非常經典的研究,只有8個病例,32個對照,你說少不少?多少,不能一概而論,還要取決你的問題是不是新穎,病例組是否容易獲得等等」。
對這個經典研究感興趣的一位夥伴,花了很長時間搜集資料,完成此文。接下來,讓我們一起回到40多年前,看看這個改變歷史的病例對照研究。
歷史背景
Diethylstilbestrol(DES,Stilbestrol,乙烯雌酚)是一種人工合成的非甾體雌激素物質,1938年在美國問世,最早被用於有流產或早產風險的妊娠期婦女中,作為雌激素補充劑。在40-50年代,乙烯雌酚被廣泛用於全美的高危孕婦,然而在1971年,FDA發布警示公告,指出乙烯雌酚不應用於妊娠期婦女。
FDA的決定是如何做出的?我們要從同年,Dr. Herbst在麻省總醫院進行的一個病例對照研究說起。
病例的發現
Arthur L. Herbst,1959年從哈佛大學醫學院畢業,在位於波士頓的麻省總醫院完成住院醫培訓,成為了一名婦產科醫生。
1966到1969年間,Dr. Herbst在波士頓文森特紀念醫院(Vincent Memorial Hospital,當時承擔了麻省總醫院婦產科的醫療服務,現已正式合併)連續收治了7位女性陰道腺癌患者。
陰道腺癌是一種非常罕見的生殖系統癌症,只佔全部生殖系統癌症的2%,大多出現在50歲以上女性中。然而,這7例患者不僅在短短4年之間連續出現,而且全部是25歲以下的年輕女性,這引起了Dr. Herbst的強烈興趣。他把這7個病例的病理檢驗結果發表在1970年4月的《Cancer》雜誌上。
連續出現的陰道腺癌是怎麼發生的?難道是有了一種新的疾病嗎?醫生首先懷疑病人是否使用了某種共同的陰道刺激物,譬如某種衛生棉條,然而答案是否定的。在性行為方面,在7位病人中,只有1位曾有過性經歷,並未服用過避孕藥。面對著年輕而迷茫的患者,Dr. Herbst決定進行一項病例對照研究,來找出這些不尋常的陰道腺癌的致病因素。
Dr. Herbst-1971年4月
在與病人家屬的交談中,一位母親提到了在懷孕時曾經接受過雌激素(DES)治療,這引起了Dr. Herbst的同事——Dr. Ulfelder的注意(Howard Ulfelder,MD,時任哈佛大學醫學院婦產科麥格教授(Megis Professor))。這7例患者都出生在40年代末,50年代初期,正是雌激素療法在高危產婦中大規模推行的時期,有沒有可能是因為這個當時新推廣的療法造成的副作用呢?會不會是妊娠期的其他因素影響了產兒成年後的健康狀況?
為了回答這個問題,Dr. Herbst和Dr. Ulfelder在這個經典的病例對照研究中納入了8個陰道腺癌病例和她們的母親:7個上文已經提到過,第8個病例(患者22歲)由Dr. Goldstein提供(Donald P. Goldstein, MD,布萊根婦女醫院創始人,也是哈佛醫學院的校友)。
同時,他們選擇了和病例在同時間(誤差不超過5天)、同醫院生產的女嬰以及她們的母親,以1:4的比例選為對照,即每1例病例,匹配4個對照。
研究員利用結構化問卷的方式,調查病例組和對照組的母親在懷孕時(特指病例這一胎,後同)的種種因素,結果如下:
Dr. Herbst指出,孕中雌激素(也就是DES)使用和女童成長期間發生陰道腺癌顯著相關(P<0.00001)。所有接受雌激素治療的母親都從妊娠早期開始治療。有6位母親確定她們接受的是DES治療,剩下的兩位母親中,一位母親的產科醫生確認了當年使用了DES,只有一位母親懷孕期間沒有接觸DES。
在8個病例的母親中,本次生產之前總共發生過10次流產,而32個對照母親中僅僅發生6次。從上表中也可以看出,病例母親發生孕中出血的概率也較大。這兩點,很有可能是當年醫生建議她們進行雌激素療法的原因。
研究結果發表在1971年4月的《新英格蘭醫學雜誌》上。
Dr. Greenwald-1971年8月
Dr. Herbst的病例對照研究剛剛一發表,就引起了婦產科醫生的強烈關注。僅僅3周之後,來自紐約州衛生部門(New York State Department of Health)的Dr. Peter Greenwald就從紐約州癌症登記處找到了另外的5個病例。
有了Dr. Herbst的成功經驗,Dr. Greenwald同樣設計了一個病例對照研究,深入分析了DES療法以及劑量和產兒之後患陰道腺癌的關係。他發現,從1950到1970的20年間從紐約州癌症登記處找到的全部5例疑似病例中,4例病例的母親在懷孕時接受了不同濃度DES治療,劑量從懷孕初期0.1mg-5mg/d到末期100mg-125mg/d不等,剩下的1例接受了雙烯雌酚(與DES類似的另一種人工合成雌激素)治療。
這個研究不僅為Dr. Herbst提出的相關性提供了額外的證據,而且論證了不同濃度DES可能的有害性,引起學界的熱烈討論。這篇研究發表在1971年8月的《新英格蘭醫學雜誌》上。
FDA警告-1971年11月
基於臨床研究中得出的結論,FDA在1971年11月發布警告,根據Dr. Herbst和Dr. Greenwald在《新英格蘭醫學雜誌》發表的研究,以及Dr. Herbst給FDA報告的額外15個病例,FDA認為基本可以確認所發現的陰道腺癌和乙烯雌酚的使用相關。針對這個問題,FDA採取了三個措施:
1. 所有生產DES以及類似物(dienestrol, hexestrol, benzestrol, promethestrol)的藥廠都需要修改藥物說明書,把妊娠期婦女列為藥物禁用對象。
2. 所有其他的雌激素類似物都必須在藥物說明書中寫出「已有統計學研究指出,妊娠期DES使用與產兒多年後發生陰道腺癌顯著相關,其他雌激素是否有此健康危害目前未知,在任何情況下,不建議對妊娠期女性使用雌激素」。
3. 呼籲開展大規模流行病研究,研究DES相關的陰道腺癌發病率,危險人群等等。
響應FDA的號召,美國CDC在1974年啟動了DES Daughters研究,研究所有在胎兒時期暴露在DES治療中的女性,出生後面臨的健康危險。之後,類似的研究也擴展至妊娠期間直接接受DES治療的女性( DES Mother,1980年啟動),以及男性胎兒(DES Sons,1985年啟動)。
從1938年面世到1971年被FDA叫停,DES及其類似物(使用各種不同的商品名)被廣泛應用在全美各個婦科診所的高危孕婦中,截至CDC 2001年的統計,DES至少影響了5百萬到1千萬美國人。如果不是Dr. Herbst,Ulfelder,Greenwald等人的研究成果,DES的危害可能進一步擴大,影響到更多的人。
四十多年過去了,因為FDA和CDC的及時出面,DES已經不會再應用於妊娠期女性中,大部分受到DES影響的人們已經獲得了妥善的治療。當年進行的病例對照研究,也已經成為了流行病學教材中的經典案列。今天,我們不僅僅是來講這個FDA史上的精彩故事,也來仔細看一看,到底是什麼樣的研究,僅僅靠8個病例,就扭轉了人們對DES治療的看法。
病例對照研究的原理
病例對照研究(case-control study)是觀察性臨床研究中常見的一種,常常用於病因的分析。病例對照的基本原理是,以確定患有某疾病的病人作為病例,以不患病但與病例具有可比性的個體作為對照,通過詢問、實驗室檢查或複查病史、搜集研究對象既往各種可能的危險因素的暴露史,測量並比較病例組與對照組中各因素的比例,經過統計學檢驗,若兩組差別有意義,那麼我們就可以認為這個因素與疾病之間存在統計學上的關聯。
上面的一段話是從課本中抄下來的,讓我們翻譯一下,以Dr. Herbst在1971年做的那個經典的病例對照研究為例。他把收集的全部8例陰道腺癌患者作為病例,按照1:4的比例收集了32個未患病的女性作為對照,通過問卷的方法回顧調查她們的母親妊娠期間的吸煙、出血、DES治療等情況,對兩組進行比較,然後得出DES治療與患陰道腺癌相關的結論。這就是一個經典的病例對照研究的設計。
在滿足了研究設計的基本框架之外,大家都公認Dr. Herbst的這個研究做的好!它好在哪裡呢?我認為主要在這3個方面:
- 研究的問題很有臨床意義,所以,提出一個好的臨床問題非常關鍵!
- 收集的病例很特別,也很有代表性(包括了4年內波士頓地區的全部確診病例);
- 對照按照研究者提前定義的條件(在同時間(誤差不超過5天)、同醫院生產的女嬰)和病例進行匹配。
前兩點主要與臨床問題有關,那麼第三點中的這個「匹配」為什麼讓我們覺得研究更好了呢?
匹配
經典的病例對照研究設計中,病例和對照可以匹配,也可以不匹配。匹配,最主要的目的是保證病例和對照的可比性。因為對照和病人在某些特徵上是一致的,所以在她們之間做比較的時候,就能夠排除這些因素的影響。譬如,Dr. Herbst以同醫院,同時間生產做匹配,就排除了病例和對照的母親們因為在不同醫院,或者是不同時間就診(我們管這樣的因素叫做混雜因素)產生的誤差,而僅僅觀察她們妊娠期的吸煙情況,DES治療等所造成的區別。
在控制混雜因素的影響之外,匹配還能提高研究的效率。這是什麼意思呢?因為病例和對照按照提前限定的混雜因素匹配了,那麼他們之間的其他任何不同,都可能和我們的分析相關,換句話說,每一個研究對象提供的有用信息量增加了,這提高了統計分析的把握度,並且縮小了所需的樣本量。這也是為什麼,Dr. Herbst的研究,雖然只有8個病例+32個對照,但是結果仍然讓人信服的主要原因之一(當然,提出好的臨床問題是關鍵!)。
在實際應用中,特別是病例數較少的情況下,往往需要通過匹配對照,來控制混雜,獲得可靠的結論。值得注意的是,如果對照是通過匹配得到的,在分析數據的時候需要使用相對應的分析方法,而不能使用普通的t檢驗,卡方檢驗等。Dr. Herbst分析他的配對數據時使用了配對卡方檢驗(Pike與Morrow)和配對t檢驗。其他常用的方法包括McNemar檢驗,條件logistic回歸等等,應該根據研究目的和數據情況選擇。
同時,匹配的研究方法也存在一些局限。包括有些情況下匹配對照不易獲取,匹配過度等等。而且, 一旦研究人員確定使用某個變數進行了匹配,那麼就無法從數據中研究它和疾病發病之間的關係,於是從研究數據本身,我們無法判斷是否存在過度匹配的問題,只能通過臨床知識解釋。所以也不能盲目匹配,避免匹配過度。
總結
今天我們從DES的歷史,FDA如何通過兩個病例對照研究就發布了「孕婦禁用DES」的公告,講到了病例對照研究,以及在其中進行匹配的優缺點。
Take home message:
- 質量高的小樣本的觀察性研究也能提供靠譜的醫學證據
- 我們可以通過病例對照研究探索疾病的病因
- 病例很少,難以獲得的時候可以通過匹配對照的方式控制樣本量
- 當然,最重要的,還是要保持對醫學的靈敏嗅覺,和對科學熱忱的探索之心
參考文獻
- N Engl J Med. 1971;284(15):878-81.
- Cancer. 1970;25(4):745-57.
- CA Cancer J Clin. 1972;22(5):292-5.
- N Engl J Med. 1971;285(7):390-2.
- Selected Item from the FDA Drug Bulletin—November 1971: Diethylstilbestrol Contraindicated in Pregnancy, Calif Med. Feb 1972; 116(2): 85–86. v.116(2)
- CDC. DES update home. https://www.cdc.gov/des/index.html
(想要及時獲得更多內容可關注「醫咖會」微信公眾號:傳播研究進展,探討臨床研究設計與醫學統計學方法)
推薦閱讀:
※驚現77歲醫生輪轉培訓,生命不息 培訓不止 !
※警惕過度包皮手術危害娃一生
※2018西綜資料
※胎盤——不僅僅是用來吃的
※生理學章節要點匯總,這些內容都不會,那就明年見吧