個例能夠在多大程度上說明問題?在什麼條件下應該被忽視? 如何看待其有效性?
注意到很多討論裡面(尤其是中醫貼),經常會就個例的有效性發生爭執。
有些個例確實很有問題,比如說能自愈的病,被某種療法治好了,這不能說明什麼。
但也有些個例,比如說數年未愈的病,被某種療法治好了,雖然n=1,但也是很好的自身對照。
甚至還有些在現有知識框架下不能理解的事情,比如這個答案中最後提到的案例為什麼很多人對中藥深惡痛絕?中藥和西藥的優劣究竟體現在什麼地方? 這種個例是否應該嚴肅對待?(注意這個案例和中醫無關,和靈異現象有關)
在不能找到更多樣本的情況下,應該用什麼態度去對待這些個例?有哪些通用的原則?
至少在歷史上,個例也是推動科學進步的一大動力。比如說最早接種牛痘的那個小孩。
謝腰。個例在循證醫學的證據強度是比較低的。而且個例還要看是誰報告的。關於證據強度可以參考這樣的圖一搜一大把,基本都是一個意思。注意這裡面的Case series和Case report都是由專業人士撰寫的報告並且在期刊上發表了的。那種「我二大爺……」的個例是Anecdotal evidence,圖上根本沒有提的,所以連證據都算不上的,除非這位二大爺的case發表了。主要是這樣的證據的可信度和可重複性都非常差也談不上什麼data conllection,跟說故事差不多。如果沒有可信的來源,那誰知道是真的還是編的,或者因為沒有專業知識而發生了誤解。自身對照再好,N還是1啊。這樣的樣本量不能再小了,受各種因素的影響也非常多,而且僅僅只靠隨機都能出現任何結果。到了一個人身上,什麼病能自愈不能自愈都很難說。流感大部分可以自愈,但是也有死了的;癌症算是絕症吧,照樣有自愈的個例。
但是,在發現一個特殊病人,一些罕見的副作用,這些情況下,個例報告的意義還是有的,可以給進一步的研究提供方向。只不過作為支持某個結論的證據還是非常不足的。
不了解中醫,能從心理學角度回答下問題的前半部分,大概說一下。
在醫院沒法查文獻,以下全靠記憶,有錯誤歡迎指正。題主說的這種叫個例,心理學上稱個案研究,個案研究不是沒用,在任何一個研究的初期它都是十分有用的,個案研究的作用,很大程度上取決於科學探索在某個特定領域進展到什麼程度。從個案研究或臨床經驗中獲得的靈感,在特定問題的早期研究階段或許會有一定的作用,因為它們的成功與否可以起到提示我們哪些變數需要進一步研究。當然,題主說的天花確實是一個成功的個案,可是題主,你要知道天花是不會在動物身上寄宿的一種病毒,這就意味著它變異的幾率不高,整個研究中需要控制的變數就少。
然而,當我們科學研究的早期階段步入更成熟的理論檢驗階段後,情況就不一樣了。由於個案研究在特定理論的檢驗中不能作為證實或證偽的證據,所以它在科學研究的後期就不再有效。原因就在於個案研究說的是一種孤立的事件,缺乏比較性信息,而這種信息對於排除其他可能的解釋來說是非常必要的。
還有個名詞叫見證敘述,指的就是題主你說的那種,有的人說中醫特別有效。的見證敘述。但是見證敘述依然也是孤立事件,而為什麼人們又願意去相信這些個案呢,主要有兩個原因。
一,安慰劑效應。
的確,這世界上幾乎每一種醫療方法都有一定數量的支持者,不管這些方法是科學還是不科學。所以無論治療是否有效,人們都會聲稱某一種療法對他們有效這種效應就被稱為「安慰劑效應」。
就像電影《綠葉仙蹤》中,仙女並沒有真的給鐵皮人一個心臟,他卻感覺自己好了很多。
在生物醫學研究中,安慰劑效應的運用最為廣泛,所有的新葯的研究程序都必須包括對安慰劑效應的控制。一般會有兩個實驗組,一個吃含有治療成分的葯,一個吃無治療成分的葯,兩組都不告訴吃的什麼。然後進行比較,有的病人就會出現安慰劑效應,就是我不管給了你什麼,只要這是一種新的治療方式了,你就感覺好一點了。
據說,安慰劑效應在治療抑鬱症中是最有效的,比例達到30%(大概是這個數字。意思就是服用不帶治療成分的葯卻感覺治療的病人佔了30%)。
但是安慰劑效應,多的還是作用於心理治療中,對中醫不了解,就不說了。二,鮮活性效應
指當人們面臨某個問題時,比如一種疾病,人們從記憶里會提取和相關情景有關的信息,因此,天性會使人們傾向提取更易於獲得的能夠解決現在問題的信息。而影響可獲得性最重要的因素就是信息的鮮活性。
而大家都明白,沒有什麼比我親眼見證的更鮮活更引人注目了,因為親身經歷是真事的經驗,這些經驗的鮮活性就會影響其他真正有效的信息在你心中的地位。比如我們去一口鍋,我們在不同品牌之間權衡,最終都會因為一個朋友的推薦或者一個廣告去買自己不熟悉的品牌。因為別人給你的信息是,「我真的用過!很不錯」。這就是鮮活的信息,也是影響人們決策的重要因素。
治病同理,你覺得發燒了,姐姐給你一盒葯說,「你吃這個,上次我就是吃這個就退燒了」你自然就會相信,加上你心裡給自己的安慰劑效應,加上人體自然的修復能力,你吃完後或許真的就退燒了。
其實這些個案最大的問題就在於,人們過於相信見證證據了。事實上,無論一個理論主張是否合理,都不能用見證敘述和個案研究的證據來判定的。
最後,至於怎麼辨別,怎麼應對,這就寫不完了,針對不同的案例不同的情景就有不同的分析方法。抱歉,只知道心理學方法,對醫學不太了解。只能說,個案,基本不靠譜,能作為研究證據的可能性幾乎為零。回家後再貼文獻吧。以上大部分來自《對偽心理學說不》接另外一個人的答案,說一下統計學個例多麼薄弱吧,就算不考慮採樣誤差的情況下。
這本書專門有章節講樣本數太小的情況下,用最大概然會有什麼問題:Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series): Kevin P. Murphy: 9780262018029: Amazon.com: Books其他統計書應該也會講,但是統計書我就看過這一本並且還沒看完下面我就片面的說最大概然估計常常還不如平均值估計或者中位數估計
首先變一下座標,最大概然對應的點就變了,原來是 p(x)的最大值,變了座標之後是 p(x)dy/dx的最大值然後最大概然的結果和期望的結果也是不用的
下面我就懶得上圖了,貝葉斯的手法大家應該都見過假設有兩個商家,一個賣出100個商品有90個好評,另一個賣出一個商品並且有一個好評現在考慮你從第二個商家買一個商品,靠譜率如何。假設沒有數據的時候,靠譜率平均分布在[0,1]之間,靠譜率的概率密度p(x) =1
然後只有一個觀測,觀測結果是好的 p( A=一個好評,沒有其他評價|x)= xp(x|A=一個好評,沒有其他評價)= p(A|x)p(x)/p(A)= 2xp(x|A)的中位數是0.7也就是一個靠譜率在0.7以上的商家,至少在期望上,就能夠把這個只有一個好評的商家爆了。何況那個有100評價中有90個好評的商家。雖然從最大概然上看,第二個商家是100%,但是中位數上看只有71%說明一個問題,也就是確定一個明確的因果關係,關鍵的是對條件的控制而並非依靠樣本的數量。只要邏輯明確,個例足可以說明問題。比如神經科學的很多研究,都是通過腦損傷個例來揭開不同腦區的功能。為什麼它可以這麼做?因為它建立在「不同的人在同一腦區功能是一致的」這一已被廣泛接受的假設上,基於此我們就可以通過腦損的個例來推斷人不同腦區的功能。所以說,個例具不具備說服力,關鍵在於代表性的確立。代表性一方面可以是先驗的,通過像前面的例子那樣,通過不同的證據幅合歸納總結而確定。另一方面可以是後驗的,使用合理抽樣的統計,去尋找一個傾向性強且足夠大的效應。當然,這一切的前提還是條件的控制,統計無非只是輔助,不得已而為之。不是有這麼一句名言嘛,一次好的重複實驗頂得上一千次t檢驗。所以該怎麼對待個例呢?我選擇的是不盲目相信,也不盲目否定,應該嚴肅對待。不輕易相信一次或者部分結果,尋求儘可能多的證據,再從元分析的角度去看待不同證據的趨向。
推薦閱讀:
TAG:科學方法 |