正告中醫黑:隨機對照試驗排除中藥安慰劑效應?光說不練可不行
繼白菜之後的這一篇,我來談一談隨機對照實驗。
隨機對照試驗(randomized controlled trial, RCT),其設計遵循三個基本原則,包括設置對照組,研究對象隨機化分組以及盲法,經常簡單俗稱為雙盲實驗,常用於醫學領域對於某種療法或者藥物的效果進行檢測的手段,其實驗設計的理念,會保證被試者和實驗者雙方都不知道哪些被試者接受了哪一處理,因此這種實驗方法主要用於防止研究結果被安慰劑效應或者觀察者偏愛的影響,被公認為評價干預措施的金標準。
但是,它能解決評價藥物有效性的一切問題嗎?
且讓我們從頭開始說起。
(準確地說,「有效性」這個說法是不全面的,因為所謂有效是基於相對無效的安慰劑或者空白組,但是安慰劑組未必無效,但是為了表達方便,首先聲明此處的有效性,指「優於安慰劑效應的藥理學作用」,即所謂藥物在藥理學角度的有效。)
一、隨機盲法不是評價藥物有效性的必須
眾所周知,如果要對兩個變數進行因果推斷,即A是不是導致了B,必須保證A變數在改變的時候,受試者的其他變數完全不變,即「控制單一變數」。如果嚴格做到了這一點的情況下,確實觀察到A變數的變化導致了B變數的改變,其實什麼大樣本,盲法,都是不需要的,就可以直接得出「A能導致B」的結論,這是毋庸置疑的。
例子很好舉,比如用動物實驗去驗證藥物的有效性,經常要求實驗動物要是「近交系」,什麼意思,近交系動物的群體基因高度純合和穩定,個體之間的基因相似程度達到98%以上並且可以穩定遺傳,換句話說,對於同一批次的近交系動物來說,它們幾乎相當於是「複製粘貼」得到的,個體差異已經小到無以復加的程度,然後將這些幾乎完全一樣的動物隨機分組,造模,給葯。對於模型組和給葯組來說,這兩組之間唯一的變數就是給葯,其餘條件都完全相同。在這樣的情況下,如果觀察到給葯組動物的相應指標優於模型組並且具有可量化的統計學差異,那麼就直接可以得出「實驗動物指標的改善」是由於「給葯」這個單一變數引起的。這種通過控制單一變數法得出有效性的結論,是不需要通過隨機盲法得出的。
另外,想推出A導致了B,除了控制變數法之外,最直接的辦法就是邏輯推導法,即完全搞清楚從A到B的路徑,A和B雖然不是直接關係,但是我通過研究推導,發現A能直接導致C,C能直接導致D,而D又確實能直接導致B,那麼就算體系中存在更多的變數EFGH等等,都不會干擾A-C-D-B的因果關係路徑,都是不影響得出A導致B的結論的。
換句話說,如果在理論上研究的無懈可擊,也是不需要隨機試驗去證明其有效性的。如果人類研究人體就像研究汽車那樣原理清楚,全都懂了,那就只需要哪裡壞了修哪裡就好了。就比如臨床上運用的抗生素,抗生素就是可以直接殺滅病原菌,哪種抗生素對哪一類病原菌的殺滅作用強或者弱,都是已經研究明白的。所以給了對應的抗生素,病原體感染患者就能夠治療痊癒,這種清楚明白的藥效,是無需用隨機試驗進行證明的。再比如很多手術比如針對腫瘤(特別是邊界清楚的良性腫瘤),病灶長在那裡,不切除就還在,切了就好了,此時無論那個患者的變數再多,是男是女,年齡如何,今天吃了什麼,都不會影響「切除病灶所以疾病痊癒」的事實,這種明白而又有效的東西,盲不盲的,也就無所謂了。
但是現實卻是,這種「控制單一變數得出結論」的實驗設計原則到了臨床上評價藥效時,卻因為「無法對人進行有效控制」的現實而遇到了實際的問題。最理想的實驗,在同一個時間點,是複製粘貼出兩個完全一樣的人,對其中一個人單獨用藥,然後觀察療效,與另一個人進行對比,這才是真正的對藥效進行準確判斷的方法,然而在臨床上這種情況是做不到的,所以控制單一變數法就不適用了。另外一個方面,很多藥物的機制,無論是中藥還是西藥,是單一化學物質還是混合物,它的機制都是不清不楚的,或者說只能搞明白其中的一小部分,並且還是容易受到我們控制不了的變數干擾的。這種機制的不清不楚,是醫學科學技術的無能,是人類還沒有完全揭開健康疾病奧秘的必然。
為了應對這種迷茫,隨機對照試驗才應運而生,它比一般的臨床試驗,能夠更大限度地排除實驗設計,實施中出現的各種偏倚和混雜的因素,因而能夠比一般的試驗方法更準確地判斷藥物的有效性,是所謂的「金標準」。
這一部分說了那麼多隻想明確一點,所謂「金標準」,並非判斷藥物有效性的必須,而實際上,它的誕生更像是一種出於無奈的選擇。我們既搞不清楚機制,又還想知道療效,那就做雙盲吧,得出的結論要更靠譜一些。
二、可操作性層面的問題
由於我的專業並不是臨床實驗,在這裡我只談由實驗原則引發的可以討論的問題。
隨機對照雙盲實驗作為一個需要盲法的臨床試驗,盲法和臨床這兩個特徵就導致了它不可迴避的兩個問題(針對實驗對象,即患者),一是得做的了(符合倫理),二是得瞞得住(保證盲法)。
根據倫理學的原則,參與臨床試驗的患者需要保證「有效的知情同意」。患者的知情權決定患者必須得知有關治療的目的、方法,預計的風險和療效的全面、精確的信息。而患者的同意權責保證患者在任何時候都有權退出臨床試驗(引自協和醫學院翟曉梅教授《生命倫理學》授課內容)。
在這裡不難看出,倫理要求「有關治療的目的、方法,預計的風險和療效的全面、精確的信息」,和隨機對照試驗中的「盲法」,是很容易發生衝突的。所以,在隨機對照試驗的知情同意中,患者必須被告知自己可能接受的治療手段的範圍,而只是不知道具體自己被施以哪一種而已。
在這種原則下,以下的情況就會出現:
第一,如果設置安慰劑組,那麼患者將必定得知自己參與的臨床試驗中存在安慰劑組,而自己是有可能接受安慰劑的治療的。這所帶來的可操作性問題,就在於對於很多必須急需獲得療效,否則就會極大危及健康或者進展迅速的疾病,是無法進行安慰劑組的設置的,因為設置安慰劑,就幾乎必然導致此組內的患者承擔可能耽誤疾病治療的風險。另外,如果一種現行的治療手段能夠有效治療患者的疾病,也是不能設置安慰劑組的,因為患者是沒有理由承擔「本來疾病可以被治療卻有可能被用安慰劑」的風險的。所以,設置陰性對照安慰劑組的雙盲實驗是有很大局限的,僅能在不給受試者造成較大健康風險時,或者一種新藥用於尚無已知有效藥物可以治療的疾病的情況,才可以直接設置安慰劑對照組進行療效評價。
第二,在無法使用安慰劑對照的情況下,陽性對照是經常選擇的對照方式。簡而言之,是通過與已知的有效藥物進行對比,以比較受試藥和對照葯之間的差別(一般指受試藥作用強於對照葯,即優效性),或者證明受試藥與對照藥效果相當(即非劣效性或叫等效性)。但是陽性對照的選擇也有一定的局限,它必須是相關領域內公認的,對研究的適應症療效最為肯定並最安全的藥物,並且原則上須與受試藥的藥理作用類似,劑型,給葯途徑等需盡量保持一致,這不僅是保證相互之間具有參考價值,也是為了保證盲法,因為患者事先的知情同意是需要明確知道自己將接受的治療是哪幾種(只是不知道自己具體接受哪種),如果對照葯與受試藥在劑型,給葯途徑上有很大差別,患者就可以通過自己接受的治療方式得知自己被分在哪一組從而破壞盲法。所以,如果找不到合適的陽性對照,那麼實驗結果的科學性是必然會打折扣的。
並且,單純從邏輯上講,陽性對照是無法直接排除安慰劑效應的,因為它的實驗結果是與陽性組作對比,得出的直接結論是「受試藥的藥效優於/相似於/劣於陽性葯」,而不是直接設置安慰劑對照時得出的結論「受試藥的藥效優於/相似於安慰劑」。這樣就要求所選擇的陽性葯已經排除安慰劑效應,理論上才能間接表明受試藥排除安慰劑效應。
因此,由於隨機對照試驗必須要選擇對照組,無論是陰性對照還是陽性對照,那麼其應用的局限,就在於對照組的選擇過程中。選什麼做對照,如何對照,雖然原則上都寫的很清楚,但是到了具體的環節,會遇到很多問題。特別是陽性對照,作為對比的參照,怎麼選,選什麼樣的參照,是會直接影響結果的科學性的。借用 @龐博 的例子,多索茶鹼擴張支氣管的作用是氨茶鹼的十倍,如果以氨茶鹼為對照評價多索茶鹼,那多索茶鹼的效果都要好到天上去了,然而在臨床上,多索茶鹼只不過是個二線用藥,應用範圍遠遠不及氨茶鹼。所以評價出來的優劣,與臨床使用的上的優劣,可能根本就是兩碼事。
三、陪「言必稱雙盲」的中醫黑嘮嗑:「金標準」到底適用不適用於評價中藥
中醫黑在黑中醫的時候,有時候喜歡質疑中藥的療效,並且經常拿雙盲說事,講「你中藥的治療效果都沒排除安慰劑效應」。說實話,我看著就煩,不過說「沒排除安慰劑效應」的,比講「中藥起效都是通過安慰劑效應」的,還是要可愛一些,手動狗頭。
但是中醫黑們從來只管黑,卻沒幾個想過具體問題具體分析的,現在我就來做這件事情,從必要性和可操作性的角度分析一下,中藥和隨機對照試驗的關係,即到底要不要做,能不能做,以及怎麼做。或者說,證明中藥的不依賴安慰劑效應的療效,是不是必須通過隨機對照試驗進行。
先說明一下,由於中醫黑直接質疑的是「中藥」的效果,打擊範圍太廣,所以此處還是分情況討論吧。另外多說一句,所有「理論可行」的東西,其實是沒意義的,因為涉及到可操作性層面的東西,就需要用具體的例子才能說明問題。你光跟我說「某指南上明確規定了怎麼做」,或者說「用什麼什麼方法就能做」是沒有用的,我需要討論的,是具體是什麼,需要用什麼,到底怎麼做。
1、機制清楚效果顯著的中藥,無需做
第一部分已經講過,得出A導致B結論的方式並不一定需要隨機對照試驗。對於機制清楚療效顯著的中藥,與西藥採取同樣方式,其療效直接確認就可以,對於這種情況,是無需隨機對照,也無需排除安慰劑效應的。
舉例:大承氣湯的瀉下作用。中醫用大承氣湯治療陽明腑實證,最顯著的效果就是瀉下通便。對於便秘的患者,吃藥之前不排便,吃完之後排便了就是排便了,效果確鑿,顯然不是安慰劑效應所能達到的,這不能睜著眼睛說瞎話講看不見。另外,此方中的大黃,對腸蠕動的促進作用有現代藥理學研究背書,芒硝作為西藥也有片劑在售可用於便秘,其作用均與通便有關。因此,這種中藥方劑的作用,根本不需要用雙盲實驗去排除什麼安慰劑效應。
2、中藥成方製劑:可以做,但說明的問題有局限
如果非要做隨機對照試驗的話,中藥成方製劑應該算是最好操作的了。由於劑型和組方固定,想要設計安慰劑組與中藥成方製劑進行實驗,理論上是可行而且比較方便的。對於丸散顆粒劑來說,製作出外觀類似的安慰劑並不十分困難,只需要選取合適的評價體系和指標,可操作性還是比較大的。
但是如果選用陽性對照,反倒問題會更麻煩一些。首先,陽性對照選擇的原則之前講過,必須是對研究的適應症療效最為肯定並最安全的藥物,並且原則上須與受試藥的藥理作用類似,劑型,給葯途徑等需盡量保持一致,這一點上首先就很難保證,比如治療哮喘,西醫常用的可能都是氣霧劑吸入給葯的,中藥里幾乎沒有治療哮喘吸入給葯的方劑,這樣劑型和給葯途徑上就大不相同,那就只好妥協一下,暫且忽略這個問題。另外一個問題是,中醫的「證」和西醫里的「癥狀」並不是相同的概念,隨機對照試驗中,總要選取一定的指標予以評價,這樣就涉及到評價體系不同所導致的問題,或者直接無法評價。簡單的例子而言中醫里講「梅核氣」,是咽喉的異物感如梅核阻塞,咳不出咽不下,但是現代醫學的檢查往往找不到什麼器質性病變,或者僅僅見到類似於慢性咽炎的表徵,如果直接按照慢性咽炎的評價標準去評價中醫對梅核氣的治療,在評價指標的選擇上,就有體系不適用的問題,因為有的患者可能治療過後,咽炎癥狀還在,阻塞感消失,或者咽炎癥狀緩解,阻塞感還在,那麼到底這種治療算是有效,還是無效,再加上阻塞感又是個主觀性很強難以量化的指標,也就使臨床研究在數據收集和分析方面遭遇困難。
3、臨床最常用的中藥湯劑:問題最多,經常做不了
前幾天匿名中醫黑掛我說我批判隨機對照試驗,我說我沒有批判這個試驗,而是說它不是放之四海而皆準,有應用的局限,舉的就是中藥湯劑的例子。
a)由於湯劑自身特點,破壞盲法,無法操作
臨床試驗的知情同意規則要求參與臨床試驗的受試對象必須清楚地知道自己將要接受什麼樣的治療。換句話說,針對中藥湯劑的隨機對照試驗,作為一個參與者,其自身是清楚自己將要接受的治療方式有可能是服用中藥湯劑(另一種可能是在對照組,屬於有限選項範圍內的未知),並且根據原則,中藥湯劑的組方,至少是基本組方(因為涉及到臨證加減),也應該是告知患者的,這是前提。
那麼,如果要設計陰性對照,即安慰劑組,排除中藥湯劑的安慰劑效應,那麼安慰劑組的患者就將服下一個不是中藥湯劑的沒有藥理作用的東西,而又得保證患者不知道自己服下的是安慰劑。
對於中藥湯劑來說,這真是個艱巨的任務,因為中藥里很多藥材,其特殊的氣味,是難以被複制和掩蓋的,比如薄荷,香氣撲鼻,患者只要端起葯碗,就知道自己喝的是薄荷。
有人說,那就用香精和色素去模擬安慰劑組假藥湯的性狀。
氣味分子的特殊氣味很難被模擬和複製,你想模擬薄荷的氣味,不好意思,你得加薄荷醇之類的薄荷提取物,綠箭口香糖里的薄荷味就是薄荷提取物,要知道那可是薄荷的有效成分啊,安慰劑里怎麼可以加入待測藥物含有的有效成分。
雖然理論上講,如果待檢測的藥物效果與薄荷無關,安慰劑里就可以隨便加薄荷醇之類的東西。但是,你怎麼知道待檢測的藥物效果與薄荷無關,你們中醫黑自己說的,中藥機制不明,既然不明,那就是有可能,否則你先證明它一定無關。
除了薄荷,藿香沉香當歸川芎丁香細辛小茴香,這樣有特殊氣味的藥材,要多少列出多少,而且很常用。
那就用矯味劑,你以為你說出個矯味劑,就能解決實際問題了?真是書獃子之見。黃連水煎劑的苦味獨步天下,你靠什麼矯味劑能掩蓋,而且服用完之後還會把舌頭染成特殊的黃色,連漱口的水吐出來都是橙黃色。
那就處理湯劑吧,濃縮了,裝膠囊。
不好意思,那叫改變劑型。
逼急了,某匿名用戶說,最極端的情況是使用封裝容器和吸管,捏著鼻子喝葯。
且不說人家患者簽知情同意的時候,同意不同意你每次都捏著鼻子喝稀里糊塗的東西,就算喝了,你不怕人家患者喝飽了打嗝反出一股薄荷味?你上頓吃了臭豆腐,放出的屁都能提醒你確實吃過。你覺得這點伎倆就能保證盲法,不知道自欺欺人的成分有多大。
還有,講捏鼻子就吃東西就淡然無味的,不知道你們聽說過一種叫土鱉蟲的中藥沒有,說實話那玩意煮出來的湯跟翔味沒多大區別,你靠捏鼻子,能擋得住這酸爽?
要不你直播捏鼻子吃翔?
省省吧,我都不忍心。
還有大黃,大黃組成的方劑也不少,在方劑里,大黃清陽明實熱,功效就是瀉下,說白了就是吃了就拉稀,這是它的藥理作用,這個時候治療疾病需要病人拉稀排出體內的毒物,這不是什麼副作用。
就算你模擬的了大黃的氣味和口感,讓病人不知道自己吃下去的湯劑里含有大黃,但是你擋不住治療組病人吃了就跑廁所啊。
病人喝了不明物質,雖然當時不知道自己吃的是什麼,但是上廁所拉稀的頻率增加了好幾倍,還能明白不過味?
這一切都是問題,從葯的性狀和藥效,稍微懂點中藥的人,就能輕易破壞盲法。
當然,除了陰性對照,也可以選擇陽性對照。沒錯,又陷入了評價體系不一的死胡同,你拿什麼當陽性,選什麼做評價指標。用西藥?劑型和給葯途徑不一,評價標準難選,怎麼選,選哪個,都是問題。選中藥?不對啊,中醫黑自己說中藥都沒驗證過,怎麼能做陽性葯。
某匿名用戶此時說,凡直接作為藥物效果的活性物質均作為計量指標作為被測定指標,所以可以拿薄荷醇做陽性。
去你的吧,指南里以偏概全的選取指標方式有多少代表性和依據,在這兒倒被奉為經典了,試問,薄荷醇能代表薄荷?做夢吧,薄荷醇是能疏散風熱,還是能清利頭目,還是利咽,還是透疹,還是疏肝解郁,話說指南還規定做陽性的機制要清楚,這些機制請證明給我看。
薄荷里有多少種化學物質,又有多少種具有藥理學作用,人類都還沒研究透徹吧。
b)中醫臨床方劑組方多樣,難以控制變數進行統計學分析
臨床上,中醫師開方會根據病人的情況進行加減,無論是藥味,還是用藥的劑量,都會進行調整,一人一方,千人千方,實際上是難以進行統計學分析的,因為沒有一個人的治療手段是完全相同的。
好了,有人說,復方經過加減之後,就不屬於原方了嗎,把變數納入統計不就得了。
暫且不提變數是怎麼納入統計的,說實話一個藥物的加減,就涉及到一系列物質基礎的改變。
這些全都不管,還有陰性對照或者陽性對照怎麼設置的問題。
這些也全都不管,變數納入統計,理論上好像是說得通的,實際上呢?
我暫且不提中醫在組方的過程中變數能夠多到如何程度,這個變數的維度又能大到何種程度,就單說一個原方和加減的變數,比如咳喘,西醫看來都是一樣的,咳嗽,呼吸急促等等,但是中醫認為,肺熱可以咳喘,肺虛也可以咳喘,甚至腎虛也可以咳喘,別說復方加減了,基礎方都可以完全不同,有的清熱,有的補虛,有的祛邪,有的固本,同樣是咳喘,別說在原方基礎上的加減了,藥味可以完全不同,怎麼比較。
有人又說,那就再細化,分門別類,一定要把原方一樣只進行加減的,放到一起評價。
好吧,還是暫且不提陰性對照或者陽性對照怎麼設置,這裡邊有太多的問題。
理論上確實又說得通,實際上呢,可操作性又有多大?
來看看六味地黃丸的組方吧,肝腎陰虛的經典方劑。
遇到陰虛火旺的,會加知母和黃柏,不好意思,知柏地黃丸誕生了。
遇到肺腎陰虛的,會加麥冬五味子,不好意思,麥味地黃丸誕生了。
遇到肝腎陰虛的,會加枸杞和菊花,不好意思,杞菊地黃丸誕生了。
遇到肝腎兩虧的,會加當歸和白芍,不好意思,歸芍地黃丸誕生了。
遇到腎陽不足的,會加肉桂和附子,不好意思,桂附地黃丸誕生了。
遇到目澀畏光的,會加一堆東西往目疾上走,不好意思,還有個東西叫明目地黃丸。
每一種,都是一個成藥,又是一個母方,原方的變種又是原方,小的原方的基礎上又可以加減,按理說,都應該分門別類,分別評價。
那就無限再細分?
又是理論上可行,動動嘴皮子而已,讓你去做你也不去,說實話,你做搞死你。
那就往糙了整,都合在一起,評價出「地黃丸」這個東西有效或者沒效,這個結論有統計學意義,但是在臨床上有意義嗎,人家臨床管你那麼多做什麼,我該組方組方,該用藥用藥,還是分門別類的用,這種沒意義的驗證試驗,做出來又有何用。
那就往細了整,每一個都分門別類,變數何其多也,分門別類有所窮盡,而變數無窮盡也,變數越多越不嚴謹,如此不嚴謹的情況下,你評價出來沒效就是沒效?
到最後的結果就是進退失據。
試問,一個「金標準」,在其不適用的,有無數問題的領域內,還能稱作金標準嗎?
中醫黑們天天叫囂沒做雙盲就是安慰劑,殊不知耍耍嘴皮子可以,操作性的層面上有那麼多的問題,有的無需做,有的根本做不了,聽說了個高端辭彙就可以黑了,到處嚷嚷著,你們去做啊,雙盲是金標準,你們不做就排除不了安慰劑效應,如同自己勝利了一般。
在理論層面打打滾而已,理論理解不理解都不知道,從來都在雲端飄著,從來都沒有腳踏實地過。
四、正確態度
首先要明確,「未證明有效性」不代表「一定無效」,「未排除安慰劑效應」不代表「一定是安慰劑效應」。
其次,你可以因其機制不明,而將其束之高閣,不去使用,沒問題,尊重你的選擇。
再者,也可以不管他到底怎麼起效,就算是通過安慰劑效應,只要有看得到的效果就去使用,趨利避害,這種選擇也沒有錯。
中醫藥的有效性怎麼驗證,在我看來,能做隨機試驗的,我支持,但是這個能做只停留在理論上,任何一個臨床應用的方劑,幾乎都能從可操作性上提出難以解決的問題。不能做,做不下去的情況很多,如果在可操作性都不具備的情況下強行做,那隨機對照試驗必定淪為統計學的遊戲。
那怎麼辦,我想那就做機制,看療效,畢竟雙盲不是證明有效性的唯一標準,效果有或者沒有,實事求是,具體問題具體分析,不持絕對化的觀點,趨利避害,取其精華去其糟粕。
只是別拿著雞毛當令箭,別拿著理論當實際,別用屁股決定腦袋,別中了「百無一用是書生」的魔咒,客觀理性認識一切問題而已。
相關回答戳這裡:
於貓:從機制不明的白菜說起
於貓:我的中醫相關係列回答-收藏夾
推薦閱讀: