科研中慎防這十種邏輯謬誤
(長文預警:全文約4700字,大概需要15-20分鐘來閱讀)
最近在整理舊文檔時,偶然發現一份以前讀博時製作的PPT,內容有關於科研的方法論。其中的知識要點,其實來源於不少人都很討厭很頭痛的研究生「政治課」。然而我們學校的政策是,只要不離題太遠,各位任課老師可以任選領域或角度授課(然而選課分班時學生完全看不到,所以都是胡亂選的)。恰好當時我選到的班,是由一位新上任的年輕教師代課。由於她完全不懂「套路」,於是乾脆拿她的研究領域來上課,即科學哲學。然而就是這樣一門胡亂選上的課,讓我受益匪淺。學期結束後,我還主動聯繫了很快被調走的任課老師,在她的推薦下,開始閱讀邏輯學和科學哲學的書籍。
科研是一種理性思維的活動。科學家通過觀察與實驗,描述客觀世界,獲得科學事實。常見的科研邏輯有分析與綜合,歸納與演繹,比較與類比。然而,並非每一種邏輯思維方法,都能保證獲得的結論為真。為了避免落入陷阱,我們需要認識一下,科研中常見的邏輯謬誤都有哪些。
一、訴諸權威
從字面上,訴諸權威非常容易理解,即以專家或權威所說的話作論據的根基。通常情況下,當某個領域的權威,在嚴密的邏輯、實驗的基礎上,對他所擅長的領域做出主張,我們是可以其援引為論據。然而,當權威所做出的主張超越了其研究領域,或者其論證過程並沒有基於理性論證,那麼將該權威做出的主張作為論據是無效的。
在實際科研中,往往可以看到有些人將發表在高影響因子雜誌的文章拜為金標準。雖然科學論文基於同行評議,但往往僅有三位審稿人把關(而審稿人和作者之間可能還存在利益關係)。假如不仔細閱讀原文並推敲其中的邏輯,而只是生硬地照搬其中的數據和結論,那麼就存在犯錯誤的風險。進一步說,科學研究中往往是存在爭議的,假如僅聽信其中一派的聲音,依然是不理性的做法。
此外,和訴諸權威相關聯的邏輯謬誤還有:訴諸傳統(認為傳統的即是正確的,典型形式如「自古以來……因此……」,「大家都這麼做……因此……」),以及訴諸時代(新的即是好的,舊的即是壞的)等。
二、肯定後件與否定前件
在理解這種邏輯謬誤前,我們先來簡單理解一下什麼叫演繹推理。
演繹法,是一種由一般到特殊、前提和結論之間蘊含著充分性或充分必要性關係的推理。它在結構上由前件p和後件q兩個部分組成。常見的演繹法有肯定前件及否定後件兩種。(注意,小標題的謬誤和這裡是相反的)
肯定前件:若p,則q。因為p,所以q。舉個例子,寫成經典三段論式:
強酸(p)可以腐蝕皮膚(q);
因濃硫酸是強酸;(肯定前件p)
所以濃硫酸可以腐蝕皮膚。
否定後件:若p,則q。非q,所以非p。舉例如下:
強酸(p)可以腐蝕皮膚(q);
這份液體不能腐蝕皮膚;(否定後件q)
所以它不是強酸。
而反過來,肯定後件和否定前件是經典的演繹推理謬誤。比如這個命題:抗癌藥(p)能夠促使癌細胞死亡(q)。(註:無論機制是直接的還是間接的,無論以何種形式死亡)
我們可以說,如果一個化合物沒有辦法使癌細胞死亡,那麼它就沒有可能成為抗癌藥(否定後件)。但如果肯定後件,那麼就會得到「凡能夠促使癌細胞死亡的化合物都能成為抗癌藥」的結論。然而,你在培養基中撒入大量食鹽,或倒一杯可樂,也能把癌細胞弄死,然而,食鹽和可樂卻不是抗癌藥。而如果寫成否定前件,則會變成「不是抗癌藥的化合物就無法弄死癌細胞」。然而,就像剛才所說的食鹽和可樂,或者直接開一槍,照樣能把癌細胞弄死。
題外話:演繹推理除了上述提到的方法之外,還有諸如真值傳遞、真值合併、雙重否定等很多種展開的邏輯形式。有興趣的可以自行搜索閱讀。
三、以偏概全
和演繹法相對應的邏輯方法是歸納法。它是一種由特殊到一般的推理過程。比如說,這隻烏鴉是黑的,那隻烏鴉也是黑的,觀察了一百隻烏鴉還是黑的,所以得到結論:烏鴉都是黑的。歸納法雖然是一種有力的邏輯推理方法,但與演繹法(一般到特殊)相比起來,它並不能保證結論總是為真。
以偏概全是使用歸納法中常見的謬誤,即使用過小的樣本量,或者不具代表性的樣本,歸納得到一個錯誤的結論。比如說,用一張什麼偏方,治好了某個人的某種疾病,如果就據此得出「這張偏方具有治療該疾病的作用」,那就錯了。現代臨床醫學研究,總是強調大樣本、多中心、隨機、雙盲和對照試驗,目的就是避免在運用歸納法時陷入以偏概全的謬誤。
在基礎研究中,我們也應當注意使用多種模型,多種方法來獲得多角度的證據,以支持我們的結論。比如為了得到某化合物對EGFR擴增的腫瘤均有抑制作用的結論,在in vitro實驗中,我們應當尋找多種EGFR擴增的細胞系進行測試,同時還應該在無EGFR擴增的細胞系中過表達這個基因,以及在EGFR擴增的細胞系中干擾或敲除這個基因,觀察是否出現相應地影響藥效的作用。而如果為了得到某化合物對腫瘤細胞的殺傷作用不依賴於某特定的遺傳背景,同理,我們應當選取多種不同遺傳背景的細胞系進行測試。
四、事後歸因
字面上,我們很難去理解事後歸因的意思。個人認為是中文翻譯過程中的問題。它的拉丁文原文是「Post hoc ergo propter hoc」,英文翻譯為「After this, therefore because of this」,簡稱「Post hoc fallacy」。它的真實意思是,B事件發生在A之後(即A在B前),因此A是B的原因。這種謬誤還能表達成「A發生在B之前,因此避免A則能阻止B」的形式。
說白了,非常簡單。兩件事情先後發生,先發生的未必就是後發生的原因。舉個例子,十年前你不小心踩了我的右腳,今天我發現右腳骨折,難道可以說今天的骨折是當初你踩我一腳所致?
這看起來相當荒謬,然而套在科研中,這種例子在低檔次的文獻中卻屢見不鮮。比方說,有人用化合物處理腫瘤細胞,數小時後發現某信號通路受到抑制,兩天後細胞死亡。然而在得到其他證據之前,我們不能說,這個化合物就是通過抑制這個信號通路使腫瘤細胞死亡的。這種情況下,我們至少應該通過其他數種方法來證明,比如用RNAi抑制這條信號通路,觀察是否出現同樣的表型,以及過表達這條信號通路的蛋白,觀察能否逆轉表型等。
五、相關即因果
相關不蘊含因果,是統計學中經常強調的概念。無論兩個變數之間存在如何緊密的相關性,在獲得其他證據支持之前,我們絕對不可以輕率地下結論,認為這兩個變數之間具有因果關係。
舉個例子,隔壁老王生了個孩子,同時種了一棵樹。孩子和樹都隨著時間的推移而長高,在一定時間內,如果使用相關性分析,可以得出這兩個變數具有相關性。然而我們都很清楚,孩子長高和樹長高之間,並不具有因果關係。
儘管道理如此淺顯,但依然有無數人往這個陷阱裡面跳。這種謬誤常見於對大範圍調查數據的誤解。維基百科上舉了一個非常著名的例子:曾有流行病學調查數據顯示,接受激素替代療法的女性,同時具有較低的冠心病發病率。這一度讓人們認為,可以使用激素替代療法來預防冠心病。然而在隨後的臨床試驗中卻發現了相反的結果。後來仔細審查數據發現,有條件接受激素替代療法的女性,通常來自於社會、經濟地位較高的群體,而這類人往往較為注意飲食和鍛煉,這個因素可能使冠心病發病率降低。
六、證實性偏見
這種謬誤是指,傾向性地選擇對自己有利的論據,而無視不利的證據。這種邏輯謬誤在日常生活中相當常見。比如覺得星座運勢說得好准,覺得暗戀對象的一舉一動都是為了吸引自己而做,諸如此類。
新手做文獻綜述時,容易犯證實性偏見的錯誤。許多研究領域,往往存在多種假說多方爭論。比如抗氧化劑對預防腫瘤是否有正面作用,又或者反而促進了腫瘤的進展,目前依然存在爭議。因此我們在做文獻研究時,必須遵循兼聽的準則,而非僅挑選出對自己立場有利的文獻來支持自己的觀點。尤其是在最終論文寫作時,必須合理地引用及解讀另一面的研究證據,如此才能保證理性客觀。
七、稻草人謬誤
與證實性偏見具有關聯性的,是稻草人謬誤。它是一種曲解所要否定的論點,重新樹立一個毫不相關的靶子(稻草人)並加以攻擊,以聲稱推翻了對方觀點的邏輯謬誤。
比如以下邏輯:產前診斷是反人類的,因其意圖是扼殺有缺陷的胎兒。很顯然,這個邏輯故意歪曲了產前診斷的本意。又比如這樣的說法:腫瘤耐葯的機制太多太強了,如腫瘤血管生成除了依賴VEGF之外還有其他許多機制,因此VEGF的單克隆抗體藥物是沒有作用的,沒有任何研究價值。這個邏輯,在前半段是正確的,腫瘤之所以難治,確實是因其存在多種耐葯途徑、多條代償通路。然而,VEGF依然是誘導血管生成的重要因子之一,片面地以一句「代償通路多因而沒有研究價值」將該療法全盤否定,顯然是不理智的。
新手在寫作論文時,尤其要注意不要陷入打擊稻草人的謬誤之中。比如當我們發現了一個新的治療靶點時,千萬不要通過否定、甚至扭曲前人的研究來抬高自己的價值。
八、濫用統計
有句名言:「世上有三種謊言,謊言、該死的謊言和統計數據。」從理性的角度來講,將統計數據歸為謊言,其實也是犯了所謂的稻草人謬誤。數字本身並不會說謊,而這個說法之所以會出現,其實是對統計數據的誤讀導致的。
正如前文第五點所說的,在統計中,無論兩個變數存在如何緊密的相關性,在獲得更進一步的證據之前,我們絕不可以說這兩個變數之間存在因果關係。
然而,濫用統計還有許多形式。
比如說,某個藥物能使血壓平均值降低1 mm汞柱,因為P < 0.000001,所以藥效卓絕。然而,統計學假設檢驗中的P值,無論有多麼小,永遠不能用以回答任何生物學意義的問題。
又比如,用平均數來描述偏峰分布的數據,Y軸不從零開始從視覺上誇大組間的差異,故意截取一小段X軸從視覺上營造相關性,等等。
九、滑坡謬誤
簡單說來,滑坡謬誤就是一種認為「可能之可能依然可能」的錯誤認識,即不合理地使用連串因果關係,誇大了每個環節的因果強度,以達到某種意欲之結論。
舉個例子:不讀書的人沒文化,沒文化的人不講理,不講理的人激化社會矛盾,社會矛盾激化會引發戰爭;為了避免戰爭,應該把不讀書的人判死刑。我們可以看到,這個推理過程,每走一步,都存在著犯錯誤的風險,越往後推,錯誤的幾率就會越來越大,最終得到荒謬的結論。
又比方說,發現了某個化合物能夠誘導EGFR的磷酸化。因為EGFR的磷酸化能夠激活PI3K,從而激活AKT;AKT能夠通過抑制GSK-3β,上調Cyclin D1,最終促進腫瘤的增殖,因此該化合物是個促癌物質。
倘若科研可以通過這樣的推理來做,那該有多方便。然而事實上,並不是所有的癌症均能由EGFR驅動,EGFR的磷酸化也未必能激活PI3K/AKT信號(如PTEN在正常情況下可以阻斷意外或者過度激活的信號)……
十、循環論證
這種邏輯謬誤是指,用來證明論題的論據本身之真實性,要依靠論題來證明。也就是說,把一個尚待解決的問題當成了前提,當承認了前提,就相當於承認了結論。典型的例子如:長得胖是因為吃得多,而吃得多的原因是長得胖。形式上和循環論證相似的有循環定義、循環解釋和循環因果等形式。比如說,「什麼是蘋果-是蘋果樹結的果實;什麼是蘋果樹-是能結蘋果的樹」這樣的邏輯,便是循環定義。
這種邏輯謬誤非常低級,通常可以一眼看穿。然而就連大名鼎鼎的牛頓,也曾犯這種邏輯謬誤。他曾用密度來定義質量,然而密度本身卻依然需要質量來定義。(不過,質量定義這個話題迄今尚未完全終結,這裡也並非苛求前人。)
科學發展到現在,不少概念都是有嚴格定義的,即使存在未成型的術語或者措辭,在既定的範式中,也有一套約定俗成的界定範圍。這也為交流和研究帶來便利。但是,當發現一個新現象、產生一個新的概念時,就需要注意避免落入循環論證的圈套。比如,在多年以前,在尚未明確線粒體膜電位的丟失與細胞凋亡之間的因果關係之時,我們不可以說:細胞凋亡是因為線粒體膜電位丟失,而線粒體膜電位之所以會丟失,是因為細胞發生了凋亡。又比如:這個細胞發生了分化,是因為表達了這個蛋白標記,而表達了這個蛋白標記,是因為細胞發生了分化。這同樣也是顯而易見的循環論證謬誤。
推薦閱讀:
※如何合理安排讀博的四到六年?
※媒體稱中國科研經費超過五千億但成果寥寥,原因何在?
※科學家曾想隱瞞比氫彈威力大的夸克炸彈 最終發現是杞人憂天
※找博士 position 的方法
※如何高效讀文獻?Science 10 位學者寶貴經驗分享