斯坦福監獄實驗錯了嗎?

斯坦福監獄實驗錯了嗎?

來自專欄神經現實2,004 人贊了文章

本文編譯自Vox《The Stanford Prison Experiment was massively influential. We just learned it was a fraud.》。

津巴多本人對此事的回應:菲利普·津巴多:如何評價菲利普·津巴多主導的「斯坦福監獄實驗」被揭露造假?


斯坦福監獄實驗也許是整個20世紀最有名也最受爭議的心理學實驗。

在這項研究中,大學生們被指派在模擬監獄裡扮演「囚犯」或「獄警」。實驗開始不久之後,「獄警」就開始虐待「囚犯」了,這意味著外部環境會催生邪惡。這項研究的作者,斯坦福大學心理學教授菲利普·津巴多在結論中指出,如果將無辜的人放到特定環境中,給予他們超過他人的權力,這些無辜的人會開始濫用權力。而如果把人放進沒有權力的環境下,他們會被迫屈服,甚至瘋癲。

許許多多的心理學入門教材都引用了斯坦福監獄實驗,往往都不加評判。它是大量電影、紀錄片和書籍、電視節目和國會證詞的主題。

然而,最新曝光指出,其研究結果其實是錯的。這不僅是因為倫理問題和具體數據的缺失,更是因為欺騙。

Medium上一篇新發表的文章揭露了這一切。這篇文章考察了此前未公開的津巴多錄音,採訪了當年的被試,最終給出了令人信服的證據:「獄警」的殘忍其實是受引導而得出的。文章還指出,實驗當中最使人難忘的瞬間,也就是一位囚犯蜷縮著放聲尖叫,其實是囚犯的表演。其中一位「獄警」 說,「我把它當成了一次即興練習,我以為自己當時在做研究人員希望我做的事。」

公開錄音:

傑夫(津巴多的學生, 扮演典獄長的角色):基本上,你一直是有點在背景里不活躍。這一部分是我的問題,因為他們點名的時候,你說你想坐在外面,我確實同意了。諸如此類的。但是我們挺希望你能活躍一點積极參与。因為獄警必須心裡明白每一位獄警都應該變得「強硬點」。然而到目前為止……

獄警: 我確實不怎麼強硬。

傑夫: 所以呀,你必須得嘗試變得強硬起來。

獄警: 是嗎,我感覺拿不準。

傑夫:誒,這事兒是這樣的,我說的強硬就是你得為人堅定,而且必須要干預採取行動,諸如此類。這個實驗能不能成功,獄警的舉動十分重要,因為我們的目標是讓這個東西看起來像一個監獄,而它很大程度上靠的就是獄警的行為。

斯坦福監獄實驗的結果多年來一直在受到仔細審查,許多人認為,比起嚴謹的科學,這更像是戲劇化的展示,是學術界的真人秀。(何況,這個實驗進行到一半就中斷了。)現在,這一新的曝光又激起千層浪:拋開其中的欺騙成分不談,這也足以讓實驗原本的結論變得無效。它不再能證明權力位置本身可以導致殘忍,而是表明權威人士如果想要殘忍行為,可以說服別人聽從他。

「底線是:服從並不是天然的、盲目的、無可避免的。」社會心理學家傑·巴維爾(Jay Van Bavel)發推說。「津巴多不但把這一點搞錯了,而且他的公開言論還誤導了成百上千萬人。」

「我們必須停止頌揚這項研究了。」人格心理學家辛明·瓦沙(Simine Vazire)發推表示,「這完全是反科學的,把它從教科書里刪除吧。」

很多其他心理學家也表達了類似觀點。

最近,許多經典實驗的結果都被曝光是錯誤的,它們要麼作了假,要麼已經過時。近年來,社會科學家開始面對舊研究都需要重做的事實,這就是「重複危機」。但是滯後現象一直存在,存在於大眾意識中,以及心理學的教材和教學中。現在,是時候解決滯後了。

心理學的很多經典研究都在被重新評估

斯坦福監獄實驗並不是唯一被重新審查、評估和曝光的研究。最近,科學記者吉納·佩里(Gina perry)調查了聲名狼藉的「強盜洞」實驗。在這個50年代進行的實驗里,研究者操縱夏令營里的小男孩們形成敵對的派系。佩里發現,「強盜洞」其實是一次重複,上一次實驗失敗了,而研究者從未在論文中提起過此事。這是明顯的遺漏。將否定假設的數據扔掉,只公開支持假設的數據,這樣的做法完全錯誤。

佩里也揭露了另一項早期的重要心理學研究:米爾格拉姆電擊試驗。權威人物讓被試對看不到的可憐人施加看上去致命的電擊。她的調查發現,研究者沒有遵循研究設計,他們還有可能脅迫過被試。

其他研究的誠實性和方法論也受到重新評估,例如90年代的一系列「棉花糖實驗」。這一實驗指出,幼兒早期的延遲滿足能力與後期的人生成功有相關性。新的研究發現,假設棉花糖實驗有更大的樣本數量、更好的實驗控制,新結果並不符合原結果。

過去這幾年,一些心理學理論被重新清算了一次,甚至波及到了整個社會心理學領域。

在嚴謹的重複實驗中,很多心理學理論都遭到了反駁。心理學家現在意識到,假陽性而非不確定的結論更有可能讓論文順利發表。而且他們也明白,幾年前常規的實驗方法已經不再嚴謹。舉個例子,以前科學家發表的研究樣本通常都是五十名本科生。今時今日,科學家認識到這就是造成假陽性的因素,他們會擴展成百上千的大樣本量,並從更具代表性的被試群體中抽取樣本。

不過,在很多這樣的案例中,科學家修正了錯誤,繼續致力於研究人性。在一些案例里,對於有缺陷的原實驗,重新檢視依然十分有價值。米爾格拉姆電擊試驗的缺陷確實存在,但至少它的研究設計,也就是讓被試對別人施以電擊(未真正實施)懲罰別人在記憶測驗中不及格,時至今日也可基本重複,當然倫理問題上也需要稍微改進。

米爾格拉姆的研究結論似乎經得住推敲:在最近一項研究中,權威人員的要求確實能成為電擊別人強有力的理由。然而,這有可能是因為所謂的「抽屜文件效應」——沒能成功重複的結果得不到發表。

至於重複斯坦福監獄實驗的嘗試則是一團糟。

科學裡經常出現的事情是,一個觀點最初亮相的版本被人銘記——不管是在學術圈裡,還是大眾文化里。但科學不該是這樣的!科學進程百折多舛,反覆無常。當我們溝通時,應該摒棄任何重大研究都能經受時間考驗的想法。科學家們都明白這一點,但研究機構往往不支持他們重複舊的實驗,只支持他們追求能夠吸引注意的新的科研項目。(記者也是其中一個原因,他們把一些無足輕重的小研究炒得天花亂墜。)

謝天謝地,還有一群科研學者,他們致力於將心理科學變成一門更可靠的科學,爭取所有實驗能夠重複。他們甚至還成立了心理科學改進協會來處理這些問題。

後續研究的結果大多比原來的研究更少些戲劇性,但是對於探索真相卻更有用。其實並不是說斯坦福監獄實驗在教學中不應佔有一席,它本身就是很有趣的歷史。像津巴多和米爾格拉姆這樣的心理學家都受到第二次世界大戰的影響,他們的實驗某種程度上都在嘗試解決納粹崇拜的問題。這個問題十分重要,心理科學中不計其數的研究都在圍繞它。

教科書需要更新

過去幾年來,心理學早已發生翻天覆地的變化。很多用來教學的研究成果都受到嚴格審查,被發現不實。不幸的是,教科書卻沒有及時更新。

一份2016年發表在《當代心理學》的研究指出:

「入門教材很難準確地描繪爭議性話題……入門教材的讀者可能在這些話題上被無意中誤導。」

這項研究的作者們收集了24本暢銷的心理學導論書,並著眼審視書中如何討論12個爭議性理論觀點或迷思。

這些觀點——比如成見威脅和莫扎特效應,抑或是千禧一代的「自戀流行病」——並不是都被證偽了,但確實有可信的重要研究對它們提出了質疑。這些觀點裡也包括了一些都市傳奇,比如大腦只用了10%的潛能的說法,或者所謂的圍觀者們在一位女士被殺害時拒絕伸出援手的假故事。

研究人員隨後對教科書處理爭議性話題的作法作出評定。結果顯示,教科書在很多話題上都有大量令人擔憂的偏差。

但為何這些教科書中不包含更多的合理質疑呢?畢竟,重複實驗是任何科學體系的基石。

有觀點認為,教科書的任務是覆蓋廣泛話題,本來不應該被看成是具體科學爭論的權威觀點。但是這可能不是唯一的原因。該項研究作者認為,教科書編寫者其實在自賣自誇心理學這門學科,吸引更多人來學習它。

該研究也不是沒有缺陷的: 其一,作者們指出,他們主觀選取了12個話題,還有更多問題沒有得到分析。其二,研究所使用的教科書是2012年春季出版,或許從2012年到2016年中它們已經更新換代。

最近,我在推特上問教心理學導論的教授們如何處理教科書中的矛盾之處。他們的回答相當簡單。有人說他們就決定不用教科書,用單獨的論文來授課(還給學生省錢)。荷蘭埃因霍芬科技大學的教授丹尼爾·萊肯斯(Dani?l Lakens)給出的解決方式也很簡單:「就直接指出錯誤、過時和不能復驗的地方唄。」他還給我們提供了他上課用的PPT。

據傳,伊利諾伊州立大學教授喬·希爾加德(Joe Hilgard)說他覺得學生更喜歡「知道教科書所不知道的「前沿感」。(而且,誰真的認真看大學導論書啊?)

似乎這種教學風格在跟上心理學的發展腳步。近日,一份對262位心理學教授(不具備完全代表性)的研究發現,超過50%的教授都認為重複問題對教學造成衝擊。另一方面,40%的教授覺得教學未受影響。所以,學生有沒有得到最近心理學大清算的相關信息,完全取決於自己的教授。

假設教科書和教師執意不提重複問題的話,我認為他們並非在抬高心理學,反而是貶低了它。傳授解決「重複危機」的辦法,實則是在教導學生自我修正才是科學的本質。這也潛移默化地培養了他們的科學觀,科學應該是可重複的。

理解人類行為很難。探淵索隱,路漫漫其修遠兮。不管如何,都應該激發學子向上的動力,成為正確的新生代科學家。

《當代心理學》那篇論文的作者認為,「教科書或許錯失了打破迷思的機會」。而這應該是理想情況下,年輕科學家應當學會的:如何打破迷思,如何追根探底找到真相。

翻譯:夏天;校對:EON;編輯:Ent

推薦閱讀:

TAG:心理學 | 熱點話題 | 可重複性reproducibility |