著名「心靈雞湯理論」被證明不可重複:面帶微笑不見得讓你更開心
你也許聽過,不管什麼時候,做出微笑的面部表情,會讓你的心情變得更好。這並不是雞湯,而是心理學界公認二十多年的正統理論——然而最近的重複實驗推翻了這一理論。我們仍要向前看,畢竟在通往嚴謹科學的道路上,不破不立。
來源 Slate / Daniel Engber
編譯 徐寒易 張士超
1988年,德國維爾茨堡社會心理學家 Fritz Strack 做過一個經典實驗:面部動作可以改變心理狀態。面帶微笑會讓人快樂,苦著臉會讓人情緒不佳——情緒不僅可以內而外,也可能由外而內,由自身的動作引發。二十多年來,作為社會心理學的經典研究之一、「社會啟動」(social priming)理論的典型代表,這一直是心理學公認的正統理論。
然而2013年春天,63歲的 Strack 在一系列私人郵件提出了一個大膽的建議:如果懷疑者想要檢驗什麼東西,就應該讓他們去檢驗。在科學領域,「論述的質量及其實證檢驗才是科學著述的根本。」
在 Strack 提議之時,社會心理學領域正處於困境。著名的社會心理學家 Diederik Stapel 深陷造假醜聞,而「社會啟動」的諸多研究,也在仔細的審查中暴露出問題,許多人希望對社會啟動領域的論文進行大規模驗證。
所謂「啟動」,是指人不會意識到一個在短時間內(比如3毫秒)呈現的信息,但是大腦接收到信息,對其進行了處理。「社會啟動」 這個概念本身就很微妙。心理學實驗依靠精心設計的實驗條件來反映人行為的細微變化,實驗設置的輕微改動,或是實驗室新手犯下的小錯誤,都有可能扭曲數據。假設有一個或者幾個實驗室無法複製前人的研究,那能說明什麼問題呢?這會改變人們對於科學的看法嗎?
諾貝爾獎獲得者、心理學家 Daniel Kahneman 對《自然》(Nature)轉述了他對「啟動」研究的看法:他希望鼓勵該領域專家進行複製研究,但是他們卻不肯;這就「誘使人產生這樣的聯想,啟動效應的信奉者害怕看到複製研究的結果」。
於是 Strack 說,讓他們去檢驗他的那項教科書式的研究結論吧。
***
那麼,Strack 的理論具體是什麼?
在不久前的里約奧運會上,攝像機拍到運動員菲爾普斯皺著眉頭的樣子。菲爾普斯是不是在進行什麼神秘的準備活動呢?
菲爾普斯「王之怒視」
一個神經科學家解釋道,他可能是在用「面部反饋」(facial feedback)理論的方法,通過扭曲面部肌肉來激活杏仁體,為比賽做準備。多年來這一直是自我調節的標準方法。想要感受什麼情緒,就先做出那個表情,接著那種情緒就會自然而然地產生。
這個理論可以追溯到達爾文時期。達爾文在1872年提出,情緒表露出來的動作和表情可以進一步強化這種情緒。那些在生氣的時候動武的人會更加生氣。達爾文把這個理論歸功於法國腦解剖學家 Louis Pierre Gratiolet。此人後來進一步提出,動作和表情不僅僅可由情緒觸發,甚至可以反過來觸發情緒。
這個關於身心一致性的理論在經過美國心理學之父,心理學家 William James 以及之後的心理學家的一步步擴充和演繹之後,內涵變得更為豐富。上世紀60年代,有心理學家提出,其機理在於從現象中尋找原因:人們感覺到出汗,會觀察環境是否太熱了,同理人感覺到笑的動作,也會推想自己是不是很高興。
後來研究者實驗驗證發現,面部反饋似乎真能改變人的情緒。但是沒人清楚面部反饋過程究竟是如何發生的。
80年代,Strack 在伊利諾伊大學做博後期間注意到這個問題。他發現,此前所有的面部反饋研究都有一個共同的缺陷:參與者很容易猜到實驗目的。如果實驗人員讓你笑,你多少能了解他期待你感受的情緒。這樣一來實驗數據就受到了污染,因為催生實驗結果的原因可能並不是面部反饋本身,而是參與者對實驗目的暗示的順從。Strack 和同事 Leonard Martin 知道,自己的實驗必須要更加高明。
他們想到,可以讓參與者用牙齒咬著一支筆,或是一支溫度計。用牙齒咬著筆的人,嘴巴必須張大,看起來就像在假笑!但如果讓他們用嘴唇吸著筆,他們的眉頭就會不自覺地皺起來,看上去很不高興。這樣一來,參與者根本想不到實驗目的是什麼。
他們告訴參與的92位本科生,這是一個關於「精神運動協調」,以及有身體殘疾的人是如何寫字和使用電話的實驗。接著學生們用牙齒咬著,或是用嘴唇吸著筆做了一些無關的任務,比如用鉛筆把點連起來,或是把一段文字中的母音都標出來;最後他們評價了一個卡通的搞笑程度。
他們的結果發現,那些用嘴唇吸著筆從而被迫做出皺眉表情的人,給卡通片的平均分是4.3;而那些用牙齒咬著筆從而被迫做出微笑表情的人,給卡通片的評分卻是5.1。最重要的是,實驗中沒有任何學生覺察到自己的面部表情被操縱了。他們根本不知道研究的目的是證明表情對卡通評價的影響。
這個聰明的小伎倆看起來一勞永逸地解決了面部反饋的研究難題。很快有記者來追問他,是否能用這個方法治療抑鬱症,不過 Strack 說,要讓一個人快樂,有的是更好更強力的方法。
在接下來的20年里,有許多其他實驗室運用了這個方法並進行了改良。有人把一對高爾夫球釘(放高爾夫球的支架)分別粘到參與者的眉毛上,然後讓他們把兩個球釘靠在一起,使得參與者被迫做出皺眉的樣子。似乎這個動作能夠讓參與者感到悲傷。在另一個實驗中,研究人員讓參與者用5種方法銜著筆,以使後者做出5種不同的笑容,比如禮貌的笑、假笑、更自然的擠眼笑等等。這個研究稱更真實的笑容讓人感到更快樂。
Strack 和 Martin 的方法後來得到了各種稀奇古怪的應用,甚至進入了實踐操作領域。有人猜測,如果面部表情能夠影響一個人的心理狀態,那麼微笑是不是能夠治好社會痼疾呢?有一項研究給出了肯定的回答。2006年,芝加哥大學的研究人員發現,如果你讓人們微笑(讓他們兩排牙齒間夾一支筆)的話,他們看到黑人照片時的種族主義傾向會減弱。2013年,西班牙的一個研究團隊發現,牙齒咬著筆的「笑容」能夠讓人在畫畫任務中變得更加有創造力。Strack 自己甚至在一個實驗中證明,如果讓學生皺起眉毛來的話,他們就會覺得明星也並不是那麼有名。甚至 Strack 本人曾一笑置之的抑鬱症治療問題,也頗有建樹——最近一些隨機臨床試驗發現,注射肉毒桿菌毒素消除皺紋,可使病人從抑鬱中恢復。
***
回顧這些年的各式研究,Strack本人對該理論深信不疑。這就是為什麼三年前他主動請纓的原因。「他們想要複製些研究,所以我建議他們重複我的面部反饋實驗,」他說,「我有自信肯定能得到積極的結果,所以我並不覺得這事兒會變得多麼有趣。好啊,他們想做那就做吧,我沒有問題。」
負責這項面部反饋複製計劃的是荷蘭阿姆斯特丹大學的 E. J. Wagenmakers 。他對情緒以及情緒的表達沒什麼興趣。「我的興趣主要在方法上面,」,科學是人做的,「是人就有可能會有各種偏見。我想從整體上講有理由持懷疑態度。」
複製出研究的機會有多大呢?
「我估計有30%吧!」
從某種意義上講,Wagenmakers 的估計算是樂觀的。因為過去的許多複製計劃都變成了災難現場。比如,2008年研究者曾試圖複製100項心理學實驗,但是其中只有39%的實驗能被複制。心理學領域的知名期刊《心理科學觀點》(Perspectives on Psychological Science )曾經發表了「註冊複製計劃」(Registered Replication Reports,RRR),號召全世界的實驗室複製幾項實驗,然後把數據整合分析。結果,4項實驗中已經完成的3項均告失敗。
2015年4月,複製實驗正式啟動。
Wagenmakers 的團隊招募了來自8個國家、17個實驗室的科學家。每個實驗室都複製了 Strack 的原始程序,實驗參與總人數達到2000人。研究方法也有一些更新:參與者通過觀看預錄製的視頻獲得實驗指導語,而且實驗全程都會被拍攝記錄下來,看看他們到底有沒有用正確的面部表情銜筆。
實驗數據採集,數據分析,報告撰寫和編輯又花了16個月的時間。結果終於在今年8月18日出爐了。
情況並不妙。
在一半的參與實驗室中(17個中的9個),擺出微笑表情的參與者對卡通搞笑程度的平均評分略高,比擺出皺眉表情的高0.1到0.2分(總分10分)左右。但是在 Strack 的原始實驗中,微笑者和皺眉者的分數差異達0.82分。在其他實驗室的數據中,微笑的效應看起來是相反的:微笑的參與者比皺眉者的評分低0.1到0.2分。當 Wagenmakers 把所有數據綜合起來以後,微笑的效應消失了。微笑者和皺眉者的平均評分的差異是0.03分,這可能是噪音或隨機性導致的。
「我真希望這項研究能被複制出來,」 Wagenmakers 表示,「不幸的是,結果並非如此。」
***
Strack 並不後悔讓RRR 來重複自己的研究,但也沒有把複製研究的結果太當一回事,「我看不出我們從這個研究中能得到什麼有用的信息。」
兩年前,當這項複製研究計劃在實施的過程中,Strack 和另一位社會心理學家 Wolfgang Stroebe 寫了一篇批判該複製計劃的論文,名為「所謂的危機和完美複製的錯覺」(The Alleged Crisis and the Illusion of Exact Replication)。他們在文中提出,類似於 RRR 一類的項目實際上反映的是一種「認識論誤區」,因為完美地複製一項古老的研究是不可能的,人會變,時間會變,文化也會變。任何社會心理學家不會兩次踏進同一條河流。他們說,即使再做一次同樣的實驗,消極的結果也沒什麼意義,因為它並不能解釋為什麼複製研究沒有成功。
所以,當 Strack 重新審視這項複製研究的結果時,他並不認為自己的實驗失敗了,而是覺得另有隱情。畢竟,有9個實驗室的數據是在正確的方向上。而其他8個實驗室得到了相反方向的數據。他認為,為什麼非要把所有數據平均從而算出效應為零呢?為什麼就不能弄明白,兩批數據之間的本質差異是什麼?或許一半的實驗室無法得到微笑效應是有原因的。
Strack 對複製項目的評論和複製研究報告一同發表出來。Strack 的評論中挑出了一些複製研究的問題。比如,研究排除了600名參與者的數據,這差不多是總參與者人數的四分之一。根據 RRR 的說法,這些人被排除的原因是因為他們銜筆的姿勢不正確,或打分太飄。Strack 認為另有原因,很多受試者是心理學的學生,或者已經猜測到實驗目的。畢竟,這個實驗在該領域太有名了。
另外他還指出,80年代的卡通片素材未必能「在當代本科生中引發相似的心理效應」,他在複製項目初期就和 Wagenmakers 提到過這個問題,但是對方沒有理睬。不過,RRR 團隊在實驗開始前曾經讓另外120名阿姆斯特丹大學的學生評價過該卡通片的搞笑程度,發現評分與過去基本相同。
Strack 接著提出了攝像頭的問題,因為它們會讓參與者開始關注自身的行為,並壓抑自己的情緒。最後,他還對複製研究者的偏見存在疑問,似乎他們是有意讓結果對其不利,因為樣本最大的那個實驗得到的結果是積極的。
***
沒有調查就沒有發言權,讓我們回溯到1988年,看看 Strack 最初的論文。該論文包含兩次研究,第一次研究得出0.82的差距之後,兩人甚至不敢告訴當時的老闆。之後他們又優化細節,進行了第二次實驗。換句話說,這個實驗 Strack 自己是重複過的。
在 Strack 的第二版實驗中,他希望把參與者的客觀評價和主觀情緒感受分離開來。參與者要回答兩個問題:第一 ,這個卡通的搞笑程度如何;第二,他們感到多有趣?第一個問題中皺眉者對卡通的評分反而比另一組高出0.17分。但是第二個問題的結果似乎複製出了此前的研究結果。微笑者感受到的有趣程度的分數比皺眉者高出整整1分。
那麼, Strack 本人對此怎麼看呢?以論文中的敘述看來,他認為重複是成功的。他說,他預測第二個問題-「這個卡通讓你感到多有趣?」會不同於參與者對第一個問題的回答,而且事實的確不出他們所料。
但是事後看來,這個後見之明——問題問法的改變本身就是一個值得警惕的現象。心理學的基礎證據至少是有一些裂縫的。這個實驗的存在本身就證明最初的結論並不穩定。為什麼其他人沒有注意到呢?
***
這項複製研究的失敗有多糟糕呢?這也許取決於你看這個新聞時的表情了。如果你心情不錯——因為你嘴裡銜著一支筆,嘴巴咧到耳朵邊上,那麼你可能並不會覺得這是個大問題。說不定你會同意 Strack 的觀點,認為卡通片,攝像頭或是樣本本身有問題。但不論如何,有一個事實無法否認:銜筆實驗的結論是無效的。
或許你的看法更加悲觀。或許 Strack 的原始論文有問題,或許銜筆這個方法本身就存在重大缺陷,甚至每個用這個方法的實驗都有問題。現在你的額頭開始皺起來了:如果問題發生在更深的層次,怎麼辦?如果名氣如此響亮,影響力如此巨大的銜筆研究都無法複製,那麼其他不出名的研究會怎樣?或許表情對情緒有直接作用的觀點本身就是錯誤的?或許達爾文從一開始就錯了!
如果面部反饋領域也受到「文件夾效應」的影響那怎麼辦?那些研究結果和 Strack 一致的可以被發表,而不一致的研究就只能被束之高閣了。如果情況真的如此,那麼 Strack 引用的後續研究都將是虛假的。
實際上,銜筆複製實驗的失敗並不令人吃驚,因為幾乎每個大型心理學複製計劃都以失敗告終。關於具身認知(embodied cognition)的其他重磅理論,比如權利姿勢(指雙手叉腰會讓人感到更有自信),還有麥克白夫人效應(指感到愧疚時對「清潔」相關的概念會更加敏感)的複製研究都沒有得到支持性的結果。
心理學是不是岌岌可危了?那麼認知神經科學呢?其他科學領域呢?
這就是可複製性危機的核心。
問題在於,做一個批判主義的心理學家沒什麼好處。如果你想要讓自己的研究出名,獲得媒體和同行的矚目,你就得搞個大新聞,弄出一點戲劇性的,令人意想不到的數據出來。
Wagenmakers 認為問題應部分歸咎於科學期刊編輯,他們對證據堅實且漸進的科學研究並不那麼熱衷。他認為媒體也難辭其咎。媒體喜歡宣傳不那麼靠譜,但卻吸引眼球的研究。我們自己呢?同樣容易受到荒謬的研究結果的吸引(比如有一個研究稱因颶風喪生的受害者多帶有女性的名字)。這些因素給研究者帶來了錯誤的動機,讓研究者以為,證據最弱的研究反而最重要。
Wagenmakers 說,要向前看。期刊正在改變政策,透明度正在增加,科研經費資助機構也開始資助複製研究。心理學家們意識到了自身的問題(p值操縱,發表偏倚),這是件好事。不管怎麼說,不破不立,不塞不流,不止不行。
原文鏈接:
http://www.slate.com/articles/health_and_science/cover_story/2016/08/can_smiling_make_you_happier_maybe_maybe_not_we_have_no_idea.html
閱讀更多
▽ 故事
·付費學術出版迎來勁敵,多家預印本網站今夏接連上線
·一場關於物理學本質的爭論:實驗是檢驗科學的唯一標準嗎?
·路透社發布亞洲最具創新力大學榜單,中國高校無一進入前十
·2050年,全球一半人會近視——你真的清楚近視的原因嗎?
▽ 論文推薦
· 覺得狗狗很懂你?因為它們理解語音的方式就和你一樣 | Science 論文推薦
· 單身女性有錢的話,一不小心就想去創業?| European Economic Review 論文推薦
· 水薄層在常溫下「結冰」| Science Advances 論文推薦
▽ 中文摘要
· Science 中文摘要 | 19 AUG 2016
· 【全新改版 】 Nature 一周論文導讀 | 24 AUG 2016
內容合作請聯繫
keyanquan@huanqiukexue.com
這裡是「科學美國人」中文版《環球科學》服務科研人的微信號「科研圈」。我們:
·關注科學進展與科研生態
·推薦重要前沿研究
·發布科研招聘
·推送學術講座與會議預告。
推薦閱讀:
※白衣白裙女神白色的微笑迷人
※又是梅開一年,微笑向暖
※風雨人生,記得微笑
※土登翁修堪布:一個微笑的距離
※守著時光靜好,我只管拈花微笑...