2016 年，心理學學科內部都出現過哪些有價值的爭論？

01-02

本題已收錄知乎圓桌 ? 2016 年度盤點，歡迎大家一起回首這一年讓人印象深刻的熱門事件和人物，聊聊所處行業發生了怎樣的變遷，也一同分享自己的變化與成長。

那個，起源於2015年底，在2016年發酵的爭論算不？

爭論一方是學界祖師爺級別的人物， UCLA的Lieberman, 另一邊是學術新星，University of Colorado Boulder 的 Tal Yakoni. 中間涉及三篇超長反駁的博文（一篇7000+，一篇20000+），相信好多小夥伴都聽說過。爭論的具體內容大概有幾點： 1）大腦的一個區域（dACC)是怎麼定義的，到底在哪裡？ 2）大腦的這個dACC主要是幹什麼的？ 3） Yarkoni 創立的neurosynth 怎麼用（或者說不能怎麼用）。

從頭說起，2015年10月， Lieberman 和Eisenberger在PNAS上發了一篇文章，大概是說雖然我們目前覺得這個dACC可以干很多事情（包括衝突檢測，executive processing, salience), 但是他們用neurosynth做了一個meta-analysis得出來的結果是，這個dACC主要還是對疼痛有反應的。

The dorsal anterior cingulate cortex is selective for pain: Results from large-scale reverse inference

12月5號， Yarkoni在博客上發了一篇7000字+ 的文章，大概就是說Lieberman發的這篇PNAS不太靠譜。而且因為Lieberman用的主要工具Neurosynth就是Yarkoni大神創立的，他也是有資格評論的，於是洋洋洒洒地講了你這個為什麼不對，然後應該怎麼做。最後順便吐槽兩句為啥當時review這篇文章地時候沒有找他。

No, the dorsal anterior cingulate is not selective for pain: comment on Lieberman and Eisenberger (2015)

12月10號， Lieberman在他的博客上發了一篇反駁Yarkoni反駁的文章，也是7000字＋。大概解釋了一下他的立場，說了一下Yarkoni的評論有道理，但是不影響他們的最終主要結果。

Comparing Pain, Cognitive, and Salience Accounts of dACC

12月14號， Yarkoni在博客上發了一篇2萬字的博文，去反駁liberman反駁Yarkoni反駁Lieberman最初文章的博文（&>.&<)。他覺得Lieberman的反駁文章太沒有道理了，而且他覺得雙方的分歧是實實在在的分歧，不是由誤解產生的。然後他從頭到位逐句回應了Lieberman的博文。原文

Still not selective: comment on comment on comment on Lieberman Eisenberger (2015)

下面是幾個例子，翻譯來自google translate:

(Lieberman 博文）： Neurosynth的創建者Tal Yarkoni（以下簡稱TY）現在發布了一個博客，表明我們幾乎所有的結論都是假的，微不足道的，或已經知道的。雖然這種反應並不意外，但令人失望的是，我們愛Neurosynth，並認為它是一個強大的工具，用於支持我們想要推理的結論。

（Yarkoni回復）：我驚訝地聽到我的反應不是意想不到的。這似乎意味著L＆E有一些理由擔心，我不會贊同他們使用Neurosynth的方式，這導致我想知道為什麼他們沒有提前提出我的意見。

(Lieberman 博文）：有20多年的研究人員忽視dACC在疼痛加工中作用的歷史。

（Yarkoni回復）：我將在下面解釋這個聲明的「解釋」部分，但是建議研究人員20年來忽略dACC在疼痛處理中的作用完全荒謬的。我不認為我可以做任何更好的鏈接到Google學術搜索，請讀者瀏覽數百篇文章，所有這一切作為一個確定的發現，dACC在疼痛處理有重要作用（和其中許多有數百來自其他文章的引文）。

(Lieberman 博文）：在各種主要媒體（例如紐約時報）Yarkoni和他的合作者批評了反向推論（reverse inference) - 從前向推理(forward inference)數據中得出無效的推論結論。我們提出的分析表明，關於salience和dACC的聯繫也基於無根據的反向推理(reverse inference)。
（Yarkoni回復）：這是另一個荒謬的，坦率地說有侮辱性的比較。。。。 L＆E可以放心，如果有人發表了一篇完全基於Neurosynth結果的文章，其中他們的主要結論是dACC是選擇性的參與疼痛加工，我會寫出同樣的批評。雖然也許應該關心他們，在迄今為止的數百個已發表的使用Neurosynth，他們的是第一個，也是唯一的一個，已經讓我寫一個批判性的評論。

2016年，兩方大神們也都借著會議和其他機會發表了自己的觀點。

比如，今年10月， Lieberman就在facebook 群裡面拿著一篇新發的Nature Neuroscience說，這篇文章方法和我們用的方法差不多啊，你們腫么不吐槽？

Yarkoni在底下回應：我為什麼一定要吐槽？我關心的是neurosynth. (話說還是吐槽了一下這篇文章figure 1不太對）。

今年12月， Lieberman 又在facebook裡面轉了一篇JNeuroscience 的文章，說這篇文章強有力的支持了他的觀點。

然後上周我們組裡的小哥還present了這篇文章，我才了解了來龍去脈。故事的最後，感覺學術大神較起真來還是有點可愛。

最後@參加我上次live的小夥伴，答應你們的內容到今天才兌現，拖延症晚期患者在這裡。。

2017年01月02重新編輯：

我所關注心理學的爭議主要是關於可重複性的問題。關於這個問題激烈的爭論，主要是各種博客和Facebook的兩個群：Psychological Methods Discussion Group（目前有5389個成員）和psychMAP（目前有4465個成員）。

雖然爭議很多，但我總結了一下，主要是兩個問題：第一、心理學的研究到底可重複性有多高？什麼因素導致了研究的不可重複性？第二、研究者應該以何種方式來討論可重複性的問題，尤其是，以何種語氣來討論那些發表了後來證明無法重複的論文的研究者？

第一個問題：心理學的研究可重複率到底有多高？什麼因素導致了研究的不可重複性。

其實這個問題在2011年的經典文章：false positive psychology （False-Positive Psychology）中就已經有了很好的說明：心理學中有許多研究問題，由於各位p-hacking手段的存在，實際上只是噪音而已。

而2015年心理學界最受到關注的文章：Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), 943. doi:10.1126/science.aac4716（以下稱為OSC(2015)），又得到了關於心理學研究可重複性一個比較量化的估計：大約為39%的研究是可以重複的。

但是這個結論並非所有的研究者都認同，於是有了 Dan Gilbert在Science上對OSC 2015的論文的評論（Comment on 「Estimating the reproducibility of psychological science」）以及其後續的爭議。這個爭議主要的問題集中於：Gilbert等人的批評是否有道理？很多人不這麼認為，更要命的是，Gilbert等人的評論中，暴露了他們對一些統計概念的理解偏差。後面也有不少研究者來反駁這一點。最為正式的，還是在Science上的反駁：http://science.sciencemag.org/content/351/6277/1037.3 。還有一些其他研究者在自己博客上的反駁：Evaluating a new critique of the Reproducibility Project、http://daniellakens.blogspot.co.id/2016/03/the-statistical-conclusions-in-gilbert.html (需要科學上網）、http://deevybee.blogspot.co.uk/2016/03/there-is-reproducibility-crisis-in.html（需要科學上網）

（無恥的自我推銷來了！！！）

考慮到Dan Gilbert在社會心理學中舉足輕重的地位，他的評論應該會影響很多人對OSC2015結論的看法，我們在《心理學研究中的可重複性問題：從危機到契機》一文中也用了一小節來討論他們的這個評論以及相關的問題，具體內容在1505頁最後一段到1506頁的前兩段。

關於第一個問題，還有另一個比較受到關注的爭論：van Bavel在PNAS上的文章：

這個文章的一個核心論點是說：心理學中的不可重複性，是因為研究的問題的背景敏感性帶來的，其實有一些隱藏的中介變數（hidden modulators）沒有被發現。這個文章一出來，在fb上引發了非常強烈的反應，甚至是一個人身攻擊。後來的反駁也非常多，包括 Inbar等在PNAS上寫的一個評論（Association between contextual dependence and replicability in psychology may be spurious）、van Bavel的反駁（Reply to Inbar: Contextual sensitivity helps explain the reproducibility gap between social and cognitive psychology），以及博客：如A critical comment on 「Contextual sensitivity in scientific reproducibility」。在facebook的評論里，我覺得 Tal Yarkoni的評論非常具有實際的意義：

So I guess that while I support your conclusions here regarding context sensitivity, I would argue that the strongest and most actionable implication of what you"re saying is not that people should ease up on replication efforts and criticisms of non-replicability, but that people who know their work is fragile should be very careful to announce that in the title and abstract, and not just in a sentence somewhere in the discussion.

這個問題我也覺得很嚴重：研究者明知自己所研究的效應很微弱卻宣稱自己的結果具有廣泛的意義，這種誇大的問題，可能是非常嚴重的。（關於FB上的討論，可以見這個帖子：facebook.com 的頁面）

關於什麼因素導致心理學的研究不可重複，這個問題可能可以永遠地爭論下去。不過2016年，不管研究者對可重複性持什麼觀點，一些新的研究實踐標準正在慢慢建立起來。OSC2015，以及van Bavel關於contextual sensitivity的討論，都把他們的數據公開，許多討論中也都附上了他們的分析代碼，這一點，也許是我們最值得跟進的。

第二個問題是關於研究者該如何討論可重複性問題，也就是一個tone的問題。這個問題也不是2016年獨有的，Cambridge心理學系的研究者Schnall 2014年就在博客上討論過這個問題：Further Thoughts on Replications, Ceiling Effects and Bullying （Blog - Department of Psychology）。原因也很簡單，當一些研究者的結果無法重複時，會有一些人對他們進行人身的攻擊、嘲諷、惡意推斷等。當年Dan Gilbert就在tweeter上說過有些人是little replication bully。到2016年，這個問題成為討論的重點之一，因為Susan Fiske寫了一篇文章，她認為存在一些methodological terrorism。目前，她寫的原始版本仍然在dropbox上保存著：https://www.dropbox.com/s/9zubbn9fyi1xjcu/Fiske%20presidential%20guest%20column_APS%20Observer_copy-edited.pdf。

正式版本中，Fiske緩和了她的語氣：A Call to Change Science』s Culture of Shaming。

Fiske在她原來的評論中，認為現在社交媒體發達之後，一些原本應該在學術雜誌上進行討論的事情，在社交媒體以及博客上就迅速地展開了，而且是沒有任何審查的。也正是因為如此，所以有許多人身的攻擊和不當的措辭，這種methodoloigcal terrorism的存在，讓很多有學術前途的人離開了學術界。

到底在是否存在tone的問題？不同的研究者有不同的看法，一些比較好的博客：

Flying Flak and Avoiding 「ad hominem」 Response | Absolutely Maybe

There is no 「tone」 problem in psychology

What has happened down here is the winds have changed - Statistical Modeling, Causal Inference, and Social Science （這篇博客還簡單地回顧心理學研究中的可重複問題的歷史）

除了這兩個主要的問題之外，2016年還有一件事情比較有意思：同一文章的不同作者對原來論文的結論持不同態度。這個文章是年Power Posing - Sep 20, 2010，作者分別是：Dana R. Carney, Amy J.C. Cuddy, Andy J. Yap。2016年，一作Dana Carney （現在是伯克利加州大學商學院的副教授）公開表明了自己對Power Posing的態度(http://faculty.haas.berkeley.edu/dana_carney/pdf_My%20position%20on%20power%20poses.pdf)，核心觀點是：

....
I do notbelieve that 「power pose」 effects are real
.....

要知道，這個power posing的研究，是TED上最火爆視頻(Your body language shapes who you are)的科學來源。

Amy Cuddy對這個表態的反應是：power posing的效應是有的，但是我們需要先把power posing的定義弄清楚....., 具體見這裡：

http://nymag.com/scienceofus/2016/09/read-amy-cuddys-response-to-power-posing-critiques.html

至於Amy Cuddy的對power posing的定義是否是一種post-hoc justification，每個研究者都有自己的看法。而關於power posing的重複實驗，目前也是非常多的。有興趣應該能夠搜索到。

另外一個社會心理學影響非常大的研究：ego-depletion，在2016年也有了一個多實驗室大規模註冊重複的結果：A Multilab Preregistered Replication of the Ego-Depletion Effect。 Baumeister對此的反應在這裡：Misguided Effort With Elusive Implications。當然，還有反駁：Commentary: Misguided Effort with Elusive Implications, and Sifting Signal from Noise with Replication Science

當然，2016年，還有許多其他的爭論，但可重複性問題的爭議慢慢進入尾聲時，有人開始反思，為什麼心理學的可重複性問題會如此引人注目？原因是多方面的（Why is the scientific replication crisis centered on psychology? - Statistical Modeling, Causal Inference, and Social Science），有兩個比較有意思：一是心理學的研究比較開放，很多都可以公開討論；二是沒有涉及太多的利益，所以沒有因為利益的系而被壓制起來。所以總體來說，心理學的研究，還是在慢慢進步的。

十五年來腦成腦研究付諸東流！這個不算爭議，但是誇大的報道太多了。