科研博客圈的書劍恩仇

有人的地方就有江湖。

推動科學進步的是學術爭論,大家圍坐一席以數據與邏輯為工具互相質疑,尋求共識。但事實上這個過程中並不缺乏個人或群體情感的介入,這一方面是現代科研職業化所導致的拿錢吃飯,另一方面則是科研人員自身的主觀好惡。這一點在科學家的博客上展示的淋漓盡致,雖然在學術期刊里發評論比較正式,但在預印本、數據共享與可重複性研究的大趨勢下,越來越多的科學家選擇時效性更高的非同行評議的博客來對科學進展進行評論。藉助這些社交媒體,我們也可以一窺他們對學術觀點的愛恨情仇,也許有人不屑於這些主觀性比較強的評論,但從學術交流的角度出發,如果我們僅僅通過學術期刊與會議交流學術觀點,由於存在審稿與運作周期,很多共識會消耗大量的傳播成本來達成,這不僅與信息時代脫節,也會造成資源浪費。下面我們看些案例感受下國外學術界在博客這一媒介上的觀點交鋒:

案例一:「主觀」的貝葉斯方法

哥倫比亞大學的 Andrew Gelman 的博客可以算得上是個火藥桶了,他本身主張貝葉斯學派,而趕巧貝葉斯學派跟頻率學派可以算得上科研數據分析里哲學思想差異最大的兩派,起碼按我的粗淺認識是根本無法調和的,所以即便實用上甚至演算法上都差異不大,想對這兩種思想和稀泥基本都會被 Gelman 教授無情嘲諷,如果你還打算說貝葉斯不好,基本上會被博文討伐。當然,也不是所有人都有這個待遇,同舟子的做法類似, Gelman 教授基本也是逮著大魚去坑。需要提醒的是他可不是舟子那種十幾年不做科研的學術圈外人士,其本人是哥倫比亞大學應用統計中心的主任,其團隊的研究領域十分廣闊,大家可以感受一下:

why it is rational to vote; why campaign polls are so variable when elections are so predictable; why redistricting is good for democracy; reversals of death sentences; police stops in New York City, the statistical challenges of estimating small effects; the probability that your vote will be decisive; seats and votes in Congress; social network structure; arsenic in Bangladesh; radon in your basement; toxicology; medical imaging; and methods in surveys, experimental design, statistical inference, computation, and graphics.

順帶一提,著名貝葉斯統計軟體 stan 就出自這個團隊。

這次事情的起因是卡內基·梅隆大學的 Larry Wasserman 教授(2016年當選美國國家科學院院士)在接受一個博客採訪時對頻率學派與貝葉斯學派下了個定義:

I wish people were clearer about what Bayes is/is not and what frequentist inference is/is not. Bayes is the analysis of subjective beliefs but provides no frequency guarantees. Frequentist inference is about making procedures that have frequency guarantees but makes no pretense of representing anyone』s beliefs.

Gelman 教授對其頻率學派的觀點沒啥意見,但那個 「subjective」 直接引爆了火藥桶。而按照 Gelman 的定義,貝葉斯方法應該是:

Using inference from the posterior distribution, p(theta|y)

特別的,他還認為:

Science is always full of subjective human choices, and it』s always about studying larger questions that have an objective reality.

坦白說這個看法是比較符合科學史的,雖然當今科學理論體系邏輯上相對完備(先排除下哥德爾跟量子力學),但其發展確實很曲折,在實驗數據跟統計決策成為主流之前,很多理論在發現或提出時主流科學家並不接受,有的是邏輯上不接受(很多新理論完全不容於舊理論),有的則屬於威權集團打壓,可以說相當主觀。

但在後面的論述中,Gelman 教授就開始開嘲諷技能了,Larry 認為在高維數據處理中貝葉斯方法沒意義無法解釋,Gelman 教授則反駁說他覺得除了貝葉斯方法別的方法也都是解釋不通的,並且他認為 Larry 自己不懂貝葉斯還瞎定義是十分不妥的。不得不說這段論述很沒營養,跟小學生吵架差不多。緊接著 Gelman 教授又提到主觀確實是貝葉斯方法的一部分但不是全部,那頻率學派是不是可以說成「簡單隨機採樣的技術」,科學研究範圍在拓展,各種方法也在發展,貝葉斯方法可以研究客觀問題。這個說法也比較中肯,接下來 Gelman 教授又開啟了挖墳模式,他把 Larry 08年到13年關於貝葉斯方法中隨機性看法的轉變給列了出來,緊接著又說我也有這個轉變過程。但文章最後他又翻了 Larry 對經濟學家的舊賬,認為他存在個人偏見。

看起來這個文章似乎比較正常,但這篇博文真正有趣的是評論,基本上集中了當今統計學中各路高手,下面是個不完全名單:

  • Nick Cox 杜倫大學 Stata 元老級開發者
  • Larry Wasserman 卡內基·梅隆大學教授 當事人
  • Deborah G. Mayo 賓夕法尼亞大學教授 採訪 Larry 的人 errorstatistics.com 博主
  • Kevin Dick 斯坦福畢業 創業者 possibleinsight.com 博主
  • Judea Pearl UCLA 教授 causality.cs.ucla.edu/b 博主
  • Christian Hennig 倫敦大學學院教授
  • Norm Matloff UC Davis 教授
  • Brendan K O』Rourke 都柏林理工教授 brendankorourke.com/ 博主

我們可以看出這麼幾件事:首先,這些領域內專家會互相關注對方的個人網站並通過這種方式互動;其次,看他們的討論很有啟發,必看書本上的乾貨更有意思;再次,很多討論雖然對問題是沒營養的,但有助於我們了解一些學術界的風格或流派。在前沿領域由於知識不全,多數情況是無法達成共識的,但通過了解其流派風格會幫助你更全面的看問題。

案例二:兩個軟體會產生一個結果嗎?

巴拉巴西是一位呼聲很高的諾獎候選人,其暢銷書《鏈接》可以說把不少科研人員吸引到了網路科學的研究領域,現實中的無尺度網路的冪律分布所具有的奇特性質在很多並不相關的領域都有展示。但這個故事主角不是他,提到他只是想提前表示下同情,因為他在加州理工教授 Lior Pachter 的博客里躺槍了。事實上,2014年 Lior Pachter 在博客上開了個三部曲,本意就是對 MIT 教授 Manolis Kellis 的個人恩怨,但為了把故事講的通透點,這位老兄追根溯源並展示了自己強大的數理功底,先後對兩篇發表文章的創新性進行質疑,從圖表到演算法,其中一篇就是巴拉巴西的,另一篇則是 Manolis Kellis 教授的。這個故事科學網薛宇老師曾經翻譯評論過,我這裡不細講。但 Lior Pachter 教授在後續的博文中又對號稱H指數100多的巴拉巴西來了次二次扒皮,嚴格說被炮轟的其實不算冤枉,但被人掛的如此直白也只有 Lior Pachter 教授能做得出來。而我今天要講的是他最近又跟紐約大學石溪分校&哈佛&卡內基·梅隆大學的同行掐架了,上演了進攻-防守-再進攻的三部曲。

首先 Lior 講在他們那個 RNA 測序定量的圈子裡,軟體跟軟體差異都是很大的,基本你用不同軟體想得到一樣的結果非常困難(這也說明這個領域的研究共識沒有達成)。然後他話鋒一轉,說自己組裡2016開發的一個軟體跟最近發表在 Nature Methods 上的軟體處理結果卻出奇的一致,皮爾遜相關係數三個九,然後又是一通追根溯源。這裡岔開說一句,Lior 之所以可以追根溯源,是因為預印本及版本控制系統的流行,最近 ACS 也對化學領域提供了預印本服務,預計不久就會覆蓋絕大多數涉及數據分析的實驗學科。從版本上 Lior 發現在他們論文發表後 Rob Patro 的軟體也有了一個很大的更新,更新前跟他們組軟體差異明顯,更新後確幾乎一樣了,最後他認為 Rob Patro 所發表的文章實際上就是抄了自己組裡開發軟體的思想,然後加了個矯正。當然 Rob Patro 也很快在 github 上發表了一個回應,大意是他們在文章跟源碼中多次引用了 Lior 組的論文並且在有些數據集中這兩個軟體的結果是不一樣的,工作流程也不一樣。但 Lior 教授顯然並不滿意,他又寫了一篇博文指出其回復混淆視聽,所謂的不一樣是下游分析,而在 RNA 定量上這兩個差距還是很小,如果你去看這篇回復會發現 Lior 甚至使用了動畫來展示兩者區別很小,可謂精心準備。我在讀這三篇文章時學到很多的論述方法與追蹤驗證方法,可以說很多方法現在還沒出現在教科書中,但可以感到早晚會形成趨勢。

憑心而論, Rob Patro 的文章就算是對 Lior 軟體的改進也是值得發表的,因為當前科研基本都是N+1模式,都是在前人基礎上做功課。但我也比較理解 Lior 為什麼這麼火大,首先在他眼裡這兩個軟體本來就是一回事,憑什麼發 Nature Methods,他自己那篇都沒發這麼好,另一方面就是 Rob Patro 文章在他看來有硬傷,速度也不快,效果也沒那麼好,評價標準還有問題。其實說白了也有點個人恩怨而不是就事論事,但在這些問題上你去要求當事人一碗水端平也很難。如同第一個案例所言,科學研究就是會摻雜各種主觀情感,但作為旁觀者,我們可以從中去學習他們討論問題的方法,例如 Lior Pachter 教授的論證過程,雖然不如發表文章里那麼邏輯完備,但思考步驟都是比較清晰的,而這個過程你在期刊論文中往往看不到,好比你看到的總是對方站在山頂但怎麼爬上去的一般都不會寫,但有時候這些看似瑣碎的步驟卻足夠讓你永遠達不到那個高度。

順帶一提, Lior Pachter 教授的博客上還友情鏈接了 Andrew Gelman 教授的博客。我想說的是在國外是真真切切存在著通過博客的學術交流的,參與學者的水平也是相當強悍,而且不同於國內科研向公眾號或博客滿足於對論文的解讀,這些博客上更多出現的是一種批判式討論,而且夾雜了相當重的個人情緒,如果你打算閱讀也是需要辨偽存真的,這本身對於提高科研思維也有幫助,所以我推薦高年級本科生、研究生跟科研一線的學者都可以去尋找自己感興趣領域大牛的博客,省的每次找推薦審稿人都搞近親繁殖,如果你能從這些火藥桶博客里獲得正面評價,那麼恭喜你,科研對你並不是個坑。

其實類似的故事還有很多,你可以從這篇文章里出發用關鍵詞去探索。我在前面的文本分析的文章中曾提到越是高端的論文,發表勘誤的比率就越是很高,這說明前沿領域的研究不確定性是很高的,思想碰撞也很激烈。如果把社交媒體上的各類花式吐槽也算進去,你會發現科研領域有很多燒腦的故事,各路參與者也從來都不缺名校光環跟牛文加持,陰謀詭計、解釋掩飾、愛恨情仇等可能被小心翼翼地埋藏在數據與圖表之中,雖然看懂需要比較高的門檻,但也正是這種門檻屏蔽了圍觀群眾,上演一幕幕精彩絕倫但需要自行判斷的書劍恩仇。


推薦閱讀:

有哪些設計類、程序類個人博客、小站值得推薦?
中國有哪些優秀的IT博客?
選擇困難症又犯了,哪裡開blog呢?
驅動一個人長期寫作博客的動力是什麼?
脫翁筆記(3):我是一個Scanner控│脫苦海

TAG:论文 | 博客 | 科研 |