計量經濟學的「公信力革命」|1983-2010

04-24

1983年，Edvard Leamer 在AER上發表了一篇文章，慫恿計量學者不要再對計量經濟學存在的問題熟視無睹，要主動尋找更好的研究方法，讓反對實證研究的聲音徹底無話可說。

據Leamer觀察，「幾乎沒有人把數據分析和實證研究當回事了，（此誠危急存亡之秋也）」（斜體是譯者 @葛通標註的私貨，下同）

Hendry(1980), Sims(1980) 這些計量大咖同樣對實證研究表現出相似的輕蔑。對1970-1990期間的美國Ph.D來說,做計量多是事業所需，而不是出於對真理的追求。越來越多的人開始懷疑，可信的實證研究真的存在么？

下面將要介紹的文章，Angrist & Pischke(2010)的觀點認為，自Leamer的文章發表之後，在應用微觀計量領域爆發了一場「公信力革命」。從Leamer的文章，到A&P的文章，恰好是1983-2010.文章可以算作「實驗主義計量」的經典，有不少實際研究的例子。當然，部分觀點存在爭議，畢竟「實驗主義」遠不是計量的全貌，統計推斷和結構主義地位不可動搖。

來自1983年的批評及診斷開出的藥方。

Leamer認為，計量同仁們的實證研究大量基於「假設」（經濟上的、模型形式上的以及數學上的），而不同的假設將帶來不同的實證結論。偏偏這些不同的假設，沒有明顯的優劣之分。也就是說，實證的結論沒有充足的說服力。人們有時可以輕易地得到其它結論，如果他們樂意。至此，Leamer樹立了一個靶子，稱為「na?ve regression（幼稚回歸）」。

Leamer給出的一個解決方案，稱為「敏感性分析」（或稱：穩健性分析），即研究人員需要展示和說明，實證結果是如何隨模型形式變化而變化的。（一般認為，如果換幾組數據和模型，結論一致，也可以在一定程度上佐證結果的可信。）

後人認為，Leamer的批評簡直是扒下了皇帝的新衣。值得欣慰的是，在Leamer的批評之後，隨著計量學者的努力，實證研究正在變得可信。科學的方法在彼時改變著計量經濟學這門學科。

「穩健性分析」在「公信力革命」當中扮演了一定的角色，不過促成革命最核心的力量，是「研究設計」。Leamer當年對實證研究的批評，不乏對「研究設計」的強調，不過他本人並沒有提到，好的「研究設計」可以變成解決問題的良藥。

通過訪查和統計合適的樣本，構造一個實驗，可以讓外生變得外生，讓隨機變得隨機，讓實證變得像物理實驗。當然，真的組織許多人做經濟學實驗同樣也是一種辦法，但通常太貴，也太費時間。幾乎沒辦法組織幾個超級大國這般體量的經濟體來做實驗。實驗主義方法湧現，諸如隨機控制法（RCT），自然實驗法（IV,RD,DID等）。這類方法迅速得到大量應用。學者們不再緊緊盯著計量結果，而開始反思實驗設計過程。越來越多的實驗主義發燒友參與進來，對實驗設計做出改進，在這當中，Lalonde (1986) 是一座里程碑。實驗設計已經走到了微觀實證的核心舞台，尤其受到年輕學者的關注的追捧。Lucas(1976)在宏觀經濟學領域引入了新的思路，駁斥了基於歷史經驗的計量結論，主張基於微觀主體追求利益最大化的聯立方程識別。在一代宏觀經濟學學者的努力下，DSGE蔚然成風。

為什麼現在對計量的批評變少了

計量經濟學在過去的三十年迎來了多方面的進展。毫無疑問，統計數據變得更好，估計方法變得更好，當然還有計算機軟體的普及。對於截面數據天然存在的異方差傾向，White-heteroskedasticity robust standard error為我們提供了超越GLS的解決方案。此外，一個關鍵的因素是，科學實驗方法引入到計量當中。

Research design

工具變數、斷點回歸、雙重差分，都稱不上新技術，因其研究設計的思想與物理實驗設計更相似，也就越發被重視。Angrist & Pischke(2010)的原文給出了許多許多實驗設計的經典實例，無非是RD，DID的應用，不在本文贅述。

宏觀計量何去何從

模擬實驗和DSGE的流行或許有助益，但在Angrist & Pischke(2010)看來，更像是理論邏輯的重複敘述而不是因果關係的發現。也有一部分計量學者採用了實驗主義的方法研究宏觀數據，例如Romer(1989,2007)等.原文介紹了一系列例子。

對Research design的攻擊

反對派對實驗主義方法有兩點懷疑，一是實驗的方法描述了過去，但可以用來預測么？二是，實驗的方法，在解決重大問題時（貧困，不平等，失業），會不會力不從心？

Angrist & Pischke(2010)認為，實驗是通往理論一般化的必由之路。一項研究只要能解釋真理的某個角度，就稱得上不錯的研究，而不必面面俱到。此外，儘管實驗主義在解決一些小問題上確實容易操作，但也可以拿來研究宏大的問題。

引用一句話，作為文章的結尾。

「A design of experiments (a prescription of what the physicists calls a 『crucial experiment』) is an essential appendix to ANY quantitative theory. And we usually have some experiment in mind when we construct the theories, although — unfortunately — most economists do not describe their design of experiments explicitly. 」 by Haavelmo(1944)

附論文的結論原文：