計量經濟學的「公信力革命」|1983-2010

1983年,Edvard Leamer 在AER上發表了一篇文章,慫恿計量學者不要再對計量經濟學存在的問題熟視無睹,要主動尋找更好的研究方法,讓反對實證研究的聲音徹底無話可說。

據Leamer觀察,「幾乎沒有人把數據分析和實證研究當回事了,(此誠危急存亡之秋也)」(斜體是譯者 @葛通 標註的私貨,下同)

Hendry(1980), Sims(1980) 這些計量大咖同樣對實證研究表現出相似的輕蔑。對1970-1990期間的美國Ph.D來說,做計量多是事業所需,而不是出於對真理的追求。越來越多的人開始懷疑,可信的實證研究真的存在么?

下面將要介紹的文章,Angrist & Pischke(2010)的觀點認為,自Leamer的文章發表之後,在應用微觀計量領域爆發了一場「公信力革命」。從Leamer的文章,到A&P的文章,恰好是1983-2010.文章可以算作「實驗主義計量」的經典,有不少實際研究的例子。當然,部分觀點存在爭議,畢竟「實驗主義」遠不是計量的全貌,統計推斷和結構主義地位不可動搖。


來自1983年的批評及診斷開出的藥方。

Leamer認為,計量同仁們的實證研究大量基於「假設」(經濟上的、模型形式上的以及數學上的),而不同的假設將帶來不同的實證結論。偏偏這些不同的假設,沒有明顯的優劣之分。也就是說,實證的結論沒有充足的說服力。人們有時可以輕易地得到其它結論,如果他們樂意。至此,Leamer樹立了一個靶子,稱為「na?ve regression(幼稚回歸)」。

Leamer給出的一個解決方案,稱為「敏感性分析」(或稱:穩健性分析),即研究人員需要展示和說明,實證結果是如何隨模型形式變化而變化的。(一般認為,如果換幾組數據和模型,結論一致,也可以在一定程度上佐證結果的可信。

後人認為,Leamer的批評簡直是扒下了皇帝的新衣。值得欣慰的是,在Leamer的批評之後,隨著計量學者的努力,實證研究正在變得可信。科學的方法在彼時改變著計量經濟學這門學科。

「穩健性分析」在「公信力革命」當中扮演了一定的角色,不過促成革命最核心的力量,是「研究設計」。Leamer當年對實證研究的批評,不乏對「研究設計」的強調,不過他本人並沒有提到,好的「研究設計」可以變成解決問題的良藥。

通過訪查和統計合適的樣本,構造一個實驗,可以讓外生變得外生,讓隨機變得隨機,讓實證變得像物理實驗。當然,真的組織許多人做經濟學實驗同樣也是一種辦法,但通常太貴,也太費時間。幾乎沒辦法組織幾個超級大國這般體量的經濟體來做實驗。實驗主義方法湧現,諸如隨機控制法(RCT),自然實驗法(IV,RD,DID等)。這類方法迅速得到大量應用。學者們不再緊緊盯著計量結果,而開始反思實驗設計過程。越來越多的實驗主義發燒友參與進來,對實驗設計做出改進,在這當中,Lalonde (1986) 是一座里程碑。實驗設計已經走到了微觀實證的核心舞台,尤其受到年輕學者的關注的追捧。Lucas(1976)在宏觀經濟學領域引入了新的思路,駁斥了基於歷史經驗的計量結論,主張基於微觀主體追求利益最大化的聯立方程識別。在一代宏觀經濟學學者的努力下,DSGE蔚然成風。


為什麼現在對計量的批評變少了

計量經濟學在過去的三十年迎來了多方面的進展。毫無疑問,統計數據變得更好,估計方法變得更好,當然還有計算機軟體的普及。對於截面數據天然存在的異方差傾向,White-heteroskedasticity robust standard error為我們提供了超越GLS的解決方案。此外,一個關鍵的因素是,科學實驗方法引入到計量當中。


Research design

工具變數、斷點回歸、雙重差分,都稱不上新技術,因其研究設計的思想與物理實驗設計更相似,也就越發被重視。Angrist & Pischke(2010)的原文給出了許多許多實驗設計的經典實例,無非是RD,DID的應用,不在本文贅述。

宏觀計量何去何從

模擬實驗和DSGE的流行或許有助益,但在Angrist & Pischke(2010)看來,更像是理論邏輯的重複敘述而不是因果關係的發現。也有一部分計量學者採用了實驗主義的方法研究宏觀數據,例如Romer(1989,2007)等.原文介紹了一系列例子。

對Research design的攻擊

反對派對實驗主義方法有兩點懷疑,一是實驗的方法描述了過去,但可以用來預測么?二是,實驗的方法,在解決重大問題時(貧困,不平等,失業),會不會力不從心?

Angrist & Pischke(2010)認為,實驗是通往理論一般化的必由之路。一項研究只要能解釋真理的某個角度,就稱得上不錯的研究,而不必面面俱到。此外,儘管實驗主義在解決一些小問題上確實容易操作,但也可以拿來研究宏大的問題。


引用一句話,作為文章的結尾。

「A design of experiments (a prescription of what the physicists calls a 『crucial experiment』) is an essential appendix to ANY quantitative theory. And we usually have some experiment in mind when we construct the theories, although — unfortunately — most economists do not describe their design of experiments explicitly. 」 by Haavelmo(1944)

附論文的結論原文:

延伸閱讀:

葛通:對P值的批評|Enough,就這幾個理由顛來倒去?

zhuanlan.zhihu.com圖標
推薦閱讀:

生物實驗室的翡翠鑒定入門
這是一種能推斷出我們的大腦在經歷什麼的研究方法
高轉化率的著陸頁巧用實驗提高著陸頁信息的可信度
土豪大牌 Life Technologies 過往的輝煌

TAG:模型 | 計量經濟學 | 實驗 |