經濟學實證研究路在何方?

經濟學實證研究路在何方? 趙洪春華中科技大學經濟學院

1、引言

上世紀八十年代初,ChristopherSims(1980)、David Hendry(1980)和EdwardLeamer(1983)對當時的實證經濟學提出了尖銳的批評。這些批評都指出當時的實證研究結果難以取信於人。而缺乏可信性的原因,一是對因果關係識別的理解甚少,二是計量推斷往往對附設的模型設定和誤差項分布不穩健。自那時起,實證經濟學在三個方向取得了顯著的進展。除了穩健的經濟計量推斷之外,還有基於設計的實驗主義實證研究方法和基於經濟學模型的結構性實證研究。尤其是基於設計的實驗主義方法已廣泛應用於發展、教育、環境經濟學、衛生、勞動和公共財政等諸多微觀經濟學領域的實證研究和政策分析。同時,其在宏觀經濟學和產業組織中的應用也有若干有益的嘗試。

實證經濟學的新進展也把對實證經濟學的很多思考推向深入。比如,實驗主義方法在多大程度上提高了實證經濟學的可信度?敏感性分析能否解決有限樣本帶來的困擾?在結構性實證研究中,如何看待基於回歸的計量方法和基於計算的定量方法?這些思考發生的背景是,實證經濟學越來越關注如何設計好的實驗或者發現有效的自然實驗,而與經濟學理論漸行漸遠,並且引發了很多涉及實證經濟學基本問題的爭論。②在深入思考之後,人們不禁要問:合理的實證經濟學研究方法是什麼?

本文在梳理這些思考的基礎上發現,這些思考不僅把經濟學實證研究推向深入,也為其未來的發展方向提供了新思路。具體而言,首先,基於設計的實驗主義方法雖然是回答在具體情境下因果效應是否存在的終極武器,在概念上能夠可信地估計平均干預效果,能夠回答「有沒有」的問題。但是,這種方法本質上獨立於經濟學理論,無法解答「為什麼」的問題。其次,敏感性分析不是解決有限樣本帶來的問題的終極方案,而更多的實驗和自然實驗是當前積累可靠信息的必要途徑。最後,在結構性實證研究中,基於回歸的計量方法需要藉助統計相關性溝通模型與數據,而不能直接聯繫二者。即便某些識別條件是基於理論的,回歸分析的估計結果也只是賦予統計相關性以因果性的解釋。而基於計算的定量方法首先是基於經濟學理論的,能夠直接把數據和模型相結合,其中的因果關係先驗地由經濟學理論決定。基於上述討論,本文嘗試釐清實證經濟學中一些謎題,拋磚引玉。另外需要強調的是,儘管實驗主義方法不能解決「為什麼」的問題,該方法仍然是提供可靠經驗證據的科學方法,實為構建經濟學理論不可或缺的基礎工作。

2、實驗主義方法與可信的經濟解釋

識別因果關係是實證經濟學的一大重要課題。自上世紀八十年代以來,實證經濟學在這一方面取得了很多成績。實證經濟學家把隨機控制試驗和「自然」實驗等多種技術應用於因果關係的識別,形成了實驗主義方法。實驗主義方法聲稱已經能夠令人信服地識別變數間的因果關係,並且這種方法比其他形式的實證研究更有優勢。

具體而言,實驗主義方法的優勢是能夠識別特定情境下的因果效應,從而成功地解決了可信的經濟推斷中的「有無」問題。此外,其基本思路是做實驗,簡潔透明,一目了然。而且,其對因果關係的識別並不依賴於任何特定的經濟機制,且具體的技術手段在統計上也更穩健。因而,對於那些能夠採用實驗和自然實驗的問題,實驗主義方法在統計的可靠性方面優於其他任何方法(Imbens和Angrist,1994)。總之,實驗主義方法是對實證經濟學的一大貢獻,在諸多領域有著廣泛的應用。①

不過,這種方法能否解決經濟推斷的另一大問題,即:能否可信地由觀察到的現象推斷出背後的具體機制呢?目前的研究表明,正是在這一方面,實驗主義方法乏善可陳,難有作為。具體而言,有以下幾點不足。

第一、由於無法識別數據背後的機制,因而不能做出有用的政策評估和福利分析(Heckman,1997;Rosenzweig和Wolpin,2000;Heckman和Urzua,2010;Deaton,2009)。

這首先表現為估計結果對「異質性」敏感。所謂異質性其實是指因果關係中含有多種機制,因而在具體情況下估計結果取決於此時何種機制居於主導地位,以及樣本中哪些個體對所選擇的用於識別的外生衝擊做出了反應。異質性直接導致了外推有效性問題,使其政策評估能力大打折扣。比如Angrist和Lavy(1999)發現:班級規模減少10個人能提高成績約0.2到0.3個標準差。但這個結論能否推廣到中國呢?或者這個結論在中國仍是合理的嗎?此外,對數據背後機制的忽視,也使其無法直接回答與福利相關的問題。仍以Angrist和Lavy(1999)為例,即便接受小班確實有利於提高學生成績這個定性結論,由於不知道小班作用的具體機制,我們仍然無法回答縮小班級大小是否比增加教師工資以提高教學質量,或者改善學生的營養和健康狀況更能有效地提高學生成績。

第二、實驗主義方法對存在策略性行為和涉及一般均衡的因果關係無能為力。可控實驗與局部均衡中的「所有其他條件不變」的概念一致,由此識別的因果效應在概念上與局部效應(partial effect)完全一致。如果存在策略性行為,那麼有時候變數之間的關係會隨著博弈均衡的改變而發生質的變化。類似的,一般均衡考慮市場之間的相互影響,也無法做到所有其他條件不變。此時,人們對現象背後的機制更關心,而實驗主義方法恰恰不能回答這些問題。

不僅如此,其在實際操作方面也困難重重。

第一、隨機控制試驗代價高昂,而自然實驗也並不容易獲得。例如,「師生成績比率」(Student/TeacherAchievement Ratio,STAR)實驗前後花費了1200萬美元;國民健康保險實驗的花費高達1.5億美元。某些情況下,隨機控制試驗由於涉及倫理問題而不可行。因此,除非有充分的理由需要通過實驗去獲得相關信息,否則實驗是不必要的。另一方面,為了尋找自然實驗,實證經濟學家不得不從最引人矚目的研究方向轉向一些微不足道的研究題目。James Heckman曾經聲稱:「在我們這個行當的某些地方,討論水平已經淪落到《紐約客》文章的水平了」。①舉例來說,在勞動經濟學中不少有影響的或者有說服力的自然實驗研究,由於受到上述限制,在許多重要問題上仍未達成廣泛一致,成就有限。Keane(2010)發現:通過實驗主義方法或多或少達成一致的結果僅有寥寥5項:(1)Frisch工資彈性大約等於1;(2)鄰居的好壞對收入沒有影響;(3)小班能提高學生的表現;(4)死刑不改變謀殺率;(5)服兵役減少了退伍後的收入。這說明實驗主義方法關注的是具體案例,積累具有普遍學術價值的結論的速度較慢。

第二、實驗與自然實驗方法在操作中也困難重重,難以保證滿足實驗所要求的條件。比如,在隨機控制試驗中難以做到真正的隨機。例如Miguel和Kremer(2004)在利用實驗研究蛔蟲對入學率的影響時,按照學校名稱的字母順序將學校「隨機」地分組。但這並不是真正的隨機化,因為政府或非政府組織分配資源時,也可能按照字母順序分組。因而,入學率的變化有可能並非完全源於實驗干預,還有可能源於其他資源的差異。另一個例子是Angrist(1990)使用徵兵「彩票」號碼作為工具變數分析越戰對退伍士兵收入的影響。這個工具變數並不能完全解釋當事人是否會服兵役,因為一個抽到簽的人是否去參軍還取決於其機會成本。如果服兵役的代價過高,有些人會千方百計地逃兵役。在關於班級大小與學生成績的研究中,Urquiola和Verhoogen(2009)的研究也表明存在當事人根據機會成本選擇不同班級的情況。

在宏觀領域,識別因果效應就更加困難。Rigobon(2003)提出了一個創新的識別方法,用向量自回歸模型中的方差突變作為外生衝擊解決識別問題。但是,這種方法也有類似弱工具變數的困難。又比如,在研究外援對經濟增長的影響時,Boone(1996)提出的方案為很多後續研究所沿用。他建議用人口的對數作為外援的工具變數,理由是在簡單增長模型中人口與經濟增長無關,所以人口越多,得到的人均援助就越少。但在這裡,對工具變數獨立於誤差項的解釋並不令人信服。

綜上所述,實驗主義方法與結構性實證研究的主要分歧在於實驗與自然實驗結果是否可以用於政策評估。政策評估的目的是發現某項政策起效的機制,以便將來不同的情形下斟酌使用,因而不僅要求知曉政策有沒有效果,而且需要知道其背後的機制。實驗主義方法雖然可以識別因果效應是否存在,卻不能識別其背後的「因果性機制」,人們需要基於經濟學理論的結構性實證研究來討論這些問題。儘管目前結構性實證研究仍有很多缺陷,不像實驗主義方法已經有了成熟穩定的做法,不過它仍是辨識出「因果性機制」的希望所在。實證研究中,實驗不能代替理論。

3、敏感性分析與有限樣本帶來的困擾

統計推斷的核心是用有限樣本信息推斷總體特徵。所以無論是實驗主義方法還是結構性實證研究,只要使用回歸分析,都只能得到與漸進性質不同的有限樣本估計結果。那麼,在有限樣本偏差可能誤導回歸結果的情況下,我們能否改善推斷的可信度?

Leamer(2010)指出,在線性回歸中,與解釋變數相加和相乘的兩種混淆因素都可能妨礙識別因果關係。實驗主義方法認為,巧妙的設計會使得相加的混淆因素與感興趣的變數無關,因而不論是否控制這些混淆因素,回歸結果都是無偏的,而且事實上應該是相同的。不過,在實際情形中,二者總是相關的,甚至會偶然地高度相關以致估計有偏,因此有必要加以控制。不過如果需要控制的混淆因素數目龐大,那麼在回歸分析中完全控制它們就變得不可行了。此時不得不選擇控制其中的一部分混淆因素,但又會帶來選擇計量模型設定的問題。

更大的問題來自相乘的混淆因素。它是一個既與樣本中的調查對象又與實驗設計有關的變數。在自然實驗中,隨機化是不受控制的。此時,即便工具變數在理論上滿足相應的條件,也可能在具體的樣本中不理想。同樣,在可控實驗中,相乘的混淆因素中混雜了哪些機制,取決於該次實現的獨特樣本,所以總是無法完全摒除相乘的混淆因素對因果效應的影響。

Leamer(1983)提出用「敏感性分析」來強化對計量分析結果的信心。Sala-i-Martin(1997)即嚴格使用「敏感性分析」來尋找穩健的經濟增長因素。作者考慮了62個解釋變數。除了1960年的GDP、預期壽命和小學入學率這3個初始變數始終在回歸中之外,其餘59個變數都是待分析的增長因素。選取其中任意一個作為感興趣的解釋變數,剩下的58個變數的不同組合構成不同設定,作為控制變數。在不同設定下反覆回歸,查看估計結果是否穩健。這樣,對每個解釋變數都需要做30857次回歸,而完整的敏感性分析總共需要做超過兩百萬次增長回歸。最終,敏感性分析結果只發現了一個穩健的解釋變數,即「人口中受儒家文化影響的比例」。這其實是說1960年以來東亞經濟體一直在增長。在這個例子中,敏感性分析未能發現有價值的穩健的政策變數,表明其有很大的局限性。

實驗主義方法則主張通過做嚴格的實驗與自然實驗,尋找更多證據,最終拼出一幅更一般的圖景。比如,Joshua Angrist和他的合作者們通過一系列研究表明服兵役會降低退伍後的收入,並且認為這些證據支持了人力資本理論,因為退伍老兵在服役期間沒有積累平民社會的經驗,因而生產率更低(Angrist,1990;Angrist和Krueger,1994;Angrist和Johnson,2000)。由此可見,儘管代價高昂,做更多(自然)實驗確能增加對某個問題的認識。

目前的研究中仍沒有解決有限樣本偏差的終極方法。敏感性分析雖然較直接,但並非一個可行的解決方案。在對潛在機制尚無定論或者判斷仍不完整時,通過嚴謹的實驗和自然實驗來積累可信的實證證據,的確有助於了解某種影響是否存在及其大小如何,不失為一個辦法。

4、計量方法和定量方法在結構性實證研究中的作用

前文提到的很多結構性實證研究仍在或多或少地使用回歸方法。回歸分析本質上是分析變數間的統計相關性。當它與經濟學理論相結合後,就將理論與數據間接地聯繫起來。基於回歸的計量方法採取的是歸納的思路。

歸納思路知曉現實情況十分複雜,各種機制交織在一起,並表現為各種可觀察的現象。為了識別出其中的某個具體的機制,學者們通過各種計量方法、技巧和假設來剔除與這個感興趣機制無關的其他機制。歸納思路的研究有一個特點,就是對機制之間的聯繫大體持不可知論的態度。因而,歸納思路試圖儘可能少地使用識別假設來約束數據之間的聯繫,而總是力圖構造一個儘可能包羅萬象的計量模型。在這個計量模型中,機制相互交織的可能性是龐大的,因而對數據量的需求也是巨大的。回歸分析中每控制一個變數即排除了一種無關的機制。不過由於現實十分複雜,需要控制的變數也許是無窮多個,要剔除所有這些無關機制就需要海量信息。此外,排除某種機制可能會特別困難。即便有了更高級的工具,也不能保證好的效果。如此,實證研究的效果究竟如何就是一個疑問了。總之,要想充分地識別機制,歸納思路對理論計量經濟學知識和數據的要求都很高。現實困難限制了計量方法的可行性和可靠性。

在宏觀經濟學領域,很多學者放棄了傳統的計量方法,轉而採用「計算實驗」的技術路線(Kydland和Prescott,1980,1982)。在計算實驗中,研究者根據研究的問題構造理論性的模型經濟,校準模型使其參數與真實經濟中的某些關鍵特點相吻合;然後改變其中的政策參數重新解出模型經濟的均衡路徑,並回答所感興趣的問題。這種基於計算的定量方法直接把理論和數據結合起來,採取的是演繹的思路。

舉例來說,在一個真實經濟周期(Real Business Cycle)模型中,基本因果關係如生產函數、效用函數、效用最大化和競爭均衡的假設都是先驗構造的,不過其中的結構性參數如要素份額、貼現因子、折舊率則是通過模型的均衡條件都必須與長期增長處於穩態這個判斷相吻合而校準得到的。這種定量方法通過先驗地構造基準模型,可以為具體機制如何相互影響提供一個框架,只是其中不同機制的相互影響並非完全任意。定量方法在貨幣經濟學和宏觀經濟學中的應用大多使用動態一般均衡(DynamicGeneral Equilibrium)框架來構造模型經濟。這個框架的一大特點是明確含有當事人所面臨的各種優化問題。此外,定量方法在產業組織和市場營銷研究中也有應用,在其他領域的應用前景也十分廣闊。

定量方法和計量方法有很多不同點。比如,在對待數據和理論間的關係上就有根本的不同。因為定量方法中的因果關係是先驗構造的,這種方法沒有提供因果關係存在與否以及大小如何的直接證據,只是要求其中的結構性參數必須與現實世界中最重要的事實相一致。在使用數據上,與計量方法不同,定量方法並非從數據中識別因果效應,而是通過模型評估因果效應。比如,在宏觀經濟學中,實證研究一般根據可被反覆觀察到的穩定的事實證據推斷模型中結構性參數的取值。一旦確定結構性參數,參數化模型就成為一個人造的數據生成過程(data-generatingprocess),可以創造與真實數據可比的數據序列。通過調整模型中的政策變數,可以模擬出在某個具體情境下變數間的因果性關係。這種思路不必依賴歷史數據的相關性,在理論上克服了「盧卡斯批判」(Lucas,1976)。

儘管存在很多差異,結構性實證研究中的這兩種方法並不矛盾,而是相輔相成的。在先驗地構建模型之前,應該從豐富可靠的經驗研究中獲取素材;在建構模型之後,為了推斷結構性參數的取值,也應當儘可能廣泛地考慮相關的實證證據。由於實驗主義方法既能夠可信地識別變數之間的因果效應,又可以幫助推斷結構性參數的取值,在結構性實證研究中實在是大有可為。在政策評估和福利分析中發揮定量方法的優勢,在使用數據和推斷因果效應時發揮計量方法的長處,把實驗主義方法中使用的工具與純粹的演繹思路相結合,勢必將結構性實證研究推向新的階段。

從上面的分析可以看出,實驗主義方法「知其然」,而不「知其所以然」;結構性實證研究雖然有希望回答「為什麼」的問題,但是在具體操作上並沒有比較統一的做法,還有廣闊的發展空間。因此,在以經濟學理論為基礎的結構性實證研究的框架下,將計量方法與定量方法結合起來是一條有希望的新思路。具體而言,是用參數化的定量模型構造變數之間的因果關係,同時使用包括實驗主義方法的工具在內的計量方法來估計模型中的結構性參數,以及構造重要的卻無法直接觀察的變數。這種思路已有許多探索和嘗試。比如,宏觀經濟學中廣泛應用各種動態一般均衡模型,就是構造參數化定量模型的結構性實證研究。比如,兩篇真實商業周期模型的原創貢獻文章,Kydland和Prescott(1982),King和Plosser(1984)即為這方面的典範。此外,使用參數化定量模型的結構性實證研究也可以探討很多難做實驗的領域中的問題。

5、結論

實證經濟學自上世紀八十年代以來取得了巨大進展。面對當時的諸多挑戰,實證經濟學家發展和改進了實驗主義方法、穩健的經濟計量推斷和結構性實證研究,提高了可信地推斷因果關係的能力。這些新發展不僅改變了計量經濟學理論和眾多領域中實證研究的面貌,而且加深了對理論和數據之間關係的理解,也釐清了實證經濟學中已經解決和很多亟待解決的問題。現在我們已經知道,實驗主義方法能夠「知其然」,而結構性實證研究是為了「知其所以然」;儘管代價高昂,實驗和自然實驗比敏感性分析能更堅實地積累可靠的實證證據;以及在結構性實證研究中,計量方法需要和定量方法相結合,以獲得新的生命力。

雖然實證經濟學發展迅速,但是在可信地推斷經濟行為背後的因果關係方面仍未克竟全功。所以,雖然實證經濟學家都致力於更好地將理論和數據匹配在一起,很多經濟學實證研究與理論的關係仍然鬆散,理論與數據仍不協調。使用參數化定量模型的結構性實證研究在概念上可以克服這個困難,並且在多方面已經有了很多嘗試。可以預期,未來實證經濟學中將有更多採用這種思路的研究。

本文轉載於公眾號計量經濟學


推薦閱讀:

一掌經實證
麻黃湯(發汗解表,宣肺平喘——外感風寒表實證)
再談「把實證研究進行到底」
實證佛教問答(答疑解惑)三
常偉:社會科學何以走出偽實證研究

TAG:經濟學 | 經濟 | 實證 | 研究 |