Barro Regression 是什麼樣的回歸?和一般的 OLS 回歸有什麼區別?


Barro QJE 1991 年的那篇Economic Growth in a Cross Section of Countries裡面這麼寫的

1) log y_{i,t}-log y_{i,t-1}=eta_{0}+eta_{1}log y_{i,t-1}+eta_{2}edu_{i,t-1}+varepsilon_{i,t}

其中,y_{i,t} 是i國家在t時刻的人均gdp。加了log之後,log y_{i,t}-log y_{i,t-1} 就近似是i國家從t-1 到t時刻的人均gdp增長率。edu是一個衡量該國人力資本存量的變數,可用諸如該國有多少比例的人上過中學之類的變數來代替。

這就是OLS啊。

Barro regression高明的地方在於,在回歸式裡面首次加入了「教育」這一項,而「教育」這一項起到一個proxy variable的作用:用來代表各個國家的某種「自身特質」。

如果不加如edu這一項,eta_1 t檢驗過不了,t檢驗過不了當然就發不了paper。但是Barro發現加入教育之後,eta_1居然顯著為負了,完全符合solow模型的預測!

這裡提一下1)是怎麼來的。1)不是瞎編的,是從Solow模型在均衡點的擾動推出來的(經過所謂的log-linearization),eta_1&<0 反映的是solow系統的收斂。原始的solow模型,推出來是這樣的,

2)log y_{i,t}-log y_{i,t-1}=eta_{0}+eta_{1}log y_{i,t-1}+u_{i,t}

人們OLS一下,發現eta_{1}基本就是0啊,根本不收斂啊。為什麼會這樣呢?是因為誤差項u 是會和自變數y 相關的。這個相關性正好抵消了回歸係數。

更本質原因在於,原始solow模型的絕對convergence是不可能存在的,國家的經濟發展會收斂到一個由國家自身特質決定的值上。這個「自身特質」是什麼?Barro的研究說明教育水平,就是一個衡量這個「自身特質」的指標。所以當加入這個指標時,奇蹟就發生了啊。

最後,說點題外話。Barro的這個發現後來明顯有被濫用的趨勢(部分原因也是這個發現太有名了),不少人直接把回歸結果解釋成:教育對國家發展有積極促進作用(證據就是eta_{2}>0顯著)。剛才說了,教育其實是起到proxy某種國家的「自身特質」的作用,這個「自身特質」,可能是文化、人們對工作積極的態度、政治清明、社會組織效率、上帝的眷顧、等等。這些因素都會正面影響教育,同時正面影響gdp增長率。所以這個統計模型是無法告訴我們因果關係的。

再後來,有兩個大神Mark Bils and Peter J. Klenow 開始想這個問題:教育是不是直接促進了經濟發展呢?他們在AER 2000 年寫了Does schooling cause growth?有興趣的可以參考這篇。他們經過大量數據工作,指出了這麼一個違反人類直覺的結論:就是教育其實是被經濟發展決定的,而不是決定經濟發展。


推薦閱讀:

日本國內的市場競爭激烈程度比中國大嗎?
比特幣價格波動主要受什麼影響?
為什麼心理諮詢要收費那麼高,讓普通大眾消費不起的?
為什麼很多說高鴻業的經濟學教材不好?
如何反駁「愛國就不買IPHONE」?

TAG:統計學 | 經濟學 |