工具變數(Instrumental Variable)

工具變數,剛剛開始學起來感覺是一個比較抽象的概念,好吧,可能計量整個學起來就是屬於比較抽象的,因此試圖以自己的方式來把工具變數說的盡量清楚一些。

首先,要明確工具變數本質上是來解決內生性問題的,比如:研究一個人的工資水平wage由什麼決定,我們提出由:性別male,年齡age,智商IQ三個因素決定,因此,我們有:

wage=beta_0 +beta_1age+beta_2male+beta_3IQ+u

但是這裡有一個問題,即:IQ具有內生性問題,IQ由於存在測量誤差,因此和u相關,有內生性問題,我們知道這會導致IQ的估計係數 beta_3 有偏,如下圖所示(估計出來的 beta_3 一部分是x變化對y的影響,另一部分則是u導致的x變化進而導致的y變化):

因此我們需要來解決這個問題。如何解決呢?我們可以使用工具變數來解決。假設工具變數是父母的受教育程度z,那麼我們首先以圖解的形式來看看z的作用到底是什麼?

z的作用本質上就是z變化引起x變化進而引起y變化(z和x相關,父母的受教育程度和孩子的IQ相關,這個設定是合理的),這個作用純粹是x對y的影響(受教育程度z和孩子工資不直接相關,因此z不會對y產生直接影響,z對y產生的影響都是通過x產生的),沒有包含u,因為z和u不相關(這也是工具變數的一個要求),所以這樣就可以把 IQ 的係數 beta_3 更準確的估計出來。

關於工具變數的使用可以分為以下幾種情況:

1、簡單回歸,一個內生解釋變數,無其他解釋變數:直接計算協方差即可

2、多元回歸,一個內生解釋變數,多個外生解釋變數:結構方程聯立求解,其實也就是聯立方程組求解

3、模型中只有一個內生解釋變數,但是該內生變數有兩個或者多個工具變數,無法取捨,並且也想充分利用兩個工具變數包含的信息:2SLS, 兩階段最小二乘法

4、模型中有很多內生解釋變數:判斷階條件,即:工具變數個數一定要大於內生變數個數(對於每一個內生變數來說),然後和3一樣,使用兩階段最小二乘法即可。

兩階段最小二乘法:

第一階段:判斷工具變數是否有效,因為你不能隨便找一個變數就說他是工具變數,這裡主要是判斷是否是好的工具變數(即工具變數和內生解釋變數之間的相關性,得強相關才行,如果弱相關就會出現問題),所以第一步就是用內生解釋變數對工具變數和模型中的其他變數做回歸,其實我也就是把原來的wage換成了現在的IQ。

第二階段:用第一步中擬合的 hat{IQ} 代入到原來的模型中,因為此時的 hat{IQ} 是純凈的,和u不相關,(想想為什麼? hat{IQ} 是由工具變數和其他外生變數決定的,工具變數和其他外生變數和u都不相關,所以 hat{IQ} 和u也不相關),這個時候再做回歸,得出的 IQ 的估計值hatbeta_3 的估計值就無偏了。

一些需要注意的問題:

是否有內生性問題:如果沒有內生性問題,那麼OLS更加合適(因為OLS估計量的方差更小),所以首先可以使用Hausman檢驗,檢查是否具有內生性問題。如果具有內生性問題,再使用工具變數法。

弱工具變數,如果工具變數和內生變數相關性很小,可以證明方差會很大,是一個問題

解決方式:1、尋找更好的工具變數 2、使用LIML,有限信息極大似然估計法。

過度識別檢驗:

工具變數也可能和u相關,導致工具變數法會產生誤差,所以需要檢驗工具變數是否嚴格外生,但是這在恰好識別的時候無法做到,只有過度識別(工具變數個數大於內生變數個數時)才能使用過度識別檢驗。

工具變數和代理變數的區別:一個必須直接影響wage,另一個則不能直接影響wage。比如:IQ是能力的一個很好的代理變數,但是它卻不是能力的一個很好的工具變數(想想為什麼)

處理測量誤差:

由於解釋變數測量誤差問題引起的內生性問題,如果我們有兩次測量,那麼就可以解決這個內生性問題,但是如果我們只有一次測量,則無法解決內生性問題。


推薦閱讀:

TAG:微观经济学 | 工具变量instrumentalvariable | 计量经济学 |