弱工具變數的判定指標都有什麼?

比方說F統計量要超過10,瓦爾德檢驗最小特徵值要大於要大於相應顯著性水平的臨界值等,這些指標如果不能同時滿足哪些指標要優先滿足呢?只滿足其中的一個能拒絕「弱工具變數」的假設么?


謝邀。這是個好問題,也是我在應用的時候比較疑惑的。為了不誤導大眾,我決定一邊截屏一邊說一下自己的理解。

首先,什麼是弱工具,弱工具會導致什麼問題?

弱工具會導致工具變數的估計之嚴重偏向OLS的估計值,而且假設檢驗也失效了。

對於偏差的分析,推導過程從略:

首先,偏差的方向是與OLS一致的。其次,影響IV估計偏差的因素有:若工具、內生問題的程度以及過多的工具的問題。

檢驗:

也就是題主提到的F&>10的條件。還有別的辦法:

那麼該怎麼做呢?

嗯嗯,我就不翻譯了。

其實就像notes裡面說的,F-statistics只是一個rule of thumb,並不是十分精確。或者說,這只是個檢驗,不是個「假設檢驗」,因為沒有null hypothesis。當然notes裡面提到有人做了檢驗弱工具的假設檢驗。

我自己的理解是,如果你的IV估計結果跟OLS估計結果差別很大,似乎不太需要關心這個問題,因為弱工具會導致你的估計結果偏向OLS估計結果。但是如果你的結果跟OLS結果差不多,檢驗一下弱工具是非常必要的。

回到題主的問題。如果第一階段回歸裡面,工具變數的回歸係數不顯著,自然不是一個好的工具。這個回歸係數自然越顯著越好。但是這裡有個很微妙的東西是,即使這個係數顯著,如果工具跟其他的外省變數有比較強的共線,那麼實際上真正有效的variation就不會太多,也可能導致弱工具的問題。所以工具變數第一階段回歸係數的t-value似乎是若工具的既非必要又非充分條件。同樣,如果F值小肯定不行,但是如果F值大,也還是不能就說明你的工具不弱。

所以,說了這麼多,我好像就是在說,這個問題我也不確定。。。唉。。。

註:以上截圖內容來自Songnian Chen的講義。還有Cameron的微觀計量印象中也講了弱工具的問題,可以參考一下他的書。


認真回答一下這個問題,學藝不精求輕噴。

首先需要知道的是,對弱工具變數的檢驗以及判定是一個至今為止仍在發展的領域。

題主問題:弱工具變數的判定指標都有什麼?我會把現有的指標羅列出來,儘可能詳細地介紹一下。首先,這類指標應當分為兩類,

第一類單純地叫做weak identification test(弱識別檢驗);

第二類叫weak-identification-robust inference(穩健弱識別推斷,不太確定中文是不是這麼翻譯)。

為什麼會把現有的指標分為兩類,後面我將會提到。但在正式進入之前,我十分想強調:弱工具變數檢驗的指標和你的模型假設緊密相連的,也就是說,不談specification的test都是耍流氓!

首先講weak identification test,原本只想介紹用法,但是這裡不得不提一下一個最基本的理論,一個「好的」工具變數應該具有什麼樣的性質:

1. 弱外生性:就是說你的工具變數和你的誤差項直接沒有關聯,及Cov(z, e) = 0;

2. Rank condition:你的工具變數得和你潛在有內生性問題的變數有關聯,及Cov(z, x) 不等於0;

3. 這個關聯不等於零還不夠,還不能太小。

這三個性質可以概括為工具變數的「validity"(有效)和「strength」(強),但是這三個性質如何分組變成以上兩個,據我們老師說,不同文獻里表現得也有些混亂,有的把違背1單獨認為叫無效工具變數。而由於違背了2也就同時違背了3,這樣的工具變數稱為弱工具。但是更多的是認為,1和2為有效工具變數的條件,3為強工具的條件。多說了很多,其實就是為了說明在涉及工具變數檢驗的問題上,無效工具變數問題是和弱工具變數問題緊密聯繫的。這也就是為什麼我們可以把一系列無效識別檢驗統計量進行一些「延伸」便可以進行弱識別檢驗。其中這個F大於10其實就是關於Cragg-Donald statistic 的一個約定俗稱的要求。說了這麼多,不如直接把我之前presentation里整理的內容貼出來:

我目前知道的Stata里可用的也就這四種,而且,我也說了,不談specification就是耍流氓,第一個第二個的假設你們也看到了。

從LM到Wald就是一個從underidentification到weakidentification「延伸」的過程,而且你還可以選擇「延伸」多少,其實就是通過顯示不同「延伸」程度的p-value來幫助你觀察弱工具變數問題,隨便發些文獻里出現的表格和我自己搞的東西感受一下:

說到這裡,發現才講了一半。為什麼會有另一種更「高級」的東西叫weak-instrument-robust inference這種東西出現呢?原因正如高票答主已經說到的,一般的假設檢驗會因為你的弱工具變數問題而失效的。如果我們使用上述幾種檢驗作為pre-test,會產生嚴重的pre-test bias problems。那麼我們有什麼辦法去避免這一問題?一種可行的方法就是放棄點估計方法而去構造一個區間,也就是所謂的Anderson-Rubin test,以及之後進一步發展的Kleibergen K test和Moreira CLR test,這一方法化解上述問題的機制大家可以用下面這張圖感受一下,這裡不做更多說明。

具體選用哪個也是有講究的,但一般來說CLR更為普遍。上面那張表格里就有採用報告CLR confidence set來判斷弱工具變數問題,從檢驗結果看顯而易見,如果這個區間構造不出來,那麼我們並不能排除弱工具變數問題。不得不提到的是,目前Stata可用的weak-instrument-robust inference命令——weakiv,上述三種指標都能report。最重要的是,它可以在non-i.i.d.data乃至GMM dynamic pannel data下使用的(吹一波,我們的計量老師是作者之一。)以上便是我對弱工具變數判定指標的羅列,至於這麼多指標,他們的具體標準是什麼,甚至不同指標間產生相反的結果,我個人認為除了需如實面對以外,更多地是要結合具體問題以及涉及的經濟學理論去討論的,這一部分的文獻讀得不多,看到的結果貌似更多像是上面那張圖展示的那麼統一,這裡就不作誤導了。


正好在複習高級計量經濟學,來回答一下。

在stata里跑一下代碼:

1.quietly ivregress gmm y x1 x2 x3...(xn=iv1 iv2...),vce(robust)

2.estat firststage,forcenonrobust

運行結果出來後,會是像上圖一樣的結構,我們一般主要關注三個紅圈的位置,判斷方法有三種:

(我這裡就直接用圈裡的數字代表位於紅圈位置的數字了)

1. 44.823&>10,則不是弱工具變數

2. 44.823&>16.85,則不是弱工具變數

3. 62.749&>16.85,則不是弱工具變數

這個回答只能回答判斷弱工具變數的指標有哪些,至於提問者提出的「這些指標如果不能同時滿足哪些指標要優先滿足呢?只滿足其中的一個能拒絕「弱工具變數」的假設么?」我也不知道。希望能看到其他大神的解答,共同進步!


沒有指標好像?2sls的第一階段F值小於10是一個你可以看著用的~。。。。


mark


推薦閱讀:

二項分布檢驗和卡方檢驗的區別?
為什麼斷點回歸可以解決內生性問題?
經濟學研究中,哪些領域的數據搜尋比較需要爬蟲技術?
實證檢驗博弈論模型推出的結論,用reduced form的計量方法是否不合適?

TAG:計量經濟學 | Stata |