弱工具變數的判定指標都有什麼?
比方說F統計量要超過10,瓦爾德檢驗最小特徵值要大於要大於相應顯著性水平的臨界值等,這些指標如果不能同時滿足哪些指標要優先滿足呢?只滿足其中的一個能拒絕「弱工具變數」的假設么?
謝邀。這是個好問題,也是我在應用的時候比較疑惑的。為了不誤導大眾,我決定一邊截屏一邊說一下自己的理解。首先,什麼是弱工具,弱工具會導致什麼問題?
弱工具會導致工具變數的估計之嚴重偏向OLS的估計值,而且假設檢驗也失效了。
對於偏差的分析,推導過程從略:首先,偏差的方向是與OLS一致的。其次,影響IV估計偏差的因素有:若工具、內生問題的程度以及過多的工具的問題。檢驗:也就是題主提到的F&>10的條件。還有別的辦法:認真回答一下這個問題,學藝不精求輕噴。
首先需要知道的是,對弱工具變數的檢驗以及判定是一個至今為止仍在發展的領域。題主問題:弱工具變數的判定指標都有什麼?我會把現有的指標羅列出來,儘可能詳細地介紹一下。首先,這類指標應當分為兩類,
第一類單純地叫做weak identification test(弱識別檢驗);第二類叫weak-identification-robust inference(穩健弱識別推斷,不太確定中文是不是這麼翻譯)。為什麼會把現有的指標分為兩類,後面我將會提到。但在正式進入之前,我十分想強調:弱工具變數檢驗的指標和你的模型假設緊密相連的,也就是說,不談specification的test都是耍流氓!首先講weak identification test,原本只想介紹用法,但是這裡不得不提一下一個最基本的理論,一個「好的」工具變數應該具有什麼樣的性質:
1. 弱外生性:就是說你的工具變數和你的誤差項直接沒有關聯,及Cov(z, e) = 0;2. Rank condition:你的工具變數得和你潛在有內生性問題的變數有關聯,及Cov(z, x) 不等於0;3. 這個關聯不等於零還不夠,還不能太小。這三個性質可以概括為工具變數的「validity"(有效)和「strength」(強),但是這三個性質如何分組變成以上兩個,據我們老師說,不同文獻里表現得也有些混亂,有的把違背1單獨認為叫無效工具變數。而由於違背了2也就同時違背了3,這樣的工具變數稱為弱工具。但是更多的是認為,1和2為有效工具變數的條件,3為強工具的條件。多說了很多,其實就是為了說明在涉及工具變數檢驗的問題上,無效工具變數問題是和弱工具變數問題緊密聯繫的。這也就是為什麼我們可以把一系列無效識別檢驗統計量進行一些「延伸」便可以進行弱識別檢驗。其中這個F大於10其實就是關於Cragg-Donald statistic 的一個約定俗稱的要求。說了這麼多,不如直接把我之前presentation里整理的內容貼出來:
我目前知道的Stata里可用的也就這四種,而且,我也說了,不談specification就是耍流氓,第一個第二個的假設你們也看到了。從LM到Wald就是一個從underidentification到weakidentification「延伸」的過程,而且你還可以選擇「延伸」多少,其實就是通過顯示不同「延伸」程度的p-value來幫助你觀察弱工具變數問題,隨便發些文獻里出現的表格和我自己搞的東西感受一下:正好在複習高級計量經濟學,來回答一下。
在stata里跑一下代碼:1.quietly ivregress gmm y x1 x2 x3...(xn=iv1 iv2...),vce(robust)2.estat firststage,forcenonrobust
運行結果出來後,會是像上圖一樣的結構,我們一般主要關注三個紅圈的位置,判斷方法有三種:
(我這裡就直接用圈裡的數字代表位於紅圈位置的數字了)1. 44.823&>10,則不是弱工具變數2. 44.823&>16.85,則不是弱工具變數3. 62.749&>16.85,則不是弱工具變數這個回答只能回答判斷弱工具變數的指標有哪些,至於提問者提出的「這些指標如果不能同時滿足哪些指標要優先滿足呢?只滿足其中的一個能拒絕「弱工具變數」的假設么?」我也不知道。希望能看到其他大神的解答,共同進步!沒有指標好像?2sls的第一階段F值小於10是一個你可以看著用的~。。。。
mark
推薦閱讀:
※二項分布檢驗和卡方檢驗的區別?
※為什麼斷點回歸可以解決內生性問題?
※經濟學研究中,哪些領域的數據搜尋比較需要爬蟲技術?
※實證檢驗博弈論模型推出的結論,用reduced form的計量方法是否不合適?