為何兩階段工具變數回歸中第一階段要包括其餘所有外生變數?
01-23
我覺得是因為如果不包括的話,第一階段回歸的殘差可能會與第二階段的外生變數相關從而導致估計值有偏,但感覺寫出來的證明不夠清晰完整。
你可以查一下如何證明control function方法在線性模型下等價於2SLS,並證明其一致性,然後在這個過程裡面你稍微改一下就可以證明如果不控制所有外生變數的話,參數估計是不一致的了。
其實不用證明,按照你的直覺,舉個反例就可以了。Stata | FAQ: Two-stage least-squares regression 有解釋。根據他的解釋,在這種系統中:
Y1 = a0 + a1*Y2 + a2*X1 + a3*X2 + e1 (1)
Y2 = b0 + b1*Y1 + b2*X3 + b3*X4 + e2 (2)
第一階段不放 X2 會導致 a1 和 a3 估計產生偏差,除非 b1 = 0. 但是哪怕是 b1 等於零,放入 X2 更有效。
另外 Stata 那個網址 引用了 Baltagi (2011),但是我去翻 Baltagi (2011) 發現他並沒有說這回事。所以存疑。伍德里奇的習題5.11簡要說明了這個問題。
對於線性回歸方程:
與不相關,與相關, 令為工具變數,為所有外生變數(包含和)。如果第一階段只有對的回歸:
可以得出:
此時,只能得到:和不相關,不能得到和不相關。會造成不一致。而當第一階段用所有的外生變數回歸時,上述問題可以避免。第一階段的回歸相當於提取所有工具產量的信息,使工具變數個數和內生產量個數相同,減少了弱工具變數的問題,另外調整了模型自由度
你的理解是對的,證明建議去看看伍得里奇的書
推薦閱讀:
※強外生的假設在大樣本下有什麼用?
※如果沒有剝削經濟能發展嗎?
※勞動價值論怎麼解釋地租的來源?
※馬克思主義(馬克思主義政治經濟學、哲學,以及科學社會主義)是怎樣相對衰落的?
※為什麼在某些市場,玉石的原件出售時不切開來,讓買家來猜測玉石的玉質是怎樣的?試從經濟學角度分析。