標籤:

計量結果和我想要講的故事不一樣怎麼辦?

以hausman檢驗為例。

先做了固定效應回歸效果不好,又做了隨機效應回歸效果除了某個參數效果不好,其他都很好,p值很漂亮0.0000。接著hausman檢驗,p值為0.0000。。。納尼,這是讓我接受效果不好的固定效應么???求大神指點啊,故事怎麼寫啊?


這的確是一個在實證中特別常見且特別讓人抓狂的事情。

很多隻粗淺學過一點理論沒有深入思考的人可能會有一個誤區:固定效應總是比隨機效應要好的,因為固定效應是穩健的,隨機效應可能受到不可觀測的個體效應的影響。

在大多數時候,這是對的。

我們一般計量教材上假設的DGP是這樣的:

y_{it}=alpha_i +x_{it}eta+u_{it}

其中α是不可觀測的異質性,α跟u是可能相關的,這個時候RE是不一致的,而FE是一致的,所以FE更加穩健。

然而這是計量經濟學家寫的故事,從統計理論上來說,這當然是對的,但是在應用的時候,故事就不一定這麼簡單了。

在做應用的時候,理解自己所使用的方法跟理解自己所要解決的問題一樣重要。這裡對方法的理解最重要的是,回歸的結果究竟在識別什麼東西?回歸本質上就是在做比較,那麼我們究竟是用了什麼樣的信息,拿什麼跟什麼比較得到的結果?

比如在面板數據的FE和RE裡面,我們知道面板數據有within group和between group兩部分信息,FE僅僅使用了within group信息,而RE則同時使用了within group和between group兩部分信息。

換句話說,FE實際上沒有在個體之間做比較,只是比較了同一個個體歲x和y隨時間的變化。

不得不承認的是,再漂亮的計量方法,也是基於假設的,改變不了我們對現實DGP幾乎一無所知的事實。因而,再牛的計量方法,也都是基於假設的,基於我們對現實DGP的假設。

比如上面關於面板數據的DGP,你既然可以像上面那樣寫,我這樣寫可不可以:

x_{it}=x_i^*+v_{it}

其中 x_i^* 是一個長期均衡, v_{it} 是一個個體異質性的對x的衝擊。

我們真實的y可能不僅僅對 x_i^* 做出反應,也會對異質性衝擊 v_{it} 做出反應,比如:

y_{it}=alpha_i+eta x_i^*+delta v_{it}+u_{it}=alpha_i+eta x_{it}+(delta-eta) v_{it}+u_{it}

如果β=δ,那麼這個DGP就變成了一般寫的DGP。但是,比較有意思的是,β和δ也有可能不相等,甚至符號都是相反的。

這個時候我們會發現,FE估計的是δ,而RE估計的是β和δ的一個線性組合。

比如,(我隨便講的)故事可以是這樣的:x是每天的收入,y是每天的工作時間, x_i^* 是一個長期的均值,而 v_{it} 是每天的「運氣」。

然而個人對於「長期的日均收入」和「因為運氣導致的某一天收入的增加」的反應可能是不一樣的。考慮兩個人:

  1. 如果一個人的日均收入更低,他可能會工作的時間更長才能吃飽飯,平均而言他會工作的時間也越長。這是在不同的個體之間比較。
  2. 然而如果某一天運氣不好,心情低落,他有可能提前自己一般的工作時間,早早就下班了。這是同一個人不同時間做比較。

如果這個故事成立,那麼β是負的,而δ的符號就是正的。

所以你如果用FE做,得到的結果是正的;用RE做,得到的結果方向則是不確定的。

關鍵的差別在於,FE只用了組內信息,而RE綜合使用了組內和組間信息。

所以你想要的究竟是β還是δ?

所以該怎麼辦?繼續想故事唄!

PS:我印象中公司金融有篇文章討論了公司金融中固定效應和隨機效應的使用問題,發表在金融很好的期刊上面,但我忘了名字了。知道的煩請告知一下,謝謝!


FE is more general than RE. If RE is the correct specification, in principle the results from FE should be similar, at least asymptotically. Sharp contrast between results from RE and those from FE overshadows RE. Your Hausman test further confirms the misspecification of RE.

A story with no solid scientific evidence is a fiction that no one would believe.


只要對數據嚴刑拷打,他會招出任何你想要的信息


高票慧航大神已經說得很好了。主要是弄清你的模型里固定效應和隨機效應的含義。

我補充下如果真的做出來不好的結果應該怎麼辦的方法吧。

如果是固定效應更符合你的分析的話,即使結果不好也請用固定效應的結果,改一下你的故事,把你的猜想和結果的差距以及可能造成這個結果的原因寫出來。如果時間充裕,可以做部分數據的回歸或者加入其它數據(比如其它相關數據和交叉效應),進一步驗證你覺得造成這種差距的原因,或許會得到更有趣的故事。

個人不太贊同對數據嚴刑拷打的方法,因為有結果的穩定性的要求。更好的是在原數據的基礎上進行適當的添加和處理(前提是原數據沒有問題)。


感覺是不是用來回歸的數據里有兩列以上數據本身就相關性很大。

假如有兩個x都很類似,P值就亂套了。

先把X1 x2 x3 之間的相關性做個矩陣,查一下。


刪數據,加大縮尾百分比,國內這個環境不直接改結果已經算良心了


推薦閱讀:

二值因變數可以用 ols 回歸,然後消除異方差進行 t,F 檢驗么?

TAG:EViews |