解釋變數互為因果如何處理?
我的模型是y=x1+x2+u,正常來說討論的都是y和x1或y和x2之間的互為因果關係,也就是存在內生性採用工具變數方法。
那如果是x1和x2互為因果我要如何處理呢,是多重共線性嗎?兩個變數我都不能刪除,都是重要解釋變數。求助!!!!!!!!O(∩_∩)O謝謝 補充說明:研究的是x1對y的直接影響,以及x1通過x2對y的間接影響,所以不能刪除其中某一個變數,不知道有什麼好的辦法可以實現,結構方程模型由於我面板數據年份挺長,也不知道怎麼處理好。
謝邀。x1 和 x2如果存在互為因果,建議不處理。
當你發現很多變數都存在互為因果的問題,建議把所有可能的因果方向都寫下來,組成一個聯立方程模型,幫助你從系統內部找工具變數。
注意雖然你把聯立方程寫下來了,不代表你要估計所有的聯立方程結構參數,從聯立方程找到工具變數,估計單方程就可以了。首先,不管X1和X2在意義上是否是因果,先檢測一下X1和X2之間的多重線性程度,比如相關係數和VIF值,超出標準並且是顯著的,則至少統計上來說肯定存在多重線性了。
再次,看一下這兩個變數在模型中是否都是顯著的,既然存在多重共線性,那說明X1的很大部分能夠被X2解釋嘍,題目中也說,X1和X2互為因果,那麼X1就基本上可以代表X2了。既然這樣,幹嘛還要兩個?所以很可能這兩個只有一個是顯著的(另一個因為被解釋了很多部分所以不顯著了),不顯著的就不能放進模型了。
如果兩個變數都顯著又存在嚴重的多重線性,那麼可以試試如下辦法:
(1)從意義上做一點改變
比如 心臟病 = age + 累積抽煙數量 ,累積抽煙數量和age肯定有共線性,那麼就換成每天平均抽煙數量,就好了(這個例子有點奇怪,大概意思你懂的)。再比如GDP與人口存在多重線性,那麼就把這兩個都變成增長率,而不是用絕對值。
(2)主成分
提取X1和X2的主成分作為新的變數,放進模型中。(3)嶺回歸
每個回答多重線性的人都會提的一個方法,雖然使用率很低但是還得提一下。先聊這麼多,佔個坑,趕著端午回家過節。
祝課題順利!不建議直接忽略因果性,建議做一個multicolinearity test, 如果有weak multicolinearity的結果,test variance會很大。
否則可以不處理。同建議不處理。多元回歸的本質是解決簡單回歸的遺漏問題,因此可以預期各個解釋變數間應該是相關的。至於多重共線,以我研究的方向來看,現在鮮有論文對此處理,並且正如上面所說,解釋變數間相關是應該的,不相關的話,簡單回歸就好了。我們需要防止的是完全共線,當然,這種情況軟體會自動識別的,模型設計時稍加註意就好。
不用處理。是否為多重共線性用vif判斷。
推薦閱讀:
※喜歡的姑娘在學stata 怎麼用stata來送一份與眾不同的生日禮物?
※VAR模型/vecm模型殘差自相關怎麼辦?
※在利用多值有序響應的 logit 模型或者 probit 模型時,有沒有限制的條件?
TAG:Stata |