標籤:

計量經濟學中回歸模型交叉項是怎麼回事?


額,樓主問的有點不太清楚,簡答舉個例子講一下吧。

例子:研究性別和學歷對工資的影響,性別是F,學歷是E,工資是S。

如果沒有交叉項,那麼回歸的方程是S=beta0+beta1*F+beta2*E。

在這種情況下,性別的影響是beta1,學歷的影響是beta2

而有交叉項,那麼回歸的方程是S=beta0+beta1*F+beta2*E+beta3*F*E

在這種情況下,性別對工資的影響是beta1+beta3*E,學歷對工資的影響是beta2+beta3*F

所以我們很容易發現,交叉項刻畫了什麼呢?他刻畫了一個人的學歷對工資的影響是否受性別的影響,刻畫了一個人的性別對工資的影響是否受學歷的影響,換言之,他刻畫了第一種情況下,如果把不同的性別分開回歸,得出的beta2是否與F有相關關係,刻畫了如果把不同的學歷分開回歸,得出的beta1是否和E有相關關係。

更簡單點說,就是兩個自變數對因變數的共同作用。

對一場球賽來說,如果球隊失去主力隊員A贏的概率下降a,如果失去了主力隊員B,贏的概率下降b,而如果同時失去了主力隊員A和B,那麼它贏的概率下降的量可能遠遠大於a+b,這個超過的部分就由交叉變數來刻畫。

對一個債券來說,如果經歷大蕭條,它價格下降的量是a,如果被評級機構降級,它價格下降的量是b,那麼如果它是在大蕭條的時候被評級機構降級,那麼它價格下降的量遠遠超過a+b,這個超過的部分也由交叉變數來刻畫。


簡單來說是醬

Y = β0 + β1 A +β2 X+β3 A*X+ ε

A對Y有影響

X對Y有影響

β3X對Y的影響,因A變化而變化。

如果按照一樓的例子,性別是A,學歷是X,收入是Y,那麼就如同下圖。

如果女的是1 男的是0

β2:對於男性,學歷對收入的影響

β2+β3:對於女性,學歷對收入影響

β3就是兩線的斜率差

β1他們的截距差(性別對收入的影響)


我再補充一點。

@王諾諾 和 @林小姝 童鞋舉的其實是個虛擬變數的例子。看A=0 or A=1情況下某個特定變數斜率的變化。

不過很多時候我們也會關注某個連續變數對其他變數係數的影響,比如http://www.econ.fudan.edu.cn/dofiles/all/20120320164538225.pdf

這篇文章當中,作者關注了政府干預對外資促進就業能力的影響。被解釋變數是就業彈性,fdi變數對這個被解釋變數的影響係數是正的,而政府干預和fdi變數交叉項的係數則是負的。也就是說政府干預削弱了fdi創造就業崗位的能力。

數學上交叉項很好理解,盜用下 @王諾諾 童鞋的式子

Y = β0 + β1 A +β2 X+β3 A*X+ ε

在沒有交叉項時,X對Y的邊際影響,或者是Y對X的偏導數,就是β2,而加了交叉項之後,這個數字就變成了β2+β3 A。換句話說,A影響了X對Y的影響。

具體操作時,當A是虛擬變數,像 @王諾諾 童鞋那樣對比下A=0和A=1時的斜率就好了;而當A是連續變數,那就麻煩一點。除了直接關注交叉項係數顯著性和符號之外,一般還要算下使得β2+β3 A符號逆轉的A的臨界值,再跟樣本中的A的取值對比下,討論討論。


參考伍德里奇計量經濟學現代觀點,P182,P216-P217


DID


也撞到了這個問題,想研究兩個自變數A和B之間的相互干擾程度,自變數A和B同時干擾因變數C,但是隨著A的取值變化,B對C的影響成熟度逐漸變化,同樣,隨著B取值的變化,A對C的影響程度也逐漸變化, 不知道可不可以採用那個交叉項來描述??


想問一下,我想建立模型,比如A不是像性別這種只能有兩種情況的,如果像一天可以分為早上、中午和下午,建立時間(A)和溫度(X)對樹的成長(Y)的影響,應該怎麼建立模型?


推薦閱讀:

時間序列預測方法的能力邊界在哪裡?
計量經濟學中ess、tss、 rss是什麼?它們的關係是?
計量經濟學所談論的「因果」是什麼意思?
怎麼理解在一個計量模型中「選用一階滯後主要是考慮 SIC 信息準則和模型的穩健性要求」?
如何用計量經濟學研究居民消費對 GDP 的影響?

TAG:計量經濟學 |