標籤:

什麼是面板數據?


面板數據=時間序列數據+截面數據


面板數據,即Panel Data,也叫「平行數據」,是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。傳統的計量模型分為時間序列模型和截面模型,對於前者的深入分析很多超出了經典計量經濟學的範疇,而在金融鄰域應用較多,而經濟學上往往更加關心的是截面模型,這一模型可以寫作m y=m alpha+m Xm eta+m epsilon,其中m y,m a,m epsilon都是N	imes 1維的列向量,表示截面上的N個樣本,而m XN	imes K維列向量,第i列表示各個樣本第i個因素的觀測值。例如,我們可以利用上述模型研究150個國家消費和GDP之間的關係。

而面板數據分析中,我們得到的是比如說是3年中150個國家消費和GDP的數據,此時,我們可以更加深入地研究消費和GDP的關係,除了樣本量本身增大之外,有可能我們會思考是不是不同國家的消費和GDP的關係不同,這體現在截距malpha或者斜率meta上,又或者不同年份消費和GDP的關係不同,亦或是上述的情況都存在,這些考慮產生了三類面板數據模型,分別如下(T是時間長度):

模型1:m y_i=m 1_mathrm{T} m alpha_i +m X_im eta_i+m u_i,這時m y_iN	imes 1維列向量,而m yNT	imes 1維列向量

模型2:m y_i=m 1_mathrm{T} m alpha_i +m X_im eta+m u_i

模型3: m y_i=m 1_mathrm{T} m alpha +m X_im eta+m u_i

而實際上,通過重新定義矩陣,我們可以把上面的三個模型都寫為經典模型的形式,m y=widetilde{m X}widetilde{m eta}+m u。這一塊知識在高級計量中有涉及。這裡僅僅以模型1為例。

定義underset{NT	imes N(K+1)}{widetilde{m X}}= diag(widetilde{m X_1},dots,widetilde{m X_N}),其中underset{T	imes(K+1)}{widetilde{m X_i}}=(m 1_mathrm{T},m X_i)widetilde{meta}=egin{pmatrix}
m alpha_1 \
m eta_1 \
vdots \
m alpha_N \
 m eta_N\                                                                                                                                                  end{pmatrix}_{N(K+1)	imes 1}m y =egin{pmatrix}
m y_1 \
m y_2 \
vdots \
m y_{N-1} \
 m y_N\                                                                                                                                                  end{pmatrix}m u =egin{pmatrix}
m u_1 \
m u_2 \
vdots \
m u_{N-1} \
 m u_N\                                                                                                                                                  end{pmatrix},則模型1可以寫成m y=widetilde{m X}widetilde{m eta}+m u,其餘兩個模型處理起來方法類似。如果殘差項滿足Gauss-Markov假設,那麼我們就可以和經典的計量模型一樣,將widehat{m y}的估計看作是m ywidetilde{m X}的列空間上的投影,所以widetilde{m eta}的LS估計為widehat{widetilde{m eta}}=(widetilde{m X}^Twidetilde{m X})^{-1}widetilde{m X}^Tm y

當然,上述三個也只是最基本的面板數據模型,更多更複雜的模型是在其基礎上引入的,比如帶滯後項的模型,以及更複雜的殘差假設。這需要用到GMM,GLS,FGLS,ML等等更複雜的估計方法。對面板數據模型的分析,Cheng Hsiao的Analysis of Panel Data CHENG HSIAO.pdf_免費高速下載是一本不錯的書,對時間序列的分析,可以參考Tsay的《金融時間序列分析》。


相當於將時間切片,每個切片上都有一組相同性質的數據,就像將長條麵包切成麵包片,然後研究每片麵包上不同的孔洞的關係。


panel data即每個截面數據都包括他的時間序列數據。如果每個截面數據只包括兩三個時間序列數據的話是pooled cross section。


面板數據(Panel Data),是截面數據與時間序列數據綜合起來的一種數據類型。


面板數據有時間序列和截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度的時間序列或者截面數據排在一條線上有著明顯的不同,整個數據表格像是一個面板,所以把panel data譯作「面板數據」。


推薦閱讀:

固定效應模型與隨機效應模型的區別?
如果用總體作為數據,那麼回歸係數的顯著性還有意義嗎?
為什麼異方差只有對非線性模型來說才是致命的?
計量經濟學中t檢驗f檢驗是什麼 他們有什麼關係?
一個變數的計量結果原本不顯著,但增加控制變數後變得顯著,其結果是否可信?

TAG:計量經濟學 |