面板數據,截面數據,時間序列數據的區別,適用範圍各是什麼?


圖片來源見水印


剛好自己複習,找到簡單易懂的分享來。reference from 長腿阿大_新浪博客

橫截面數據、時間序列數據、面板數據

橫截面數據:

橫截面數據是在同一時間,不同統計單位相同統計指標組成的數據列。橫截面數據是按照統計單位排列的。因此,橫截面數據不要求統計對象及其範圍相同,但要求統計的時間相同。也就是說必須是同一時間截面上的數據。

時間序列數據:

在不同時間點上收集到的數據,這類數據反映了某一事物、現象等隨時間的變化狀態或程度。

面板數據:

是截面數據與時間序列數據綜合起來的一種數據類型。其有時間序列和截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度的數據排在一條線上有著明顯的不同,整個表格像是一個面板,所以把panel data譯作「面板數據」。

舉例:

如:城市名:北京、上海、重慶、天津的GDP分別為10、11、9、8(單位億元)。這就是截面數據,在一個時間點處切開,看各個城市的不同就是截面數據。

如:2000、2001、2002、2003、2004各年的北京市GDP分別為8、9、10、11、12(單位億元)。這就是時間序列,選一個城市,看各個樣本時間點的不同就是時間序列。

如:2000、2001、2002、2003、2004各年中國所有直轄市的GDP分別為:

北京市分別為8、9、10、11、12;

上海市分別為9、10、11、12、13;

天津市分別為5、6、7、8、9;

重慶市分別為7、8、9、10、11(單位億元)。

這就是面板數據。


大概像...長方形,長方形的長,長方形的寬?


這個就比較形象了。

假如一個課題是,男朋友顏值跟女生胸部大小的關係的關係。

那麼,你可以找到這個數據,2015年不同罩杯的女生的男朋友顏值高低,這就是橫截面數據。同一時間點上不同的解釋變數對被解釋變數的影響的數據。

你還要找這個數據,同樣是C杯女孩,2006-2015年間,男朋友顏值的高低的不同。(不是同一個c女孩,只是都是c杯,忽略十年間審美的變化穿著打扮,就看臉!)這就是時間序列數據,不同時點上解變數對被解變數的影響的數據。

你最後合併一下變成三維數據,又有時間,又有不同罩杯。是不是更牛逼了,這就是面板數據。

這些很基本的概念,建議樓主看一本書,講的通透!適合初學者,黃少敏博士編著的《計量經濟學入門》

現在還在我手機里,很多概念,還原到最初,非常容易理解。


舉個栗子!

時間序列數據:北京一年來每天的平均溫度。

截面數據:北京,上海,深圳,廣州某一天的平均溫度。

面板數據:北京,上海,深圳,廣州這一年來每天的平均溫度。

適用範圍!

時間序列數據:某一個個體隨時間變化產生的數據。

截面數據:許多個個體在同一個時間下由於個體不同而產生的數據。

面板數據:前兩個的綜合——許多個個體由於個體不同以及時間變化產生的數據。

分析方法!

時間序列數據:主要圍繞時間變化,可看總體趨勢,季節性,周期性,ARIMA(自回歸,滑動平均,差分)等。

截面數據:主要圍繞統計個體區別,可用線性回歸,主元分析等。

面板數據:前兩個的綜合。

歡迎補充和指正~


截面數據是不同統計單位在相同統計指標的數據。試用範圍是比較同一時間不同個體的差別

時間序列數據是同一個體在不同時間點或者時間段的數據。試用範圍是研究同一範圍不同時間的變化。

面板數據是不同個體在不同的時間所觀察到的數據。有點像二維坐標系裡第一一象限的點。一般是時間序列分析里解釋變數出現相關關係(多重共線行),或者截面數據在統計過程中出現遺漏變數(不同個體之間有不可觀察的差異)的時候,這兩種情況用面板數據。


推薦閱讀:

哪些經濟學教授對機器學習有所涉獵?(不限國家地區)?
有哪些只用了OLS這樣簡單的方法卻發表在經濟學頂級期刊的論文?
為何兩階段工具變數回歸中第一階段要包括其餘所有外生變數?
強外生的假設在大樣本下有什麼用?
如果沒有剝削經濟能發展嗎?

TAG:數據 | 數據分析 | 經濟學 | 計量經濟學 | 時間序列分析 |