為什麼要做自相關分析,對數據有什麼條件嗎?

如題,問題可能是涉及到各個專業的,各路大神最好能舉些例子啊,不勝感激=.=


主要回答為什麼要做,也就是與自相關分析有關的模型基礎要先說清楚。

各個專業都可以做啊,只要你感興趣的就行。

自相關無非就是為了了解某個系列(比如股價)受到過去所有/歷史上此系列的線性影響,如果模型合適了便可以做預測。

1、 ARMA模型結合了AR和MA的優勢並降低了階數,但就不好分析兩者的互相影響之處。

選取的數據要求:

- 存在自相關(自相關係數不能太低,通常用R表示要求不少於0.5)。

- 平穩(stationary)或者幾階平穩(取當期與之前期之差,如物價水平的一階差分為通脹水平):強要求是系列的聯合分布是一致的,弱要求是協方差矩陣不依賴於時間【即絕對位置不影響結果,只有相對重要性】。

--- 避免虛假回歸(spurious regression):比如存在高度持續性(persistency)的系列。

- 可以嘗試換滯後的時間刻度:比如年度換成季度。

2、由於受到除此系列以外其他因素/系列的影響,宏觀經濟中的例子通常用向量自相關模型(VAR),那麼還要求檢查系列之間的協整情況(醉漢牽狗的故事:是否狗也是隨機遊走的?),從而決定是否建立向量誤差修訂模型(VECM)。

以上為簡化版本的VAR,還可以用更具有經濟意義的結構化向量自相關模型(SVAR)來描述現象,給數據以更多的限制來識別出經濟因素之間的當期關係,從而預測未來。當然如何識別就得好好想想了。

- VAR的要求要平穩,但如果不平穩也可以做VECM,但是如果同時存在兩種情況,則需要的模型就很複雜了,如有需要再說明。


推薦閱讀:

縱觀中國幾千年的文明史,出現了很多哲學家、倫理學家(孔子、孟子、朱熹等等),但是卻沒有自然科學家?
碎花瓶理論是真實的嗎?
為什麼會有里氏震級為負值的地震?
為何苯的凱庫勒式是不準確的但仍然在用?

TAG:自然科學 | 數據挖掘 | 統計學 | 數據分析 | 時間序列分析 |