什麼是時間序列模型,什麼是弱平穩和嚴格平穩?
哪位精通的大牛來點撥一下,最好給點實際生活里的例子,像金融界的例子之類的。古典線性回歸還能和生活例子結合想像一下,時間序列有點抽象……不知道這個序列到底是什麼序列,是在一個時間點事件概率的分布還是什麼?完全敗了,另外何為平穩。麻煩用生活語言解釋,書上的術語看不懂才來問的
一般而言,時間序列被看作一個隨機過程{Xt},隨機過程是啥,就是一列隨機變數,在離散情況下比如我取前n個就是X1 X2 X3。。。。Xn是個n維隨機變數。隨機變數總學過吧,給你個隨機變數Xi他的期望方差啊分布是什麼之類的就是我們想要研究的。
嚴平穩:多元分布保持不變。(X1,X2,X3)是個三維隨機變數,(X3,X4,X5)也是個三維隨機變數,嚴格平穩表示任何形如(Xn-1,Xn,Xn+1)的三維隨機變數分布都是一樣的。當然不僅僅是三維,而是任何維的隨機變數分布不變。嚴平穩表示的分布不隨時間的改變而改變。我研究第1到第n個隨機變數跟第2到第n+1個隨機變數性質是一樣的。最簡單的例子,白雜訊(正態),無論怎麼取,都是期望為0,方差為1,協方差都為0的n維正態分布。弱平穩:首先要有個平穩的改變,別有啥趨勢,所以任何一點t,Xt的期望是常數(通常我們讓他為0),弱平穩沒有分布不於時間無關這個性質,但是弱平穩抓住了另一個不變性——相關係數。這說明什麼,X1於X3的相關係數, X2與X4的相關係數都是一樣的,也就是 說相關係數取決於時間間隔而非時間起始點。這個東西很有用啊,你做回歸是研究Y依賴於X的關係,可是單一時間序列只有X沒有Y啊,未來某時刻的t的值Xt就要依賴於它的過去信息吧,如果沒有依賴性,那這模型沒法做了,如果有,跟前幾期數據有關係?比如Xt-1 Xt-2能提供預測Xt的信息,那麼這個他們的依賴關係又如何?如果是弱平穩的,這個關係還可能是一致的,否則不同的時間t,Xt與Xt-1 Xt-2的關係不統一,我們還建模個毛線啊?通常情況下時間序列分析討論的是弱平穩序列。
題主說熟悉回歸,那回歸中異方差,多重共線性等問題怎麼解決?同樣,時間序列里你的數據平穩不平穩對你的建模也是至關重要,弱平穩是許多時間序列模型的假設條件。最上面的答案說的挺對,但未必是提問的人想要的,參考下我之前寫的一篇筆記吧
概念簡述
先說兩個例子大家體會下:
例1:炒股的人都想預測明天是漲還是跌,實際上我們已經積累了大量的歷史數據,說不定還是可以預測的!某股票已經連續漲了3天,明天會不會再漲呢?某股票連續跌了7天了,明天應該不會再跌了吧?
例2:很多商家會在某些節假日時,重點銷售某些產品,以求可以賣出更多,聖誕節快到了,應該主推什麼產品好呢?實際上各商家的收款系統中,記錄了大量的與時間相關的銷售數據,如果對這些數據做一下時間序列分析,說不定能找到重大商機。
時間序列分析,顧名思義,輸入列都是與時間相關的數據,同時需要考慮季節、歷史、周期、趨勢等因素,通過一些手段來預測未來某個時間點會怎樣。
對於餐飲行業來說,就會經常遇到這樣的問題:由於餐飲行業裡面生產和銷售同時進行,所以銷售預測對於餐廳來說十分重要。如何基於菜品歷史銷售數據,做好餐飲銷售預測,以便減少菜品脫銷現象和避免因為備料不足而造成的生產延誤,從而減少菜品生產等待時間,提供給客戶更優質的服務。
餐飲銷售預測可以看做是基於時間序列的短期數據預測,預測對象為具體菜品的銷售量。
套路
時間序列預處理
拿到一個觀察值序列後,首先要對它的純隨機性和平穩性進行檢驗,這兩個檢驗過程稱之為序列的預處理。
根據檢驗結果可以將序列分為不同的類型,對於不同類型的序列有不同的分析方法。
如圖所示
從圖中可以看出,白雜訊序列是沒有信息可提取的平穩序列,沒有進行序列分析的必要。
平穩性檢驗
定義:如果時間序列在某一常數附近波動且波動範圍有限,即有常數均值和常數方差,並且延遲k期的序列變數的自協方差和自相關係數是相等的或者說延遲k期的序列變數之間的影響程度是一樣的,則稱該序列為平穩序列。
其實可以這麼理解,平穩即代表沒有明顯趨勢且波動範圍有限檢驗方法:
時序圖檢驗:根據平穩時間序列的均值和方差都為常數的性質,平穩序列的時序圖顯示該序列值始終在一個常數附近隨機波動,而且波動的範圍有界;如果有明顯的趨勢性或者周期性,那它通常不是平穩序列
自相關圖檢驗:平穩序列具有短期相關性,這個性質表明對平穩序列而言通常只有近期的序列值對現時值得影響比較明顯,間隔越遠的過去值對現時值得影響越小。隨著延遲期數k的增加,平穩序列的自相關係數會比較快的衰減趨向於零,並在零附近隨機波動,而非平穩序列的自相關係數衰減的速度比較慢。
單位根檢驗。指的是是否存在單位根,如果存在單位根,即為非平穩時間序列
目前最常用的方法是單位根檢驗。
純隨機性檢驗
若某個序列是純隨機序列,那麼它的序列值之間便沒有任何關係,即滿足y(k)= 0,這是一種理想狀況,實際上自相關係數絕對不會為零,但是很接近零,並在零附近隨機波動。
純隨機性檢驗也稱為白雜訊檢驗,一般是構造檢驗統計量來檢驗序列的純隨機性,常用的檢驗統計量有Q統計量、LB統計量,由樣本各延遲期數的自相關係數可以計算得到檢驗統計量,然後計算出對應的p值,如果p值顯著大於顯著性水平a,則表示該序列不能拒絕純隨機的原假設,可以停止對該序列的分析。
點此查看公眾號原文 -&> qq.com
最近也在做時間序列分析方面的研究,每天晚上都會把一些想法以及一些平時用到的資源分享到 數據魔法屋 這個公眾號,可以一起來交流下嚴格平穩指概率分布和聯合概率分布與時間起點的選擇無關。弱平穩指一、二階矩和時間起點選擇無關
如何深入理解時間序列分析中的平穩性? - 知乎 純搬磚
推薦閱讀:
※如何確定此概率的上界?
※二元離散模型需不需要進行設定檢驗?若需要應如何進行?
※泊松回歸模型和對數線性模型的區別是什麼?
※SPSS、Stata與Eviews在處理數據時各有什麼優勢?尤其是對數據的範圍及多少。?
※請問有沒有不同於RFM的會員分析模型?