為什麼會覺得時間序列模型比較難學|時間序列的正名
時間序列模型跟其它計量模型都不一樣,
這種不一樣帶給時間序列世人的誤解,同時帶給經濟學學子被時序支配的恐懼。
很大部分原因是,時間序列是一門古老的學科。匠人們採用傳統的手藝,遺留著尼羅河平原野蠻而魯莽的作風,信仰「泛函中心極限」這樣少為人知的宗教,問一些「就算改信西醫,又能讓我多活幾年?」這樣在中產階級科學觀之下大逆不道的問題。學慣了邏輯回歸的人,再看這些沒有邏輯的玄學,總會嫌Low,不願將就。
時間序列自己的問題也是有的,說服力不夠強。畢竟,許多技法是在當年數據稀缺、邏輯混亂的時期發展而來的方法,那時候容不得窮講究,硬生生就讓給預測,這叫大法師的亮劍精神。哪怕今天的時間序列分析,很多工作比「天狗食月」模型都要粗糙。
(沒記錯的話,《經濟解釋》(張五常)開篇不久就寫到,曾經有人用「天狗食月」理論對月食進行過不錯的預測,但是,受過波普爾科學觀教育的人,又有誰,已經知道月食的真相了,還肯去分析「天狗的睡眠習慣與飲食策略」?但需要知道的是,科學研究當中並不會總這麼幸運,總能一開始就知道類似「月食」這種問題的真相,有時就會用到「天狗食月」這種層次的模型。那時,管用的都是這種模型。)
粗糙,不代表沒用。
外生解釋變數解釋不來許多東西。比如記憶。
時間序列,就是用自己的歷史研究自己。
暴力找規律,用所有可能想到的辦法,把被解釋變數在當下的觀測值,表示成其歷史觀測值的函數,有點像做公務員行測數學。VAR把暴力推向了一個頂峰。
灰度預測為例,萬一差分序列有規律是等差呢?萬一累加序列有規律是等比呢?萬一取值就是差分和累加的函數呢?
這裡面,通常有一點點經濟學背景,或者也可以乾脆沒有經濟學。
通常是先試錯,抱著求死的信念,一個接著一個的模型前赴後繼赴湯蹈火,就算前面是地雷陣或者萬丈深淵也萬死不辭。
碰巧就發現一些穩定,但我們不認識的東西。然後,就可以去嘗試認識它了。移動平均,交個朋友唄,請在我的工具箱裡面湊個數,以後請多關照。
通常從一般里發現特殊,就是人類發現知識的最初模式。
難怪計量學子們接受不來。要知道,在過去學的計量里,那些特殊,那些誰影響誰,生產函數里都寫著呢呀!(寫的對不對擱在一邊,你用的那個生產函數,究竟是經濟學邏輯的推導來的,還是從一般里總結出來的?)
科學不能解答一切,因為證偽的規矩太嚴格;邏輯不能解答一切問題,因為人類想搞清楚的問題永遠超出自身思考的能力。
對於科學不能解答,邏輯不能解答的問題,我們不能迴避,要去認識,大法師會想到用觀察它歷史的方式認識它,
這是時間序列建模最後的尊嚴。
何況時間序列發現的許多東西,後來也都被解釋了。
甚至還有理論幫助時間序列VAR建模,這種事情發生。
不能不說這是時間序列的一次歷史性突破,老者激動地說,就發生在古埃及,尼羅河平原潮汐的時間序列,最終可以跟月相建VAR!比單獨建一個AR(360)好使多了!
如果除了記憶,其它我們一無所知,
既然有可能有用。
那就把記憶拿過來,來解釋一部分被解釋變數好了。
記憶是內生的,有時卻對研究有所助益,預測個期望什麼的。
這種助益未必不高,但通常有限。
有限的有用。
看起來慫,打起來,未必輸給其它模型,都是一個山上的狐狸,誰不知道書生撩妹時常說的all models are wrong.
說完了哲學
下面說點乾貨,就說說平穩性吧。
單獨說說平穩性。
人生是平穩的么?其實這個問題就想問問,記憶能用來研究被解釋變數么?
不同時期之間的觀測值,究竟有多大的共性可循?
共性的存在,意味著,解釋被解釋變數不能只看解釋變數,而不去看看它的歷史。
保持穩定的共性,就可以用歷史觀測值做解釋變數,解釋當期觀測值了。而沒有穩定的共性,這幾期能這麼解釋,下一個階段就不能這麼解釋了,建模將以失敗告終。
至於歷史決定了多少,那還真是存疑。以下面這個生成過程為例:
你無論怎麼回歸,R2都過不了0.5.
但是對於這樣的數據,識別出自回歸模型總還是聊勝於無,因為你別的什麼也不知道,但是時期間的相關性幾乎是確定的!
評價平穩性的方法有很多,大都粗陋不堪。
1)估計參數,然後解特徵方程,求過程的特徵根
2)畫單位圓,然後打點,跟求特徵根十分相似。
3)用自相關性質和偏自相關性質來估摸
4)用圖,用譜,用圖譜。
5)單位根檢驗/平穩性檢驗/記憶性檢驗
其實人家吧,可能不過是多變了幾次結構,十期變個七八次而已,你就說人家不平穩,我抽煙,我紋身,我牽過男人的手,但我要你看看我的心!
受過21世紀計量教育的人,最多信一信檢驗,有時還會有執念,你究竟是變結構,還是單位根,還是非線性,還是變結構單位根。
沒有執念的人,一般交錯鑒定一下,初步判斷沒有過擬合,然後哪個模型好用用哪個,我從一團漆黑當中發現一個或許存在的特殊規律,你敢不敢別這麼講究。皇上就要大法師說句話搪塞,真相這麼重要麼?要問真相是花錢的,湊合著選個模型用不是比沒有強么。
15世紀之前,中醫跟西醫半斤八兩。即便今天在中國當期的醫療條件下,在財政和人民觀念的約束下,衛生事業不能沒有中醫,就像不能沒有時間序列。
下面用一首詩結尾
隨便一個單位的衝擊來了,
會永遠以一個單位的影響幅度持續下去。
人們叫她是單位根的時間序列
人們說她不平穩。
她是一個敏感內向的時間序列。
喜歡翻舊賬,喜歡患得患失,
最常說的一句話是,我們再也回不去了。
QQ空間簽名是:
不念過去,不畏將來,期望是零,方差交給時間
青年時
世界變化太快,
時不時的,她會遇到變結構
突變、漸變、暫變,各式各樣的變化,
讓她顯得沒心沒肺,
DF, ADF, PP, KPSS檢驗對她失效了
波士頓的Perron教授,南開的曉峒老師
都不能覺察到她的不平穩
甚至覺察不到她的長記憶性。
她有時會忘了自己從何出發,
被社會裹挾
每當想問問自己的內心,
自己也搞不清楚,
要用幾層的傅里葉展開,要用幾階的差分滯後項,
才能得到那個穩定自回歸的初心。
有時甚至會想,
既然人是一切社會關係的總和,
那我,有心么?
戀愛了
她遇到過一個跟她協整的時間序列,
他們相互之間有了聯繫,
像是月老的紅線,
歲月開始平穩起來,
衝擊的影響總能化解
小的突變也總能相互適應,
君當做磐石,妾當做蘆葦。
他們不知道,
那條紅線,
那個負反饋機制,
那組描述他們相互作用的協整矩陣,
也是會隨時間改變的。
誰能為生活不變。
線性的階段是短暫的,
原來這是一段閾值協整
他們各自也只是閾值自回歸。
當過去積攢的某一個方向的能量到一定程度,
或正或負,他們就會向新的機制躍遷
或許這就叫鯉魚跳龍門吧。
假如只看相識那天的數據,
協整是這樣的顯著,完美
但越是完美的機制,
就越是這樣的脆弱,
依賴天時地利,
而且易碎。
工作了
跟同事們,
不敢交淺言深
但卻因為工作,產生了奇妙的化學反應。
她方差大的時候,同事方差也大,
她方差小的時候,同事方差也小
他們各自的方差都具有記憶性,
但是因為方差的協整,
均值組合在一起卻常常相對穩定,
儘管大家殘差的方向常常並不一致,
但團隊的表現,
因為協同持續,而相對穩定。
當老去時,
她回憶自己的一生
有些人與她協整,只是一刻。
有些人與她協整,只是一段時間。
有些人一直試圖與她協整,但生活的突變饒得了誰。
這些關係,用小樣本檢測,準確度是不夠的。
隨著時間的推移,時間序列數據積攢得越來越多,
世上的事情,也就可以看得越來越明白。
原來三歲時發現的時間序列性質,
到老也沒有變過。
她還是那個敏感的,內向的孩子。
關注專欄,了解更多,每周更新一次。:)
推薦閱讀:
※一道需要思維逆轉的計量題
※廣告回報能被測量嗎?——經濟學用實驗告訴你
※Stata外部命令:那些最常用的和最新的命令
※相關性與因果有什麼聯繫與區別?