機器學習中,序列問題是否都能轉變為回歸或者分類問題?
比如,離散型的馬爾可夫序列,如果把時間作為特徵用。隱馬爾可夫模型和貝葉斯模型貌似是一致的
連續性的序列,如時間序列等,都是自回歸過程。也相當於把有相關性的前幾期做特徵,然後做回歸。如果考慮其它因素,也可以再加特徵。這樣一個時間序列就轉為了回歸問題最近又感覺對於很長周期的序列來說,並不像單純的回歸一樣,是個靜態的問題。除了自回歸過程,可能時段a有特徵A影響序列,b時段又是B因素影響,這種問題讓我聯想到reinforcement learning所以很困惑,是不是所有的序列問題都能轉為回歸或者分類問題解決。還有上邊這幾種問題的內在聯繫是什麼樣的
。。。。。。。。。。。。。。。。。更新:但是我還是有些小問題。
一個就是時間序列算是對隨機過程的一種統計模型,不知道對不對
其實我有兩個case的:
1. 第一個是一個時間序列,這個序列還會收x1 x2 x3影響,如果知道某個時點上,x因素會影響序列,怎麼預測此時的序列。
2.有若干個序列,相互影響。這種隨機場的問題又該如何解決
還望賜教
不是。時序數據本身隨機的時候,你用分類或者回歸的機器學習,都沒什麼用
你這個問題跟你描述的事情不一樣。關於長周期的描述,實際上是在問模型有沒有辦法抓住長周期的特徵。只有你把把長周期的特徵,encoding到你的每個樣例中去,還要保證一定程度上的樣例獨立性,模型才可能抓住,這估計需要很好的數據,以及相當的feature engineering技巧。
經典的機器學習模型,對數據是有獨立同分布假設的,這樣意味著樣例與樣例之間沒有什麼關係,像時間這種先後次序尤其不允許。所以,比如最經典的股票數據,你也說了一般都是把時間去掉,比如就用前一周的數據作為樣例,預測後面一天的漲跌,時間先後在這裡是直接無視的,這就跟經典的時序分析完全不一樣。同樣的,由於獨立同分布,你不能指望你沒有把長周期特徵有效注入的情況下,模型能知道這一點,當你打平時序數據為樣例的時候,這些內涵都已經消失了
另外,做金融模型的都很敝帚自珍,好點的東西不大會拿出來發表,也許有辦法引入時間維度也不一定,比如引入假日、開學時間等作為feature之一,但最終用到機器學習模型上,這種都會被打平,樣例與樣例之間是相互獨立的。
有時序依賴的dnn模型比如rnn,天然契合時間序列,但我現在看到的rnn 模型基本都是玩票性質,效果很渣。Gaussian process, cox process, .......
可以轉化為回歸模型,分類應該不行吧。目前基於支持向量機回歸演算法中做了很多的時間序列的回歸預測模型,有非常多的應用,下面是我最近看的幾篇一區的文章,
A tutorial on support vector regressionFinancial time series forecasting using independent component analysis and support vector regression
Support vector regression with chaos-based firefly algorithm for stock market price forecasting
Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach
Local prediction of non-linear time series using support vector regression推薦閱讀:
※深度強化學習訓練環境如何構建?
※如何評價 Science 上的最新研究:用神經網路解決量子多體問題?
※強化學習(RL)在NLP的應用前景如何?
TAG:統計學 | 機器學習 | 統計學習 | 金融工程學 | 強化學習ReinforcementLearning |