Hidden Markov Model(隱馬爾可夫模型(Discrete))

這一篇notes主要介紹的是離散HMM的內容。Notes的大致思路為:

第一部分:時間序列數據,關係,Markov性質

1.先由數據開始介紹,序列化數據可以分為需要對齊型(對齊的時候是有意義的,例如錯誤拼寫的單詞)和不需要對齊型(股票股票價格),針對這兩種不同的序列,我們往往會採用不同的時間序列模型,對於前者,我們常常採用之前介紹過的DTW,string match等演算法,而對於後者我們又可以根據不同的假設來選用不同的模型,例如我們可以假設序列的依賴性是短期的,此時我們可以通過前k個序列的情況來預測第k+1的情況,此時序列長度是固定的,這時可以採用傳統的機器學習演算法,例如SVM等;此外,我們可以對數據之間的關係進行假設,我們可以假設數據之間是線性相關的,這時我們可以採用MA和AR模型,但現實情況中,數據之間的關係往往較為複雜,為非線性關係,這時我們就可以採用RNN模型。

之後,本Notes介紹了一些RNN的基礎知識,包括RNN的結構,每步的計算,RNN的使用場景(機器翻譯),RNN中的問題(無法學習長距離的關係,vanishing gradient的原因)等。接著,開始介紹RNN(幾乎實用所有模型)與HMM假設(Markov性質)上的區別,並通過例子介紹了Markov性質的意思。然後接著開始介紹離散時間馬爾科夫序列(DTMC),但是因為DTMC生成的序列很多時候是沒法解釋的,所以我們需要一定的指導性(即觀測序列),於是引入了觀測變數,得到了我們的HMM模型。

第二部分:HMM三大問題

重點介紹HMM三大問題,(1)計算出現當前觀測序列的概率,(2)求出現當前觀測結果的最有可能的隱狀態,(3)計算HMM中的各個參數(學習過程)(此處僅僅介紹unsupervised學習的情況)。

文章鏈接:cs.nju.edu.cn/wujx/pape

做的ppt鏈接: pan.baidu.com/s/1i5onzH


推薦閱讀:

製作假新聞?AI送你去喝茶!
譯文:如何為機器學習索引,切片,調整 NumPy 數組
學Python,這10道題你一定得會
【機器學習Machine Learning】資料大全
如何六個月內學會深度學習

TAG:機器學習 | 時間序列分析 |