有沒有對HMM、MEMM、CRF進行系統論述的書籍?

畢設在做相關的問題,不知道這方面有什麼系統性的書籍,能夠在數學原理等方面有系統的論述,希望大家能推薦一下。


Michael Collins的講義:

Tagging Problems and Hidden Markov Models (22頁)

Log-Linear Model (20頁)

MEMMs (Log-Linear Tagging Models) (12頁)

Log-Linear Models, MEMMs, and CRFs (11頁)

問題描述與模型實現講的很清晰。

至於背後的數學原理……

HMM模型感覺沒什麼數學原理吧……

MEMM與CRF都是Log-Linear Model的變種,關於Log-Linear模型的數學原理,我覺得講的最好的是:The Elements of Statistical Learning (豆瓣)


koller『s book is difficult for beginners. Check Murphy"s new textbook.

This book is less famous but neat (and free): David Barber : Brml


Michael Jordan 的 An introduction to probabilistic graphical models 也很好


我推薦看一下「An Introduction to Conditional Random Fields for Relational Learning」這篇文章,地址:http://homepages.inf.ed.ac.uk/csutton/publications/crf-tutorial.pdf

我認為這是講解CRF 最好的材料,其中還介紹了因子圖的使用,判別式與生成式模型的差異,HMM與線性鏈式CRF的關係等很多內容。

作者之一的Andrew McCallum就是2001年CRF論文」conditional random fields「的作者之一,也是很有名的CRF工具包MALLET的作者之一。

Mallet是JAVA版CRF的首選工具包,地址:MALLET homepage


找到了,自問自答一下。

概率圖模型

Probabilistic Graphical Models: Principles and Techniques


宗成慶老師的 統計自然語言處理,看完了去看他提到的參考文獻就可以了


No good books, only good practices.

for documents, some cs-course lectures may be a good source for you such as CSE 628 Introduction to Natural Language Processing Spring 2014

Some open-source docs implementations of related tools such as CRF++ may be another good sources.

FYI~


推薦閱讀:

如何去分析和獲取iTunes中每個應用的下載量以及不同分類的下載總量、收費和不收費的分別的下載量等等?從哪獲取這些數據呢?
大數據、數據挖掘在交通領域有哪些應用?
文本分類中如何降維?
為什麼決策樹是一種分類方法卻可以用於預測?
模式識別和分類的區別?

TAG:數據挖掘 | 書籍 | 數學 | 機器學習 | 自然語言處理 | 語音識別 | 數學建模 |