PRML為何是機器學習的經典書籍中的經典?

都說PRML是機器學習的經典中的經典,是每個機器學習相關方向必須啃得書籍,那麼PRML到底經典在哪裡呢?與其他的書籍相比,有哪些過人之處?


PRML究竟有何過人之處,不能光看它本身的內容,最重要的是看其在Machine Learning, Data Mining這一類書籍中的地位。
通常從一個CS小白開始學Machine Learning或者Data Mining,到成長為一個獨當一面的大牛,都會看幾種類型的書:

  • 以《數學之美》為代表的科普類讀物。通常作用為開發興趣的。
  • 《機器學習實戰》、《推薦系統實踐》、《海量數據挖掘》等實踐類書籍。在學中用,在用中學,實踐中摸清套路。順便了解一些基本模型。
  • 《統計學習方法》、《數據挖掘導論》、《數據挖掘(韓家煒)》等介紹類書籍。會對ML方面涉及到的技術做一個淺層次的介紹和全方位的了解,有少量數學內容和推導。
  • 《PRML》、《ESL》、《MLAPP》這類進階類書籍。包涵大量理論知識和數學推導(尤其是習題),有助於了解Machine Learning方法背後的本質和思想。

Machine Learning學習的過程,就是一個 what -&> how -&> why 的過程。而PRML,或者說同類的ESL等書籍,最大的作用就是讓你知道為什麼會有這樣的方法,為什麼會有這樣的模型,它背後的intuition和motivation是什麼。而這恰恰是一個Machine Learning Researcher想要進一步使用模型、看懂別人paper中的模型、甚至自己提出新模型的基礎。看PRML會帶給你在Machine Learning上的理解和使用能力一個質的飛躍。

而在同一層次上,比如PRML和ESL相比,我個人認為,PRML涵蓋面更廣,語言更通俗,例子和習題更加詳細,附帶更多基礎性的講解和指引(比如第二章整章都在介紹概率分布),難度梯度設置更為合理,是其深受廣大中老年PHD朋友喜愛的原因。

可以說,PRML是一本兼顧廣度、深度、可讀性、可用性(做習題)的好書。


因為 mlapp 出得晚(逃


吾輩貝葉斯方法一以貫之,謂之PRML.


這本書就是各種貝葉斯,有些偏,個人認為不如MLAPP


我更傾向於一些工程行性強的書籍,或者一些頂會的論文。
介紹theano的deep learning tutorial,以及微軟研究院幾位大牛寫的deep learning :method and applications。都不錯
一些牛人的blog也是很好的學習資料,一些參加kaggle比賽的牛人一般都會把方法寫成blog,看看這些blog和裡面refer的一些論文都很有幫助。
-------------------------------------------------------------------------
總結了一些自己用到的資料

深度學習資料匯總

——————————————————————

大力推薦一本未出版的書:Deep Learning (Ian Goodfellow and Aaron Courville and Yoshua Bengio)

以及DL summer school 2015的視頻:Deep Learning Summer School, Montreal 2015


ESL經典


個人覺得PRML ESL MLAPP等幾本書差別不大,讀一本就好,目的是了解機器學習的基本概念和方法。關鍵還是看文獻,實現演算法,比較模型,在實踐中學習和改進。


推薦另外一本書,machine learning-a probablistic perspective。這本書基本是是duda那本書的升級版,從傳統的bayes到混合高斯分布再到深度學習,內容涵蓋十分廣。

答主最近正在看這本書,等之後出個詳細的閱讀筆記供大家參考。


prml也沒那麼好,只不過其它的書都沒他好(逃


個人覺得是經典,貝葉斯和頻率都是解決問題的兩種方式,而且在數據量非常大的情況下兩者其實殊途同歸


不認為這本書是ml的經典,只能說是bayesian learning的經典。如果要說這書是經典,也是跟風搞beyesian的人太多導致的。之前還有一本以kernel為核心的,一本以資訊理論為核心的,都沒火起來,一大原因是這倆方向在ml領域跟風的人沒有那麼多。

我猜測現在某個dl太牛以dl為核心寫個ml書,過五年也會有人來知乎問為什麼那本書是ml經典書籍中的經典


這本書肯定不是機器學習的經典,因為大多數搞機器學習的人並不是 Bayesian。


因為每讀一遍都有新體會。

最核心的思想是貝葉斯方法,最基本的模型是線性模型,最基本的假設是獨立性。

貝葉斯公式本身很簡潔,但是以先驗概率、後驗概率理解,以及對參數即隱變數理解使得這個公式無比powerful。多讀幾遍以後你就會漸漸忘記模型,而只記住其對應的graphic model,推導變得很自然。

理解了這些模型的假設以後再來看PRML,真的比我讀到的其他的一些書寫得好很多:門檻合理(從基本三論講起,不會出現半天看兩頁的情況),自包含(所有利用的記號、定理、結論都在書中正文或者附錄有詳細解釋,我並非數學系所以不太喜歡很多書籍里對於一些慣用記號【如示性函數】不加以解釋就開始推導),推導步驟詳略得當,idea解釋很到位,章節安排前後銜接自然。

這本書既可以當教材,也可以當工具書。


以前只看過西奧的模式識別,看得比較痛苦,有些地方並沒有深入講,而且需要一定的基礎才能明白,而且是中文版翻譯,有些地方讀起來吃力。這兩天在啃這本書,有種相見恨晚的感覺,適合入門的教材,由淺入深條理清晰,一些需要用到的數學知識也有詳細的說明


貝爺千秋萬代,一統江湖!


難度設置比較合理,前後聯繫非常清楚,尤其是從頭到尾對於bayesian思想的介紹,讓我這個之前不太了解bayesian的人也能比較好的理解。

但還是esl對我幫助大一些,裡面ensemble和decision tree模型的介紹比較好,這些方法實際應用很多,esl裡面這些章節有很多內容在介紹使用這些模型的注意事項。比如decision tree模型處理離散變數的方法,如何對任意loss function使用gbdt,還有blending、stacking等方法的介紹。


誰告訴你這是經典了
學數學的人沒幾個說它好的


推薦閱讀:

1000桶水,其中一桶有毒,豬喝毒水後會在15分鐘內死去,想用一個小時找到這桶毒水,至少需要幾頭豬?
想學好計算機演算法,是否需要重新學數學呢?
只用你的十隻手指,你能表達多少數字?
SVM 處理大規模數據有什麼好處?
遊戲里遇到過最牛逼的 AI 是什麼?

TAG:演算法 | 數據挖掘 | 機器學習 | PRML |