希望推薦一本自然語言處理專業需要精讀的著作?

感覺只有對整個學科有一個整體的知識樹後才能更好的進行自己方向的研究.明年四月份自然語言處理研究室入學學習,現在零零散散的看過一些論文,但是對這個專業的整體結構沒有一個了解.不局限於自然語言處理,機器學習相關的著作也希望推薦一下.不過,希望只推薦一部,值得反覆精讀的,最好是那種少一些細節,多一些思想和精華的書,謝謝


更新:

有很多人要書的鏈接,說實話我挺討厭伸手黨的,明明是自己在網上就可以搜索到的,評論區的鏈接打不開,這裡貼一個網站:Library Genesis 很多書籍都可以在上面找到。

-------------------------------------------------------------------------------------------------------------------

按照題主的描述,Dan jurasfsky的Speech and Language Processing 應該是最好的選擇了。

Manning的Foundations of Statistical Natural Language Processing感覺相對比較舊了,中文的話可以考慮宗成慶的《統計自然語言處理》。很多人對宗老師這本書有負面評價,我覺得倒還好。我們實驗室里做NLP的幾個人,有忘記一些知識的時候都會把他作為工具書來翻翻。可能的確不適合於入門和精讀。

最後想強烈安利Yoav Goldberg的這本:Neural Network Methods for Natural Language Processing

今年新出的書,如果題主對Deep Learning應用於NLP感興趣的話,這本應該是非常好的選擇。如圖:


我最偏愛的還是大神dan jurasfsky的Speech and Language Processing,中文名譯為《自然語言處理綜論》。大神講什麼都很清楚,一點就通,而且還很貝葉斯。邏輯斯特回歸我是先看的吳恩達和林軒田的課,統計學派是從優化角度用拉格朗日乘數法引入正則化L2,L1。要理解L1為何會導致參數稀疏化,還得去看sub-gradient。jurafksy從貝葉斯的角度講正則化,其實只是貝葉斯公式里的先驗概率,你用高斯分布就是L2正則,拉普拉斯分布就是L1正則。 要是看過深度學習訓練後的參數分布,你會發現更直觀,訓練出來的參數部分就是高斯分布的樣子~

該書第三版正在撰寫中,作者已經完成了不少章節的撰寫,所完成的章節均可下載:

Speech and Language Processing


讀survey.

翻了一下答案,第一時間想到的兩本其它答主已經提了,一是SLP,二是NNMNLP. 但又仔細看了一下題目描述,發現了這句話

感覺只有對整個學科有一個整體的知識樹後才能更好的進行自己方向的研究

和這個定語

值得反覆精讀

所以忍不住回來多扯幾句,說得不對請海涵。我的建議是,這些好書需要讀,但以泛讀為主,精讀為輔。如果你已經了解了NLP中的基礎知識,比如language model, n-gram, syntax, 對於絕大多數對你真正需要的學科知識,更好的選擇是定向精讀一兩篇好的survey.

NLP領域的知識體系過於龐雜。下有machine learning, 上頂data mining, 左接cognition, 右連linguistics, 內含MT, QA, SA, TE, SP等只有你想不到沒有別人沒做過的任務。了解「整體結構」當然有益,但在這種情況下,在前期如果試圖通過花過多時間在把握大局上(注意加粗),幾乎沒有盡頭。另外,你所以為的「整體結構」常常並不是真正的「整體結構」。一個研究者的宏觀視角,是在實踐中隨著對於學科的深入理解而不斷變化的。管中窺豹,性價比太低。

我的建議是選擇感興趣的一二切入點:可以是任務,比如MT;也可以是方法,比如NN. 了解經典的思想和最新的進展,然後從此出發向周邊的任務、方法探索,是更平衡的做法。從這個角度看,survey遠遠比大部頭的著作要實惠。其實很多survey也是好幾百頁,打出來和書也沒什麼分別。如果你讀了NMT的survey覺得不過癮,就去讀SMT的survey和seq2seq的survey, 相信你獲得inspiration的概率要比不帶目標的精讀宗成慶老師的統計自然語言處理要大。

NLP發展速度太快,絕大多數東西都沒有定論。書籍的滯後性要比期刊強,期刊的滯後性要比會議強。所以,了解了大概就做起來吧少年。


推薦一個pdf吧,不是著作 。看完,整體的知識樹概念應該會有

中文信息處理髮展報告 (2016)

地址: http://cips-upload.bj.bcebos.com/cips2016.pdf


馮志偉教授的書。


宗成慶老師(自然語言處理)

這個書感覺適合當個學習路徑看,宗老師想寫的太全,結果內容總是差點意思。。。

不過大體讀一下還不錯,具體內容具體學習


推薦閱讀:

自然語言處理中的語義到底是個什麼概念?語義分析是要分析出什麼結果?
自然語言處理(NLP)和計算語言學之間的區別和聯繫是什麼?
做文本挖掘是否需要了解自然語言處理?
word embedding 詞向量能否用於判別中文辭彙難易度?
word2vec和word embedding有什麼區別?

TAG:數據挖掘 | 機器學習 | 自然語言處理 |