信息檢索入門?

研究生新生。導師的研究關注點是信息檢索和自然語言處理。主要想知道信息檢索入門的一些基礎課程和技術。求詳細解答和推薦書。


教材:introduction to information retrieval

課件:cmu 11442/642 網上可以找

筆記:CMU 11642 Search Engines - 大綱梳理

公眾號:自然語言處理與深度學習相關,最近會重新整理下信息檢索的筆記,歡迎關注~


先勘個誤,是自然語言處理,不是自然信息處理。

也不知道你本科什麼背景,我就範范地談了。

手機答題,所以書就只提一本,cmu/stanford都用的《introduction to information retrieval》,雖說是入門但是還是有點難度的,中文英文都有,網上還有課件,作為整個IR領域的入門還是比較推薦的。

自然語言處理方面的入門建議去52nlp,有各種國內老司機整理髮布的書籍推薦,名課的翻譯,感想體會,入門指導。

另外,數據挖掘/機器學習等內容也比較重要,可以在學習的過程中螺旋上升式涉及。

如果你覺得有必要,回去複習一下概率論與數理統計的本科教材也是推薦的。

關於工具,編程學一下python 吧,容易上手,庫多好用。資料庫會經常打交道,得熟悉起來。

進階的部分,現在提也沒有什麼用。信息檢索這個東西呢,說窄吧挺窄的,其父學科informatics也是近年才定下來的學科。說寬吧還是很寬的,因為圍繞IR,有太多可以涉及的內容了,這兩年來火到不行的deep learning也是其中之一。它還能和各種學科交配,比如經濟學,腦科學,傳媒學等等,子嗣眾多。

有機會在電腦上詳細回答。


我就來推薦兩本書:

這就是搜索引擎 (豆瓣)

走進搜索引擎 (豆瓣)


推薦閱讀:

Linear least squares, Lasso,ridge regression有何本質區別?
谁能解释下seq2seq中的beam search算法过程?
機器學習中SVD和PCA一直沒有搞的特別清楚,應該如何理解呢?
遊戲行業,大數據該如何應用?

TAG:數據挖掘 | 信息檢索 | 計算機專業 |