Python3 環境下的 NLTK學習(第一章)
最近想入門NLP,於是找了一些資源來看,其中有一本書很不錯,叫Python自然語言處理,我看的是中文版,翻譯質量一般,不過別人也是無償的,只能說很敬佩。不過有一個小問題就是它的python版本是2.4,而我的是3.6,我用的NLTK也是3以上的版本,所以書中的許多例子都有些不太一樣,下面我就羅列一下不太一樣的地方。
text3.generate() #失效#全文翻譯「鏈表」現一般稱作「列表」text5.count(lol)/len(text5) #直接可得頻率比值,無需import __future__#fdist1現在不是按照詞頻排序了,應該是亂序,你必須自己排序fdist1.plot(50,cumulative = True)# 縱軸不是百分比,而是數值fdist.inc(『item)#添加語料功能已失效fdist.tabulate() #繪製頻率分布表功能實現為亂碼)bigrams()#失效babelize_shell()#失效 。。。好可惜啊nltk.chat.chatbots()#有嚴重BUG,程序應該是將回車鍵當作輸入值導致其無限循環而 #陷入死機,解決辦法是如圖直接訪問機器人名字
以下是我做的筆記,有想看的同學可以到我的Github主頁上去下載,以後章節的筆記也會持續更新,敬請關注!
(照片不是很清晰,可放大觀看或是移步Github)
推薦閱讀:
※我為什麼從技術角度不看好中國的智能音箱
※論文筆記 - 從神經圖靈機 NTM 到可微分神經計算機 DNC
※《Dialogue Act Sequence Labeling using Hierarchical encoder with CRF》閱讀筆記
※基於隱馬爾科夫(HMM)模型的中文分詞實踐
※【機器閱讀理解】Fast and Accurate Reading Comprehension by Combining Self-Attention and Convolution