五個非常實用的自然語言處理資源

五個非常實用的自然語言處理資源

5 人贊了文章

如果你對自然語言處理方面的資源感興趣,請仔細閱讀本篇文章。

運行數據科學POC的7個步驟

網上有很多依靠深度學習方法的NLP資源,有一些資源理論深厚,十分經典,特別是斯坦福大學和牛津大學的NLP,其深度學習課程為:

l自然語言處理與深度學習(斯坦福大學)

l自然語言處理的深度學習(牛津大學)

但是如果你已經完成了這些,或已經在NLP中獲得了基礎並想要轉向一些實用資源,或者只是對其他方法感興趣,希望這篇文章能對你有所幫助。

1. 用Python進行自然語言處理—用自然語言工具包分析文本

這是一本至少從實用性和Python生態系統的雙重視角介紹自然語言處理的書,它可以用於個人學習或作為自然語言處理或計算語言學課程的教科書,或作為人工智慧、文本挖掘或語料庫語言學課程的補充。本書通過使用自然語言工具包(NLTK)來接近NLP。

NLTK包含豐富的軟體、數據和文檔,可從http://nltk.org/免費下載。發行版本是由Windows,Macintosh和Unix平台提供的。我們強烈建議您下載Python和NLTP,並嘗試一下示例和練習。

2. 深度學習自然語言處理:Jupyter筆記本課程

這是一個Jupyter筆記本並附隨Jon Krohn的關於NLP深度學習的一系列精彩視頻的回購協議。如果你有興趣觀看他的視頻(它是通過O』Reilly的Safari平台提供的)請註冊一個免費的10天試用版,。

Jon在這些筆記本和隨附視頻中的主要內容包括:

1.預處理用於機器學習應用的自然語言數據;

2.將自然語言轉換為數字表示(使用word2vec);

3.通過訓練自然語言的深層學習模型進行預測;

4.在高級TensorFlow API Keras中應用先進的NLP方法;

5.通過調整超參數來提高深度學習模型的性能。

3.如何解決90%的NLP問題:一步一步的指導

這是以筆記本的形式出現的另一套非常棒的教程,它遵循類似於上述Krohn的軌跡。Insight AI的Emmanuel Ameisen分解了完成哪些任務需要執行哪些步驟,閱讀完本文後,您將知道如何:

1.收集、準備和檢查數據。

2.從建立簡單的模型開始,並在必要時過渡到深度學習。

3.解釋並理解你的模型,確保您實際上獲取的是信息而不是噪音。

4.Keras LSTM教程-如何輕鬆構建強大的深度學習語言模型

本教程比之前的資源重點更多,因為它涵蓋了在Keras中實施用於語言建模的LSTM。它通過附有解釋、代碼和視覺效果對此進行了詳細的介紹說明。在本教程中,我將專註於在Keras中創建LSTM網路,簡要回顧或概述LSTM的工作原理。在Keras LSTM教程中,我們將利用稱為PTB語料庫的大型文本數據集來實現序列到序列的文本預測模型。

5.使用組合LSTM-CNN模型的Twitter情感分析

這是一篇較短的教程(它是一個文章的概述),其中有使用LSTM/CNN的組合方法的代碼來分析情感。該項目顛覆了體系結構,並報告了不同的結果。

我們的CNN-LSTM模型的準確度比CNN模型高3%,但比LSTM模型差3.2%。同時,我們的LSTM-CNN模型比CNN模型的性能好8.5%,比LSTM模型好2.7%。

關於該項目的結果的可靠性,我暫時無法保證。但是,其創新的情感分析方式與混合在不同的神經網路體系結構中搭配使用,使我將其納入該列表中,希望能對讀者有所啟發。


推薦閱讀:

自然語言處理怎麼最快入門? |
語音交互設計(一)設計流程

TAG:機器學習 | 自然語言 | 自然語言處理 |