下半年寫作計劃

情感分析是較前沿的課題,並且是自然語言處理方向較高層的應用。目前,由於自然語言處理基本任務如分詞、詞性標註、命名實體識別、依存句法分析還有更複雜的語義角色標註等得到較好的解決,並出現一批優秀的開源項目和商業應用介面(如哈工大社會計算與信息檢索研究中心的LTP開源項目和LTP語言技術平台),使得單獨學習和研究較高層的應用更為方便。不過我認為,深入了解自然語言處理基本技術,會有助於高層應用的研究,使你可以在整個處理環節上,清楚並有效的優化各個步驟。以上便是下半年寫作主題——解決自然語言處理基本任務的基本方法的理解和實現,確定的緣由。

我提到的自然語言處理基本任務有:分詞、詞性標註、命名實體識別、依存句法分析、語義角色標註。本系列以參考哈工大社會計算與信息檢索中心的LTP開源項目為主,HanLP,fudannlp,jieba為輔。這些開源項目,我之前很少研究,所以還是以探索性質進行。

寫作計劃:

  1. 10月,分詞任務,預計4~6篇.介紹分詞任務,解決方法,性能評測。其中解決方法覆蓋傳統演算法,機器學習,深度學習
  2. 11月,詞性標註任務,預計3~5篇
  3. 12月,依存句法分析,預計3~5篇

對於本系列寫作過程中,會用到機器學習,深度學習,對於演算法我會進行簡單總結,詳細的會在本系列結束之後,未來的專題中發布,所以不會擾亂該系列的時間線。方法主要用python來實現。

由於本人能力有限,不懂的地方可以去憶臻的機器學習演算法與自然語言處理專欄查看,其總結了很多相關的文章。

                               寫於2017.9.27 長春

推薦閱讀:

Relation Extraction: Perspective from Convolutional Neural Networks
機器學習中的數學基礎(簡介)
NLP——自然語言處理(三)text2vec包
tf.nn.nce_loss 來自一篇古老的文章
我為什麼從技術角度不看好中國的智能音箱

TAG:自然語言處理 | 人工智慧 |