淺談自然語言處理 –前言
淺談自然語言處理 – 0
作者:李嘉銘
你好!這篇是前言,點擊這裡跳轉至第一章。
Click HERE for the English version.
日本語のバージョンを読んでみたいの方があれば、遠慮なく聲をかけてください!
前言
最近關於人工智慧(之後簡稱為AI)的新聞可以稱得上是滿天飛,把一個公司、產品、甚至偶像和AI掛上鉤成了近來的潮流。但在普通人和AI或者機器學習之間似乎有一道鴻溝,這道鴻溝助長了在AI周圍蔓延的近似於狂熱和神秘的氣氛。
儘管聽到各種朋友說對AI的各個方面感興趣,同時很多人也會(包括我自己)抱怨說自己看AI像古代煉丹,感覺全憑運氣,完全不理解。對於研究人員、科學家和工程師來說像煉丹的部分也許是人工神經網路——一種受到人腦啟發的機器學習模型,但對於其他人來說是整個AI領域。如今的AI(終於)可以從數據里學到一些東西、變得能幹了,但似乎業內人沒有花太多精力來用通俗易懂的語言解釋什麼時候AI能用,什麼時候不能用,以及最重要的:為什麼。
我希望我能作為普通人和專業研究人員之間的一道橋樑,填補在這方面的知識空缺。那些對AI有一些興趣,又不想花大學4年或者花一整個周末聽公開課的你,也許會喜歡這一系列的文章。讀這些文章並不需要任何的數學、計算機、或者語言學的基礎。讀了之後你並不能立刻成為這方面的專家或者找到幫助你找到相關的工作,但我希望的是,你能在讀完之後說:「啊,原來Siri是這麼做出來的。」
本系列的專題是自然語言處理(NLP)。我選擇自然語言處理有兩方面原因,一是我個人對這方面的興趣,二是因為它可能是現在生活中應用最廣的AI科技之一。自然語言處理研究的是人和程序如何用自然語言交流。什麼是自然語言?它包括中文,英語,西班牙語,印度語之類的。(很可惜C++和Python不能算,除非某一天AI如埃隆·馬斯克預測的一樣統治地球……)你很可能聽說過或者用過如Siri或者Google Now之類的AI個人助理。學英語、其他外語、或者去國外的時候,你也一定用過翻譯軟體。即使如Word里數詞數句子的小程序也用到了自然語言處理。(無論是英文或者中文,數有多少詞和句子其實都不像想像中那麼簡單。)
以下是我打算提到的內容(無特別排序):
- 自然語言處理簡史
- 語言學趣事
- 最新的研究和實用領域的進展
- 自然語言處理中的深度(和不怎麼深的)學習
- 其他自然語言處理的應用
- 你所感興趣的其他話題
附註:
我絕對稱不上自然語言處理領域的專家,寫的文章里也可能有各種各樣的紕漏。如果你發現了任何不足之處,請隨意聯繫我。如果有什麼想讀的內容以及建議,也請隨意提,沒多少寫文章的不喜歡讀者提建議的。另外,喜歡這一系列文章並想轉載的請隨意,註明作者就好,謝謝!
圖片來源:
HAL9000Kizuna Ai
推薦閱讀: