DL 學習 - 認識 RNN

04-14

最近開始學習循環神經網路（Recurrent Neural Networks / RNN），發現了一個博客 WILDML，野生機器學習？哈哈。作者名叫 Denny Britz，在 Google Brain 工作。他的博客中有一個 RNN 入門的系列文章寫得很棒，我的筆記也就從總結他關於 RNN 的系列入門博客開始：PART 1 – INTRODUCTION TO RNNS。

啥是 RNN?

通常傳統神經網路各個節點的輸入和輸出都是獨立的，這樣的設定並不適用於處理某些有序的信息，例如預測一句正在被說出的話的下一個字：

星期三晚上，我吃了超多米飯，覺得很（）

前面這些字的順序是帶有信息的。假設一個人在猜上面括弧內的字，看到「感到很」，會推測這是一個形容詞，繼續往前看到「吃了超多」，會自然認為這個形容詞和吃得多有關，如飽、撐、脹等。在這樣的應用場景下，就不合適將括弧前的每個字作為獨立輸入來處理。RNN 模型則是能對有序數據的每個輸入單位都做相同的運算，而每個單位的輸出都依賴於之前的計算結果。換言之，RNN 模型是有「內存」的，理論上它會記錄和獲取之前所有的計算結果，不過由於計算資源的限制，它只會回頭看有限步。因為我們相信，通常越是離當前計算位置近的信息相關性越大，例如上面的填空題，句首的時間信息與被預測值的關聯就比較弱。