Patterns for Research in ML
03-02
在 reddit 上面看到的關於如何organize research code的
- Patterns for Research in Machine Learning
- Principles of Research Code
感覺挺好的, 推薦.
Updates:
記錄幾個Code Smell:
- metrics的種類很多的時候, 可以用一個data class把它們收集在一起. 這個不存在performance bottleneck的問題, 但是代碼會清爽很多 (e.g. Policy Gradient rollout).
- logging不應該直接print到stdout stderr, 這樣不方便做分析, 可以用rllib裡面的類似UnifiedLogger 把log打到文件裡面 (json, msgpack, etc) 然後接下來在jupyter裡面分析.
- RL的演算法只看reward收斂沒是沒用的, 可以根據演算法收集一堆metrics來分析(Kalman gain, value function results, TD error)
- 待更.
推薦閱讀:
※[貝葉斯一]之貝葉斯定理
※《集異璧》作者侯世達瘋狂吐槽谷歌翻譯,AI讓譯者失業?還早著呢!
※【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理
※BOW 演算法,被CNN 打爆之前的王者
TAG:機器學習 |