重磅乾貨-Richard S. Sutton-2018年強化學習教程免費下載

Richard S. Sutton是加拿大的一名計算機科學家,目前是阿爾伯塔大學計算機科學教授和iCORE主席。Sutton被認為是現代強化學習的奠基人之一,主要有以下幾個顯著的貢獻,包括時間差分學習、策略梯度法、在Dyna架構, 由其主筆撰寫的書:《Reinforcement Learning: An Introduction》,一直被視為強化學習領域的聖經。

該書自2014年以來一直在不停的修訂和完善,今年Sutton又分享了他最新版本的強化學習入門的最新版本,內容比去年的版本豐富了很多,頁數增加到548頁,非常值得閱讀學習。附全書下載鏈接:

鏈接: pan.baidu.com/s/10uPubO

密碼: 5wmt

附加福利

小編認識的一位快手的HR朋友正急招深度強化學習、機器學習相關的技術人員,感興趣的朋友可以與她聯繫,投遞簡歷。

附職位介紹及聯繫方式。

機器學習-深度強化學習工程師/研究員

基本項

1. 教育背景:本科/研究生 學校,專業相關

2. 研究背景

● 研究方向:機器學習、模式識別、數據挖掘等

● 論文質量/數量,研究經歷

加分項 (有一項及以上較突出)

1. 開源項目(github),技術博客

2. 競賽:ACM、Kaggle/KDD等

3. 相關技術方向經驗

● 強化學習,遊戲AI(完全信息/非完全信息博弈),推薦系統

職位描述:

工作職責:

1、深度學習、強化學習等前沿技術方向研究,探索個性化推薦/廣告、遊戲AI等不同領域應用

基本要求:

1、計算機/電子/數學等相關專業 碩士及以上學歷

2、機器學習/深度學習領域 2年以上 研究/應用 經驗

3、較強編程能力:Python/C/C++

4、熟悉常見深度學習框架:Tensorflow/PyTorch/Caffe2

聯繫方式:

郵箱:yumenglei@kuaishou.com


推薦閱讀:

強化學習——環境庫OpenAI Gym
機器學習技法筆記9:決策樹
「伊人」何處,宛在雲中央:用 Datalab 在雲上部署互動式編程環境
Introduction: Tracking, Fusion and Deep learning for ADAS
結合google facets進行機器學習數據可視化

TAG:深度學習DeepLearning | 強化學習ReinforcementLearning | 機器學習 |