有哪些傳統自動控制、機器人等與人工智慧、機器學習結合的相關資料（包括書、課程、Notes、論文等）？

01-07

這個我來回答一下，分享快樂！大家一起進步。

1、cs294深度強化學習，火的一塌糊塗。

2、CS287 Fall 2012伯克利advance robot課程， Pieter Abbeel大牛講的。我隨便截圖看下講的內容就知道了，乾貨滿滿。

3、OpenAI gym。這個自己搜一下就出來了。可以自己寫代碼驗證演算法還是很爽的。

4、論文的話，我就給兩個大牛的個人網站，論文巨多，一個星期不看感覺距離又遠了幾個世紀。Sergey Levine、Pieter Abbeel--UC Berkeley--OpenAI--Gradescope。

5、我之前有個回答，是我自己水的一篇論文，哈哈哈哈哈。很垃圾，但是我覺得我實驗做的還行。

東林鐘聲：有沒有將深度學習融入機器人領域的嘗試？有哪些難點？。論文的地址是http://103.212.33.238/cnn_controller.pdf我懶得掛arxiv了，這麼垃圾的論文，哈哈哈哈哈哈。

6、傳統的控制的話我覺得還是要多少看一遍的。

後續我再碰到的話可以再更新。

如：

ETH 的 Optimal Learning Control for Autonomous Robots 課程：

adrl:education:lecture [LAB]

Lecture Notes:

[1708.09342] Optimal and Learning Control for Autonomous Robots

Frank Lewis組的相關工作就是結合了最優控制和強化學習的。

傳統的最優反饋控制通常涉及到解一個Hamilton-Jacobi方程。在離散時間的框架下，該方程可以用基於動態規劃的值迭代(value iteration)、策略迭代(policy iteration)等數值方法求解。但是在連續時間情況下，這是一個偏微分方程(PDE)，沒有有效統一的數值方法。更重要的是，很多控制問題里，系統地模型未知，這就無法直接利用相關的數值方法了。

強化學習是一種求解未知模型參數的動態規劃問題。通過對系統的採樣，強化學習可以得到一個近似模型的參數及其最優控制律。Frank Lewis近期就把這套理念應用於最優控制問題，同時避免了求解Hamilton-Jacobi方程。

Lewis, F. L., Vrabie, D., Vamvoudakis, K. G. (2012). Reinforcement learning and feedback control: Using natural decision methods to design optimal adaptive controllers. IEEE Control Systems