有哪些傳統自動控制、機器人等與人工智慧、機器學習結合的相關資料(包括書、課程、Notes、論文等)?
這個我來回答一下,分享快樂!大家一起進步。
1、cs294深度強化學習,火的一塌糊塗。
2、CS287 Fall 2012伯克利advance robot課程, Pieter Abbeel大牛講的。我隨便截圖看下講的內容就知道了,乾貨滿滿。
3、OpenAI gym。這個自己搜一下就出來了。可以自己寫代碼驗證演算法還是很爽的。
4、論文的話,我就給兩個大牛的個人網站,論文巨多,一個星期不看感覺距離又遠了幾個世紀。Sergey Levine、Pieter Abbeel--UC Berkeley--OpenAI--Gradescope。
5、我之前有個回答,是我自己水的一篇論文,哈哈哈哈哈。很垃圾,但是我覺得我實驗做的還行。
東林鐘聲:有沒有將深度學習融入機器人領域的嘗試?有哪些難點?。論文的地址是http://103.212.33.238/cnn_controller.pdf我懶得掛arxiv了,這麼垃圾的論文,哈哈哈哈哈哈。
6、傳統的控制的話我覺得還是要多少看一遍的。
後續我再碰到的話可以再更新。
如:
ETH 的 Optimal Learning Control for Autonomous Robots 課程:
adrl:education:lecture [LAB]
Lecture Notes:
[1708.09342] Optimal and Learning Control for Autonomous Robots
Frank Lewis組的相關工作就是結合了最優控制和強化學習的。
傳統的最優反饋控制通常涉及到解一個Hamilton-Jacobi方程。在離散時間的框架下,該方程可以用基於動態規劃的值迭代(value iteration)、策略迭代(policy iteration)等數值方法求解。但是在連續時間情況下,這是一個偏微分方程(PDE),沒有有效統一的數值方法。更重要的是,很多控制問題里,系統地模型未知,這就無法直接利用相關的數值方法了。
強化學習是一種求解未知模型參數的動態規劃問題。通過對系統的採樣,強化學習可以得到一個近似模型的參數及其最優控制律。Frank Lewis近期就把這套理念應用於最優控制問題,同時避免了求解Hamilton-Jacobi方程。
Lewis, F. L., Vrabie, D., Vamvoudakis, K. G. (2012). Reinforcement learning and feedback control: Using natural decision methods to design optimal adaptive controllers. IEEE Control Systems
推薦閱讀:
TAG:機器人 | 機器學習 | 自動駕駛 | 同時定位和地圖構建SLAM | 強化學習ReinforcementLearning |