UR3機械臂:從模擬訓練到真實系統實驗

https://www.zhihu.com/video/1001078520906268672

這是在模擬環境中訓練好的網路拿到真實機械臂上,控制層次為關節角速度,只控制3個關節,控制效果和模擬完全一致

相應的模擬控制為:

https://www.zhihu.com/video/1001078719150227456

說明:將模擬環境中訓練好的網路應用到真實機械臂上,控制層次為關節角速度,只控制3個關節,控制效果和模擬完全一致。這裡使用了速度層控制,相比於力矩控制,可以有效地容納模擬和真實機械臂之間的誤差。意味著可以依靠模擬做大量的訓練並能將學習到的策略很好地遷移到真實機械臂上。

推薦閱讀:

TAG:機器人 | 科技 | 強化學習(ReinforcementLearning) |