當我們在談機器人和人工智慧時,我們到底在談論什麼?
當你說自己在做機器人的時候,大多數人的反映都是:哇!
曾經有人開玩笑的問道:你是在造一個終結者嗎?距離機器人統治人類還有多久?大多數時候,機器人會被自動歸類到人工智慧的領域內。很多人也會說,你就是在做人工智慧啊,現在很火啊。
人工智慧和機器人
其實有很長一段時間,我都不太想承認自己在做人工智慧相關的研究。因為對於我而言,人工智慧在某種程度上都需要引入機器學習的演算法,無論是監督或非監督式學習,或者強化學習。而我,作為一個控制出身的人,研究領域為視覺伺服控制,我現階段撰寫的演算法,都是基於模型的控制演算法,如果這種演算法可以被稱為人工智慧,那麼是否意味著控制演算法都可以被稱為人工智慧演算法呢?
接著我上文的定義,如果必須要使用某種學習演算法才能被稱作在做人工智慧,那麼我所了解的,被應用最多的領域是Computer Vision和Natural Language Processing以及強化學習被用作為下圍棋(AlphaGo)和打遊戲。這些領域和機器人領域的根本區別是什麼?
以上領域均不需要與現實世界發生力的相互作用。
無論是文字或是視覺,需要只是一個接收器,將接收到的信號轉變為數據,然後通過演算法進行處理。所以大多數人工智慧領域的是CS出身的人。
機器人領域不一樣的是,機器人是一個擁有硬體的實體。硬體是要和環境發生力的相互作用的,例如抓取,行走,操作物品etc。在和環境發生交互的時候,我們大多數時候就需要做物理以及進一步的數學模型,來更好的理解系統和環境發生作用的方式進一步設計相應的演算法,所以一個機器人研究者,需要不僅僅是做好一個程序員,他很多時候要是一個工程師,可能需要有機械、電氣或者控制的背景。
有的人可能會說,用機器學習我們可以做model-free control啊,不需要模型我也可以做控制,CS統治一切。就我個人而言在模型存在的情況下(可以推倒),強行用機器學習做model-free的控制是我見過最扯淡的研究方式。
機器人和機器學習
我非常希望了解機器學習演算法,尤其今年的ICRA,出現頻率最高的詞變成了deep learning。
「曾經有一個做機器人和機器學習的機會擺在我面前我沒有珍惜,等到失去時才後悔莫及。人生最悲哀的事情莫過於此。如果上天能再給我一次重來的機會,我會對那個教授說三個字:我願意。如果要在這段研究前加個期限,我希望是一萬年」
看過我之前回答的可能知道我在代爾夫特理工的時候,曾經有機會在Prof. Jens Kober手下做畢業論文,結果我放棄去了德國宇航局,最終導致我和機器學習無緣,博士繼續做機器人控制。
說實話,我沒有後悔。我現在實際研究的問題是非線性的,並且模型很難取得,我開始研究機器學習的演算法,去年邀請了Prof. Jens Kober來我的實驗室做了報告,今年促成了我博士導師和碩士導師Jens在ICRA見面並且討論下一步使用強化學習來生成控制演算法的可能性。
在討論過後我對機器學習是有點失望的,當然其實,我應該早有這個心理準備,無論叫上去名字多麼fancy,機器學習在機器人控制中,就是在擬合一個(控制器)方程而已。強化學習更是和最優控制(optimal control)的演算法非常相似。機器學習不是黑魔法,並且,在我特定的問題上,我暫時並不認為比傳統控制演算法更有優勢,我甚至覺得即使做出來比傳統控制演算法效果差。
也算是圓了我碩士時候的遺憾,如果最終可以和Prof. Kober合作,我也會繼續開展這個領域的研究。
一盆冷水
最後,在機器學習+機器人一片火熱的時代,給機器學習在機器人領域的應用潑一盤冷水:
- 機器學習曾經在90年代就火過好一陣子,我的組長Prof. Kheddar經歷過那個時代,很多機器人領域的人將機器學習應用到機器人上,但是那個熱潮,僅僅持續了幾年,由於傳統控制演算法和系統辨識演算法的發展,機器學習+機器人熱潮很快退去。
- 我的導師在QUT的Prof. Peter Corke組做訪問學者,參加了一個PhD的機器學習的學習小組,他發現很有意思的事情是,大家在談論起機器學習的時候,都會覺得這是一個非常有前景的領域並且十分令人激動,但是當實際的機器人問題擺在面前的時候,又都會對機器學習的可實用性表示懷疑,或者覺得即使可以使用,效果也不一定比傳統控制方法更好。
- 在Darpa挑戰賽上,第一名KAIST團隊曾經在賽後review會上被問到是否在機器人上運用過機器學習演算法,答案是沒有,因為魯棒性不高。
最後一個例子,也算是給我自己提醒:
我有一位做biped locomotion的同事,有一位博士生在他做完報告以後私下來找他,問道:
「請問biped locomotion領域有沒有什麼沒有解決的問題?我現在希望通過機器學習解決一下」
希望機器學習是解決實際問題的工具,而不是要創造一個問題,然後利用機器學習來解決。
推薦閱讀:
※樹莓派3通過PWM信號控制電機轉速
※瘦身30Kg的新Walkman——關於WALK-MAN項目結題與展示
※ACS多軸運動控制器
※乾貨 | 機器人自主定位導航技術(一)
※探秘亞馬遜(Amazon)倉庫