這個AI,能預知自己的未來。

剛學會走路的小孩都很喜歡玩玩具,但這對於他們可不僅僅是件很好玩的事情,同時也是他們了解世界如何運轉的重要方式。

加州大學伯克利分校的研究人員利用與此相同的原理,研發出一款 AI 機器人,能像蹣跚學步的小孩一樣,從頭開始學習,不斷在周圍物體上試驗,從而發現怎樣以最好的方式移動它們通過這些學習,機器人能從根本上預知自己的未來。

伯克利電子工程與計算機科學學院的研究人員研發的這款機器人學習系統,能設想其下一步行動的結果,從而發現在空間和時間上移動物體的方式。這套系統叫 Vestri,採用了一種稱為「視覺預見」(visual foresight)的技術。Vestri 可以操縱之前從未見過的物體,甚至能提前避開擋住去路的物體

最重要的是,Vestri 從「白板」中學習(白板,即 Tabula rasa,是一個認知論主題。其認為人的個體生來沒有內在或與生俱來的心智,也即是一塊白板,所有的知識都是逐漸從他們的感官和經驗而來),利用非監督式和非引導式的探索學習來發現世界是如何運轉的。這是一項非常重要的技術進步,因為系統不需要一群編程人員給它寫程序應對所有可能的情況,因為世界太複雜多變,而這也是一場極其複雜繁重的任務(甚至無法實現)。未來,這種自我學習的預測型系統會有多种放大版本,從而讓機器人能更好地適應周圍環境,甚至幫助自動駕駛車輛在路上預知未來事件。

伯克利研究人員研發的機器人應用了這款系統,如果執行特定順序的動作,它可以通過攝像頭預知接下來發生的事情。如上文所說,研究人員並沒有預先為系統編寫程序,而是完全靠系統通過一個叫做「基於模型的增強學習」過程自行學習。這聽起來很玄學,但是這和小盆友通過不斷試錯挪動東西是一個道理。兒童心理學家將這種現象稱為「運動蹣跚」(motor babbling,指嬰兒通過自發的、隨機的重複動作來掌握運動技能),什麼意思呢,就是說機器人將虛擬的複雜行為和視覺聽覺反饋聯繫起來,這樣當它輸出行為時會預期到感官反饋。研究人員在 Vestri 身上應用了同樣的技術和原理。

Vestri 的首席研究員 Levin 說:「我們人類能想像自己的行為會如何移動周圍的物體,同樣,這種方法也可以讓機器人感知不同的行為將如何影響它的周圍環境。這能讓機器人這樣的智能設備高度靈活地應對多種複雜的真實世界情況。

為了訓練系統,研究人員讓機器人在一個小桌子上,像小朋友玩玩具那樣「玩」幾個物體。

在測試中,機器人中的自獲型模型讓它能夠移動之前從未處理過的物體,最終將物體放到理想的位置(有時機器人不得不繞過障礙物移動物體)。

Levin 說:「小孩可以通過玩玩具、來回移動玩具等這些方式了解世界。我們研究的目的就是讓機器人也能做同樣的事情:通過自動的互動了解世界是如何運轉的。雖然當前機器人這方面的能力還很有限,但它是完全自動學習的這項能力,可以根據之前與周圍物體的互動模式預測未來的互動情況。」

下面看看伯克利研究人員如何調教這款能預知未來的AI機器人:

https://www.zhihu.com/video/927208281326374912

研究人員說,現在的系統還很初級,只能預知未來幾秒鐘的情況。但是隨著技術完善,這種能預知未來狀況的機器人可以實際應用在工廠中,比如提前避開行走的工人和其它機器人。當然,也可以應用在自動駕駛汽車上,例如能讓車輛變換車道超車,或者避免相撞。

伯克利研究人員的下一步目標是讓 AI 機器人執行更複雜的的任務,比如撿起和放下物體,操作柔軟細膩的物體如布匹、繩子和易碎物品。


Live 鏈接:對話人工智慧,別讓機會從眼前溜走

快加入學習人工智慧的行列里來吧!

有哪些「本來以為已經是巔峰,沒想到才是開始」的例子?

從乾貨到練習題,你想要的人工智慧知識資源,都在這裡(十一月)

人工智慧可以作曲嗎?

官方微博:@景略集智

微信公眾號:jizhi-im

商務合作: @軍師

投稿轉載:kexiyang@jizhi.im

集智QQ群:557373801


推薦閱讀:

李宏毅機器學習2016 第九講 卷積神經網路
直播預告 · Machine Learning Security & Taint Style Vulnerability Research - Week 17
Probably Approximately Correct
我的Kaggle初體驗 -- Grupo Bimbo Inventory Demand
「深度學習入行門檻太低了,不開心!」

TAG:人工智能 | 机器人 | 机器学习 |