最前沿:閑談AI未來及幾家學習型機器人初創公司

轉自微信公眾號:FloodSung的AI遊樂場

今天不和大家聊純學術了,和大家聊聊幾家學習型的機器人初創公司。

1.為什麼關注機器人初創公司?

那我們就要問下一個五年十年最有潛力的AI發展方向是什麼?深度學習在計算機視覺語音識別上面的成功誕生了商湯這種獨角獸,也誕生了寒武紀這種晶元獨角獸,那麼下一個獨角獸會是什麼?

我們可以想到的就是當前深度學習技術在一些垂直領域的應用,比如醫療診斷,比如金融分析。像醫療診斷這種事情,一看就知道是可以做的,而且可以完全使用目前現有的深度學習技術,不帶改的,唯一的問題不過還是數據採集問題。這些垂直領域可以誕生一些小的獨角獸(壟斷了數據資源的獨角獸),但這不是最能讓人興奮的地方。

在我看來,工業機器人的智能化才是最有價值的最令人興奮的發展方向。我們知道每一次的工業革命的核心在於生產力的大幅度提升。能夠提升生產力的技術才是最具變革性的技術。從蒸汽機革命,電力革命,計算機革命,互聯網革命,下一個是什麼?必然只能是機器人智能革命。通過替代目前機器人無法替代的重複性人力勞動,來大幅度的提升生產力。對比一下,現在的什麼抖音,什麼摩拜,有帶來生產力的提升嗎?沒有,這種產品只是提供一種服務而已,沒有核心的技術突破。

但是機器人智能化卻不完全是一個現在時,而更多的是將來時。不像計算機視覺已經是完全落地的狀態,機器人智能化還有很多需要解決的技術問題,可以說依然很大程度上處於科研前沿的狀態。然而有一些子領域上的問題,現在已經看到了一些落地的跡象。所以,我們這裡要來關注一下機器人的初創公司,看看機器人智能化的發展趨勢。

2. 為什麼只關注學習型機器人初創公司?

目前的機器人技術可以分類為兩派了,一個還是傳統控制流派,使用傳統的控制演算法來實現機器人的運動控制,至多在計算機視覺問題上加點深度學習技術;另一個就是深度學習流派了,這一派認為機器人可以使用一個端到端的神經網路來實現控制,輸入視覺信息,輸出控制動作信息。那我當然是站深度學習這一派了。

為什麼?

我有三個理由:1.我不相信我們人的運動控制是靠某幾個公式計算得到的,而是完全的神經網路控制。也就是從仿生學的角度傳統控制流派就不是通往AGI的方式。2. 傳統控制流派很難處理機器人通用化的問題。我們完全可以認為傳統控制方法都是人為設計出來的一套方法,這和計算機視覺以前人工設計方法提特徵是一樣的,這必然導致其局限性。而學習型演算法則潛力無限,可以學出任意的控制方法。3.機器人智能化面對的核心問題不僅僅是最底層的控制,而是高層的邏輯推理決策問題。而邏輯推理決策這本身就不是傳統控制流派能做的。最後額外的理由就是目前的Google,DeepMind,OpenAI這幾個最前沿的AI研究機構都站隊深度學習這派,肯定是有它的原因的,這就是前沿,就是未來。

相信看過西部世界的朋友都對這個迷宮非常熟悉,實際上我對於AGI的實現想法也和這個迷宮的想法一樣,是一個由外到內的過程。比如目前深度學習從X到Y的Mapping,比如機器人簡單的能動,能走這些都是智能最最外層的東西,傳統控制也不過是這最外層上面的一小點。往內是什麼,是邏輯,是推理,是思想,以及到最後的情感,自我意識。這些和傳統控制一點關係沒有,而深度學習基於神經網路的技術則有可能往內突破。Deep Learning的下一步是Meta Learning學會學習,那Meta Learning的下一步是什麼?在我看來就是邏輯推理,這是更往內的東西,也顯然是更困難的事情。

3. 有哪些有意思的學習型初創公司呢?

下面我們就來說說4家初創公司吧,3家在矽谷,一家在日本:

(1) Osaro osaro.com

Osaro這家公司算是創立的比較早了,在DeepMind出來DQN之後很快就創立了。我們談學習型的機器人初創公司最核心的都是基於深度增強學習Deep Reinforcement Learning,做端到端的學習控制。

這個公司來頭不小:

有Peter Thiel等大佬的投資,還有Richard Sutton這位增強學習祖師爺做顧問。

那他們現在在做什麼呢?還是機器人抓取。他們和日本餐飲公司合作,實現了落地:

抓取不規則的雞塊放入餐盒,這確實是一個非常有挑戰性的任務,基於DRL得到了實現。

(2) Kindred kindred.ai/

這公司也是以機器人抓取為主打,也同樣是使用深度增強學習技術。有騰訊的投資。這家公司完全以物流分揀入手,研究機器人分揀各類不規則物體,比如下圖的衣服可能相比雞塊更有挑戰性。

這家公司相比Osaro,會發一些paper來體現他們的學術科研能力。這次CoRL2018還開源了一個機械臂的深度增強學習benchmark:

目前機器人機械臂的研究很大的問題就是沒有一個benchmark,沒有統一的評判標準,非常不利於學術的發展,這種benchmark就非常有益。之前是UCB的Sergey Levine團隊有放出一個基於Pybullet的機械臂模擬環境,也還不錯,值得研究。

(3)Covariant.ai

Covariant這家公司就比較火了,雖然什麼東西都還沒做出來,但是是Pieter Abbeel大神帶自己的學生搞的。都是基於Deep Reinforcement Learning和Imitation Learning的技術,也都是機械臂。值得期待他們的產品。

(4)Preferred Networks preferred-networks.jp/e

日本這家AI公司就比較牛逼了,不僅僅是做機器人,還有大名鼎鼎的Chainer框架(Pytorch就是借鑒它的)

無人駕駛,機器人,醫療都做,還有強大的AI基礎科研實力做支撐,簡直就是一個完美的AI公司架構啊。這家公司也是這幾家初創公司目前發展最好最大的,拿到的投資也蠻多的:

並且這個公司也請了Pieter Abbeel做其顧問,上一篇blog介紹的ICRApaper就來自於這個公司。

4. 這些公司有什麼特點呢?

很顯然的,都是搞機械臂,都是基於深度增強學習這一技術。為什麼以機械臂為切入點?因為機械臂可以說是目前最需要實現智能化通用化的一環。比如物流分揀,一年幾十億的包裹,需要多少人力去分揀呢?現在實用化的不過是一些移動平台。如果機械臂能夠代替人去分揀,可以節省巨大的人力資源了。機械臂分揀這種問題相對比較簡單,由於Dex-Net 4.0的出現,我們基本上可以看到落地的可能了。

5. 為什麼沒有中國公司?

我也查一些國內的一些機械臂相關的公司,但是很遺憾都是基於傳統控制的,展示的效果也是撿取一些完全規則的物體,相比一下技術弱爆了,國內對於前沿的把握還是落後吧。我們只能說DRL不一定能成功,但是沒有去試絕對不會成功。也因此,未來的機器人獨角獸,機器人創新型企業恐怕也很難在中國出現。我們依然還是在copy的老路上。

6. 最後再分享兩家矽谷的機器人初創公司作為結束:

Off World:這家公司已經在研究下一代月球火星的通用機器人了!

Traptic:研究農業機器人。

ps: 當我在沙漠中穿行的時候,我意識到如果能夠由機器人來實現全智能種植,灌溉,那絕對是功蓋千秋的事情。This is the future!

最後,本文使用的圖片皆來自網路!


推薦閱讀:

TAG:人工智慧 | 機器人 | 科技 |