Mobileye被收購後首度發聲:我們所相信的自動駕駛實現路徑

文 | 思佳

來自新智駕(AI-Drive)的報道

新智駕按:「這是個尷尬的時刻,不過我們還是來討論技術吧!」今年3月份在德國柏林召開的博世互聯大會2017(Bosch Connected World 2017)上,Mobileye CTO兼聯合創始人Amnon Shashua在演講開場時幽默地如是說。

觀眾笑了。因為就在這場演講開始前的兩天,英特爾宣布斥資153億美元收購Mobileye,也創造了幾乎是2017年最大、最受矚目的收購案。

時間回到現在,就在前幾天,英特爾已經正式完成對Mobileye的收購,故事以Mobileye成為英特爾子公司開始一個新的篇章。

很多人都討論過英特爾這筆錢花得值不值,但不可否認的是,Mobileye正調用自身在環境「強感知」技術的積累,在自動駕駛領域走得越來越遠。同時,Mobileye實現了技術廠商的躍進,如今真正和車企站在一起。

或許是因為這些,或許是因為其他的什麼,CTO Amnon Shashua在演講中可以自信地說,「Mobileye正在走一條正確的路線,不這樣做自動駕駛永遠都實現不了。」

在這個路線中,人工智慧不可或缺。Mobileye到底如何利用人工智慧實現對自動駕駛研發的超車呢?答案在Amnon Shashua的演講中,新智駕對演講內容做了不改變原意的編輯整理。

Amnon Shashua:在浩大的自動駕駛產業鏈中,人工智慧到底扮演著怎樣的角色呢?今天我們要來討論這個問題。

在這之前明確,實現自動駕駛的方案和路徑多種多樣,我將它們分為兩類:比較傳統的方案;大量運用人工智慧的方案,也是我們正在做的方案。今天會具體介紹他們。

一、自動駕駛三個關鍵技術

為了實現自動駕駛,我們需要解決的技術主要分為三部分:

  • 感知:在車輛部署攝像頭、激光雷達、毫米波雷達等感測器,配合高性能的演算法,讓車輛感知周邊環境。

  • 高精度地圖:高精度地圖是實現自動駕駛的必要性技術之一,它提供了一種更前瞻的信息指示和冗餘性,是保證自動駕駛安全的基礎。

  • 駕駛決策:在駕駛決策的技術研發中,往往能為人工智慧提供大量用武之地。其最終目的是,讓自動駕駛車輛在面對複雜交通環境時,能夠像人一樣駕駛,擁有人類的一些決策屬性和技巧,同時也要保證安全。

  • 二、人工智慧在感知中的應用

    下圖是我們與德爾福合作研發的自動駕駛demo,車輛在長達10公里的拉斯維加斯街道上完成了無干預的自動駕駛。圖中可以看到,3D box準確框出了每一台車輛,綠色部分標識了可駕駛的空白區域,同時演算法對交通燈、交通指示牌也進行了識別。總的來說,這台自動駕駛車對周邊環境進行了360度的感知識別。

    再來展示一下關於繪圖的內容。下圖展示的是Mobileye近一年半時間研發的REM(Road Experience Management)路網採集管理系統,這是我們通過眾包模式收集數據繪製高精度地圖的方法,這些採集到的路標構成了RoadBook(路書)。該項目中,我們與寶馬和其他汽車平台合作,進行數據收集。

    最終我們得到一個存儲在雲端的地圖,它可以投射在兩個界面上,圖中右手邊是將數據投射在谷歌地球上,這樣可以得到大尺度的精度參考,左手邊是投射在車輛採集的實時圖像上。

    當運行起這樣的系統時,可以看到投射在谷歌地球和車輛視角圖像的車道線非常精準,同時標註出了道路標識等信息,精度達厘米級。

    這是另一個demo,與尼桑汽車在倫敦街道上的道路測試。

    在這個過程中,人工智慧發揮了哪些作用?

    當提到車輛感知,通常指的是物體檢測的過程,即道路上的車輛、行人、交通標識、交通燈等等。

    環境感知的階段一:感知障礙物。對機器而言,輸入的是圖像,輸出的其實是bounding box,如一輛汽車的bounding box、一個行人的bounding box。這是如今的駕駛輔助系統,我們需要檢測車輛、行人等物體,再根據這些障礙物進行相應的駕駛決策。

    環境感知的階段二:感知空閑區域(free space)。過去的環境感知,是檢測路緣、護欄等障礙物,依此判斷哪裡能夠駕駛,哪裡不能。而現在換一種方式,輸入仍然是圖像,但輸出是一種自由形式的邊界範圍(free form boundary)。對邊界範圍進行識別,我們需要對諸如車道線、路緣等等特徵進行語義理解,這使得系統實現變得更複雜。

    環境感知的階段三:感知可駕駛區域(Drivable Paths)。這個階段產生的是真正的顛覆性技術,系統將感知每條道路通往何地,以及與道路相關的語義理解,例如這條路有多長、這條道路會通往高速、高速的出口又在哪裡…所以這個時候,輸入是圖像,但輸出的是一個故事,是要去描述一個的場景,而不只是識別出障礙物。我們將這稱為「強感知」,這確實是一個開放性的問題。

    以上就是Mobileye在車輛感知中應用人工智慧的嘗試。第一階段是單純軟體問題,第二階段進行了升級,目前已經實現量產,比如特斯拉的第一代Autopilot系統,第三階段是非常有挑戰性的,同時需要大量的人工智慧技術參與。

    三、感知技術與高精度地圖的融合

    感知技術是如何被運用的?

    感知技術是如何被運用的?目前主要有兩種路徑,第一種「重地圖模式」(Map heavy approach),第二種「輕地圖模式」(Map light approach),Mobileye屬於第二種方式。

    1、重地圖模式

    這種方式很好描述,也很容易使用和部署。但這是一個錯誤的方式。為什麼?下面具體介紹。

  • 這種方式通過使用3D感測器(如激光雷達)來檢測車輛和行人,然後被呈現在車輛的3D坐標系統中。

  • 之後,將車輛在3D地圖中進行定位。實現方式有多種,例如車輛通過激光雷達採集了周邊環境數據,並與已有的高精度地圖數據進行匹配,就可以進行自定位。

  • 將步驟一中檢測到的車輛和行人放置到高精度地圖中,因為你已經實現了自定位,而高精度地圖中包含了所有車道線等信息,所以你已經擁有了「上帝視角」,你從高精度地圖上獲取了可駕駛的路徑,同時有通過感知得來的物體檢測信息,所以直到目前,似乎我們不需要任何攝像頭。

  • 如果你回憶一下谷歌最初的無人車原型,他們沒有部署環境感知攝像頭,只有一個看交通燈的攝像頭,其他都是基於激光雷達完成的。

    這就是第一種路徑。

    2、輕地圖模式

    現在,如果你希望系統有更好的魯棒性。你就需要加入更多的感測器,例如攝像頭。每加入一種感測器,都需要將其數據轉化成三維,所以,如果你現在擁有攝像頭數據,就必須將攝像頭數據載入在3D坐標系統中。

    問題在於,由2D轉向3D是很困難的,毫米波雷達的數據也是2D的,它測量不同的維度,但仍然是2D。我們使用輕地圖模式,解決這個問題。

  • 使用攝像頭同時檢測車輛、行人以及可駕駛路徑。即將靜態和動態場景描述放在同一個2D坐標系統中。

  • 通過將高精度地圖數據投射在車輛獲取的2D圖像中進行車輛自定位。該技術在上面的demo中已經進行了展示。

  • 現在,我們使用這種投射方式,建立一個車輛和可駕駛路徑的統一3D視角,因為地圖是三維的。而當你需要加入一個額外的感測器,如毫米波雷達、激光雷達等感測器,你所有需要做的,就是將3D轉換成2D。例如將激光雷達數據投射到二維圖像中,這是比較簡單的。

  • 舉個例子,這是將激光雷達數據和其他數據投射到二維圖像上的示例。

    這是將毫米波雷達數據投射到二維圖像的示例。

    現在,讓我們看一下這種方式的優勢。如下圖所示,左側展示了右側圖像的仰視圖視角,並且我們可以非常準確地獲取這種視角。

    所以,攝像頭加地圖就可以提供所有駕駛需要的信息,之後毫米波雷達和激光雷達等感測器,會處理一些冗餘的問題。

    接下來,我們總結一下這兩種路徑的優缺點。

    重地圖模式的優點:

  • 非常容易設計出原型,找10個有才能的工程師,不出6個月的時間,你就能到一個不錯的demo。這就是一些矽谷團隊在做的事。

  • 重地圖模式的缺點:

  • 會造成車輛對高精度地圖的過分依賴,沒有高精度地圖,你什麼都做不了。

  • 可駕駛路徑和車輛/行人處於不同坐標系統中,沒有協同,且每類物體由不同的感測器識別。當你將它們同步到同一個坐標系統中,容易產生錯誤。

  • 真正重要的是,創建高精度地圖需要人工標註,這是一個巨額的成本投入。

  • 如果沒有一個真正經濟的高精度地圖繪製方式,自動駕駛很難真正落地。而如今許多公司在繪製高精度地圖時使用的方式都是非常昂貴的。

    輕地圖模式的優點:

  • 攝像頭是唯一的環境感知感測器,在同一坐標系統中同時檢測車輛/行人以及可駕駛路徑。

  • 使用車載攝像頭感測器眾包獲取數據,製作高精度地圖,大大降低了成本。

  • 可實現低成本的level 2 等級自動駕駛。在level 2中,駕駛員需要對車輛駕駛控制負責,但是通過輕地圖模式,可以實現類似level 3、level 4的體驗,同時激光雷達將不是必須的。這開拓了更廣泛的商業和市場前景。

  • 輕地圖模式的缺點:

  • 非常難以實現。

    如剛才所說,感知的第三階段很複雜,且需要大量人工智慧技術輔助。但從長遠角度看,這是一條正確的路徑。重地圖模式短期來看易於實現,但長期而言,不能形成規模化。

  • 四、人工智慧為駕駛決策帶來了什麼?

    這部分講駕駛決策,即複雜交通中的博弈。上圖中的新聞,是大概一年多前,自動駕駛撞人的案件。無數自動駕駛車都在面臨一個共性的問題,他們的駕駛決策太過簡單,當一些複雜的、意料不到的事情發生時,駕駛員必須要進行接管。機器無法做出人類面對複雜情況的博弈和決策。

    前提是,駕駛是一個「多主體」的遊戲,只要道路上還存在人類駕駛員,那麼機器就必須明白人類的決策技巧,人類容易衝動,人類會犯錯,所以自動駕駛車需要與人類司機進行協同配合,同時要保證安全。

    所以,現實生活中的交通到底是什麼樣呢?為了弄清楚這個問題,我用一架無人機進行航拍,拍下了一些現實交通的畫面。

    上面這輛車嘗試併線,沒人給這個「可憐的人」讓行,不過這就是真實生活!所以想像一下,把這個場景交給自動駕駛車,你如果希望它能做到這樣,那就是天方夜譚了,做到接近都是不可能的。

    我們更具體地聊聊。下圖展示了雙車道併線問題,這是我們與寶馬汽車合作的項目,目的是解決現階段一個非常具體的駕駛問題,也是一個非常困難的問題。

    在雙車道問題上,車輛會從兩側車道會車,為什麼這個問題具有挑戰性呢?因為車輛不是簡單地擠進來,它可能會干擾其他車輛行駛,也有可能產生兩車僵持的情況。但對於兩車道會車,沒有一個明確規則,唯一的規則就是不要發生事故。

    在四車道的十字路口會車時,其實並不是最難的,因為十字路口有交通燈,有規則,但這種雙車道會車的情況則不同。所以,你必須預估出之後幾秒的情況,並做出規劃,你需要估摸出會車間距和通行的時間,能夠在不發生碰撞的情況下及時通過。所以,這其實是一種非常困難的問題。

    所以,我們希望能利用機器學習解決這個非常複雜的問題。而機器學習的趨勢,就是數據驅動。

  • 優勢:比基於規則的演算法更簡單地觀察和收集數據。在很多場景中都是這樣,例如自然語言識別、計算機視覺等等。歷史經驗表明,機器理解潛在規則是很難的,但收集數據,用數據驅動機器學習演算法性能,會獲得更好的表現。

    所以,大規模應用機器學習,是一個正確的趨勢。

  • 缺點:機器學習的性能表現取決於你用來訓練它的數據,這就意味著有可能出現「臨界」情況。而找到這樣的臨界情況需要更多的數據,以及更多的嘗試,直到篩選出臨界情況。

  • 所以,機器學習是一個有監督的學習過程。在感知過程中,你感知的是當時的場景,而在感知背後的技術,是過去的積累和學習,是深度、有監督的學習;而當提到駕駛策略時,你其實是在計劃未來,這是一個不太一樣的機器學習方法,被稱作增強學習,在其中你需要與環境進行交互。

    為什麼這兩者在叫法上不同?他們的區別在於,使用數據的方式。

    1、有監督的學習

    在有監督的學習中,我們預測的行動不會對環境產生影響,因此我們可以一次性收集所有的數據,也可以在線下收集數據,然後再用這些數據不斷訓練神經網路,直到找到所有的「臨界」情況。

    2、增強學習

    在增強學習中,我們的行動會對環境產生影響,這意味著,如果我決定左轉,我就正在影響其他駕駛的車輛。所以,現在如果我要更改軟體,那意味著我需要重新收集所有的數據,因為每一次變化駕駛決策,就是在改變影響環境的方式。

    這會造成一些問題,因為臨界情況在駕駛中就代表著「事故」的可能性。而事故是一個小概率事件,為了找出這種臨界情況,那麼我們就需要大量的數據,而每次要修改軟體時,又需要重新再收集一次數據。這就造成了很大的問題。

    這也是為什麼傳統基於規則的路徑規劃演算法沒有引入機器學習,因為這個命題並不是那麼吸引人,這聽起來並不是什麼好主意。

    所以,我們找到了了一種解決這個問題的方式。用這種方法,我們可以使用機器學習演算法,同時避免數據量的爆炸,並確保安全。在Mobileye網站上可以找到這篇論文。

    我們在模擬實驗中對其進行了測試,下圖中的8輛汽車都是被訓練的駕駛主體,隨機分布,可以看到,它們經歷了複雜的調度決策。

    在這個模擬實驗中,共經歷了10萬次路測駕駛,每次測試中有8個駕駛主體、位置隨機,沒有發生碰撞事故。系統性能達到每秒10hz的頻率響應。佔用的計算量僅1%,而這些,正是得益於人工智慧。

    在傳統的方法中,你試圖開啟的是一棵包含了所有可能性的樹,這最終會導致數據爆炸和系統癱瘓。但如果使用機器學習,就像谷歌Alphago贏得了人類積累了數千年歷史的圍棋,你正在開啟一種新的可能性。

    你使用了一種新的方式,通過數據驅動的方式,穿越了這棵巨大的樹。

    目前,Mobileye已經在進行相關的研究,如下圖,所有的駕駛主體都是被我們訓練的樣本,可以看到,它們的駕駛行為已經越發接近人類。

    五、結語

    總結一下,Mobileye如何利用人工智慧加速自動駕駛的落地?主要是以下幾部分。

    1、正確的感知:即通過「強感知」理解可駕駛的路徑。傳統的方法過分依賴高精度地圖,而規避了技術上難以實現的部分,但如果這樣做,就不會形成規模化系統。

    2、正確的繪圖:使用「強感知」技術,通過眾包自動生成高精度地圖。我們的技術最終希望高精度地圖的生成完全自動化。

    3、正確的駕駛決策:讓自動駕駛車達到人類等級的判斷力,像人類一樣敏捷,同時還要確保安全,這是一個挑戰,我們在這部分的研究仍處於起步階段。大家可以在Mobileye網站上瀏覽我們的研究論文,在這方面我們與寶馬汽車進行了許多項目研究。

    而在這部分,如果我們不能正確的解決,那麼真的無法使自動駕駛落地。這其中將涉及大量的人工智慧技術。

    以上,就是人工智慧在自動駕駛領域的創新應用和變革。【完】


    推薦閱讀:

    移動端NODEJS ,How to Run Node.js with Express on Mobile Devices
    市值80億美元的Mobileye,憑什麼被英特爾溢價收購?
    有什麼途徑可以把PDF高質量轉換成mobi格式?
    爭奪無人駕駛晶元主導權!英特爾150億美元收購關鍵技術公司Mobiley
    如何將字體文件精簡用於製作Epub或Mobi電子書?

    TAG:駕駛 | 自動駕駛 | 發聲 | 相信 | Mobi | Mobile | 我們 | 實現 | 收購 |