自動駕駛呼喚理性決策 | CES深度分析(三)
本文作者:地平線智能駕駛商務總監李星宇。本篇推送是全文第三部分內容,最後一部分將在明天繼續放送!
文章對本屆CES的自動駕駛最新進展進行了分析,認為商業模式的變革是自動駕駛領域群雄並起的原因,並從「合作共享」、「感測器成本下降」和「車聯網發展」三個角度論證了自動駕駛產業化的長足進步。他還指出,自動駕駛競爭的關鍵是更加理性的決策演算法和更實用的計算平台。文章最後,他對自動駕駛的未來表示非常期待。回顧:第一部分
回顧:第二部分
當前:第三部分
第四部分
▼
一、決策演算法成為競爭焦點
從技術角度講,自動駕駛由三大主要技術構成:感知、決策和控制。現在自動駕駛技術真正的門檻在哪裡?
地平線自動駕駛技術架構
如果你去CES參觀各家公司的自動駕駛樣車,你會發現一個趨勢:各家公司的感測器配置越來越趨同化:前視多目攝像頭,77GHz長距/短距雷達、環視攝像頭、加上十個以上的超聲波雷達,豪華一點的再配上幾個低線束的激光雷達,這些感測器的供應商也差不多。在感知層面,隨著ADAS的大量部署和長時間的技術開發,已經相當成熟,可以說感知技術已經不是主要的瓶頸。而控制則是傳統車廠和Tier1非常擅長的領域,做了很多年,積累了大量的經驗。
自動駕駛在技術上的競爭,主要聚焦於決策環節。事實上,區分一個系統是ADAS還是自動駕駛,也主要是看該系統是否有決策部分。無論是谷歌,還是特斯拉,他們的核心競爭力,都還是體現在其決策演算法方面。
傳統汽車界的研發是基於功能安全的設計方法學建立的,滲透到開發流程的每一個環節,並且在過去一個世紀,將汽車的安全性提高到了極高的水準,如今,頂尖的公司已經可以確保汽車發動機能使用一百萬公里!但是面對洶湧而至的機器學習熱潮,傳統汽車界突然發現自己嚴重缺乏技術儲備,面對特斯拉和谷歌激進的策略,顯得力不從心。這已經成為制約傳統車廠開發自動駕駛的最大短板,目前,傳統車廠或者大肆收購機器學習公司,或者與其合作,他們需要儘快補上這塊短板。
傳統車廠出身的克拉富西克顯然深知這一點,在他出任Waymo CEO之後,谷歌一改之前模稜兩可的商業策略,明確表示向車廠提供解決方案,並迅速宣布和本田合作,事實上是將自己定位在Tier 1的角色,此前谷歌雖然在技術積累上處於領先位置,但一直沒有確定可行的商業模式,克拉富西克的到來,讓谷歌對於商業化的態度更接地氣,也更精準。在該解決方案中,硬體基本也是外購的,顯然無法成為谷歌的競爭壁壘,最有價值的,還是一整套經過驗證的軟體,尤其是其中的決策演算法。可以想像的是,谷歌將會向業界提供軟體授權,就像它之前在安卓系統上所做的一樣。
二、理性決策是必然趨勢
決策演算法面臨的最大挑戰,就是如何達到自動駕駛所需要的極高的安全性和可靠性。自動駕駛決策的結果會輸出到控制器,根據ISO26262已有的功能安全的規定,這會反過來要求決策系統也需要達到ASIL-D的標準。目前,ISO組織對專門針對自動駕駛的功能安全標準正還在制定中,有可能會用一種新的標準進行考量,但功能安全的基本原則依然有效。
? 端到端的AI方法有隱患
這意味著,我們必須嚴肅地思考,如何才能滿足功能安全的要求?對於谷歌、百度以及許多初創公司,這些非傳統車廠出身的玩家來說,是一個全新的命題。
目前,很多創新公司都在使用深度學習加增強學習做端到端的訓練,也就是說,從感測器的輸入直接導出控制器(剎車、油門、轉向等)的輸出。但深度學習的問題在於它失去了透明性,僅僅依賴於概率推理,也就是相關性,而非因果推理,而這兩者是有本質不同的。
相關並不意味著因果。舉個例子,統計發現,手指頭越黃的人,得肺癌的比例越大。但事實上,手指的顏色和得肺癌的幾率之間顯然沒有直接的因果聯繫。那麼為什麼統計數據會顯示出相關性呢?這是因為手指黃和肺癌都是由吸煙造成的,由此造成了這兩者之間產生了虛假的相關性。
深度學習就像一個黑盒子,無法進行分析,出了事情你不知道原因到底是什麼,也沒有辦法預測下一次會出什麼狀況,有一個很搞笑的例子,用深度學習訓練一個系統,來分辨哈士奇和愛斯基摩狗,初步測試效果非常好,但進一步的測試表明,這個系統其實是通過區分背景,而不是狗本身來判定其種類的,因為訓練所使用的樣本中,愛斯基摩狗幾乎總是伴隨者雪地的背景,而哈士奇則沒有,想想看,如果這樣的系統應用到自動駕駛,是多大的隱患!
深度學習的實際表現,基本上取決與訓練的樣本以及你所要求輸出的特徵值,但如果你的樣本比較單一,輸出特徵值又比較簡單,則很容易訓練出你並不想要的結果來。就自動駕駛而言,這是無法接受的,它需要高度的理性決策。
如今,深度學習的熱潮席捲了整個業界,很多人不再對基礎演算法進行鑽研,而是瘋狂加大數據,堆機器進行訓練,以期更快地出成績,結果看上去還不錯,但這樣的非理性態度其實是給自動駕駛埋下了隱患。我們需要的是對於事實邏輯的深入分析,已經不同方法論的結合,從這個意義上講,如果用小數據可以達到好的效果,更能說明我們對機器學習技術的理解能力。
? 基於規則的專家系統不靈活
傳統的主機廠和Tier 1面臨的則是另外的問題,如果接觸各大Tier1的ADAS產品,無論是AEB,還是ACC,LKA,你會發現都是基於規則的專家系統。這種系統精確可分析,但專家系統的問題在於,但場景非常多變時,創建的規則就無法保證足夠的覆蓋面,結果,當添加更多新的規則時,就必須撤消或者重寫舊的規則,這使得這個系統變得非常脆弱。
並且,各個功能都有自己單獨的規則,組合到一起,其可能性就非常多,甚至還存在矛盾,這使得ADAS向自動駕駛過渡之路變得更加艱難。我曾經跟一家主機廠在交流他們的決策系統詢問過這個問題,得到的答案是:這種基於專家系統的規則經過組合,能產生一萬種可能!你甚至很難對這個系統進行完整的測試。
? 新的決策機制:因果推理
因此,我們需要在自動駕駛領域引入新的決策機制。自動駕駛決策技術路線的一個重大趨勢,就是從相關推理到因果推理。這樣的人工智慧框架是Judea Pearl在八十年代建立的,他也因此拿到了圖靈獎。
上世紀 80 年代初,Judea Pearl為代表的學術界出現了一種新的思路:從基於規則的系統轉變為貝葉斯網路。貝葉斯網路是一個概率推理系統,貝葉斯網路在數據處理方面,針對事件發生的概率以及事件可信度分析上具有良好的分類效果。它具有兩個決定性的優勢:模塊化和透明性。
地平線自動駕駛決策機制
模塊化的優勢非常重要,例如,假如任務是更新汽車的變速箱,當變速箱被更換的時候,你不必重寫整個傳動系統,只需要修改為變速箱建模的子系統,其餘的都可以保持不變。
因此,我們可以把深度學習的系統作為一個子模塊融入到其中,專家系統可以是另一個子模塊,也融入其中,這意味著我們有了多重的冗餘路徑選擇,這種冗餘構成了貝葉斯網路的子節點,將有效強化輸出結果的可靠性,避免一些低級錯誤的發生。
透明性是貝葉斯網路的另一個主要優勢。對於自動駕駛而言,這尤為關鍵,因為你可以對整個決策的過程進行分析,了解出錯的哪一個部分。
可以說貝葉斯網路是理性決策的極佳實現,適合用於設計整個決策的頂層框架。
因果推理的另一個典型範例就是基於增強學習的決策框架,它把一個決策問題看作是一個決策系統跟它所處環境的一個博弈,這個系統需要連續做決策,就像開車一樣。優化的是長期總的收益,而不是眼前收益。這有點像巴菲特的價值投資,優化的目標不是明天的收益,而是明年或者十年以後的長期總收益。
谷歌把這樣的框架用在下圍棋上,取得了革命性的成功。自動駕駛的場景也非常適合應用這樣的決策系統。比如說要構建價值網路,評估當前的駕駛環境風險,評估的是從現在時間到未來時間的整體風險;然後利用策略網路輸出本車的控制決策,選擇最優的駕駛路徑和動力學輸出。
同時,我們還可以構建一個基於模擬路況的模擬環境,通過增強學習去做虛擬運行,獲得最優的決策模型,並且還將產生大量的模擬數據,這對決策演算法的成熟至關重要。
可以說,向因果推理型決策模型轉化是自動駕駛技術邁向成熟的重大標誌。
(未完待續)
下期內容:自動駕駛需要新的計算平台
作者簡介
李星宇 | 地平線智能駕駛商務總監畢業於南京航空航天大學,獲得了自動化學院測試儀器及儀錶專業的學士和碩士學位;曾任飛思卡爾應用處理器汽車業務市場經理,原士蘭微電?安全技術專家。 李星宇有13年半導體行業從業經驗。他在加入飛思卡爾的早期,任職於i.MX應用處理器研發團隊,在該領域取得一項NAND Flash存儲應用美國專利。在加入飛思卡爾之前,他在士蘭微電子負責安全晶元的公鑰加密引擎設計,該引擎的RSA/ECC加解密性能處於國內領先平。推薦閱讀:
※當前深度學習和slam結合有哪些比較好的論文,有沒有一些開源的代碼?
※NLP(自然語言處理)界有哪些神級人物?
※我們離電影《終結者》中的人形機器人還有多遠?
※AI研究院 | 谷歌押注人工智慧,但仍在尋找下一個收入來源
※這段視頻嚇死十幾個CEO:這個「小蜜蜂」能追身能爆頭!