《無人駕駛(Driverless: Intelligent Cars and the Road Ahead)》 讀書筆記

讀書得看來頭,尤其是 「無人駕駛」 這種熱詞,很容易遇到蹭熱點的雜書,書城裡搜 「無人駕駛」 或是 「人工智慧」 這種熱詞,幾十個結果,大都標題誇張,封面炫酷。不一樣的是這本書的作者背景很深厚,Hod Lipson 是哥倫比亞大學人工智慧實驗室主任,原康奈爾大學人工智慧研究院負責人;Melba Kurman 曾在微軟和康奈爾大學從事人工智慧實驗和產品研發工作超過15年。更重要的是書的內容涵蓋範圍廣,很多重要方向比如深度學習或是無人駕駛的早期應用,都有詳盡的描述和參考。

這本書對 「無人駕駛」 的探討非常全面,包括大家討論最熱的無人駕駛技術,應用場景以及面臨的主要問題;還包括我們下一步才會聚焦的道德問題,社會形態變化等等;除此之外,不像大多數科技崇拜者聚焦在無人駕駛帶來的便利,作者也探討了很多無人駕駛給我們帶來的負面影響以及無能為力的部分。不僅這樣,每個方面的研究都還很有深度,看過一些大數據和機器學習的背景資料之後,能感受到作者下筆時費了很多功夫。

書的一開始,老哥就提到了兩個很重要的觀點

  • 就像人類製造飛機不是仿製鳥類煽動翅膀一樣,我們製造無人駕駛也不一定要先做一個能夠開車的機器人。雖然製造一個多肢體、像人類一樣開車的機器人很難,至少目前都沒有完全實現;但製造一個控制四個輪子,在公路上自動駕駛的汽車要簡單的多。
  • 雖然在 99% 的時間裡,駕駛過程都是思維僵化而且可預測的,但仍有 1% 的時間會產生突發時間。面對突發事件,人類有著幾十萬年進化出來的應激反應能力,而自動駕駛卻不一定能夠輕鬆處理這種情況。這也是自動駕駛的最大難點,我們可以很輕易開發出自如操控 99% 情況的自動駕駛車輛,卻很難保證剩下的 1% 突發情況下的安全。

所以無人駕駛的一大挑戰就是如何提升對這些突發情況的處理,而這個挑戰的核心問題是如何提升汽車對周圍環境的感知能力。如果具備足夠強大的感知能力和計算能力,車就能在突髮狀況下比人更完備地感知發生的一切並做出處理。這一輪無人駕駛的興起的背後也就是 「計算能力的提升」 和 「感知能力的提升」 這兩大進步。

  • 計算能力的提升:摩爾定律讓計算機的計算性能指數級提升
  • 感知能力的提升:深度學習的興起,讓計算機視覺對圖像的認知、處理能力大幅提升

講到這些提升的時候老哥也會陷入深思,無人駕駛的進步其實也是機器人的進步,無人駕駛的感知能力提升,就意味著機器人對環境的感知能力有了提升。這可以類比 5 億年前寒武紀生物第一次進化出視覺,從此迎來生物種類大爆發。因此我們很可能也快要迎來機器人的大爆發。雖然聽起來有些靠不住,老哥後面會做更細緻的論斷。

1) 一些前置討論

在開始正文之前,老哥先針對無人駕駛的一些重要問題做了簡單探討,後面這些問題大多會有更詳細的討論。

阻礙無人駕駛發展的 7 個誤區

  • 自動化駕駛應該產生於駕駛員輔助技術?
    • 其實並不是這樣的,作者認為的無人駕駛技術應該是完全的從最開始的開發就擺脫人類駕駛員。這個後面會做詳細論述
  • 技術的進步是線性的?
    • 無人駕駛得更好,就可以有更多車上路,搜集數據能力,自我優化能力會隨著這個正向循環指數增長
  • 公眾會抵制無人駕駛?
    • 如果足夠安全,公眾是樂意使用無人駕駛的,喜愛駕駛的人只佔少數
  • 無人駕駛需要在基礎設施大量投入?
    • 並不需要特殊的基礎設施
  • 無人駕駛的道德困境?
    • 這個問題和人類在面臨兩種生命選擇的時候的情景是一樣的,只是在開發無人駕駛的這個時候,人類被逼著必須在無人車的設計里做這個選擇
  • 無人駕駛需要近乎完美的駕駛記錄才能足夠安全?
    • 只要能超過人類的駕駛水平,無人駕駛就是有優勢的
  • 無人駕駛汽車的應用匯突然大爆發?
    • 無人駕駛在生活中的應用應該是逐步的

無人駕駛技術發展時間表

  • 第一代:應用到特殊場景(比如礦場,農場和貨運卡車)
    • 因此第一代無人車不會成為消費者的日常代步工具
  • 使用區域會從某些特定的國家地區擴散到更多地區
  • 至少 2025 年成為公路主流
  • 2035 年新車中有 10% 自動駕駛(IHS 公司估計)
  • 2050 年所有新車是自動駕駛 (IHS 公司估計)

2) 無人駕駛的世界

下面開始仔細研究這個問題,如果這個世界上的主要車輛都是無人駕駛,世界會是什麼樣子呢?

  • 更少的花費,更短的時間
    • 這個很好理解,因為無人駕駛的行駛速度可以更快,也省去了人力成本
  • 世界變得安靜
    • 沒有了警笛聲,喇叭聲,車的行駛也會更平緩
  • 無人移動座艙
    • 不再有駕駛員,交通開始變成一種更直接的商品,打車變得更容易,更隨意。
  • 便利的個人移動
    • 車會更少?其實不一定,雖然私家車數量會減少,但因為出行變得更簡單更快速,人們會更多使用車,因此會有更大的用車需求。這樣算,擁堵可能會更加嚴重。
    • 車會更多?也不一定,這個依賴於人們的出行需求會增加多少。
    • 但可以肯定的是每輛車的行駛里程會增加。
    • 雖然車的里程增加,車的壽命不一定會降低,因為沒有了各種安全性限制,車可以被製造得更耐用。
  • 停車位不再頭痛
    • 停車位的痛苦在於
      • 找停車位的時間
      • 停車位佔用的空間
    • 自動駕駛之後,停車位需求會減少,因此會節省時間,同時減少停車位的空間需求。這會對城市規劃有非常大的影響。
  • 社交和孤獨感
    • 這個比較有意思。未來,地鐵站、公交和火車都不復存在,人們相互接觸的機會會減少,家人開車送對方的場景也沒有了,因此人們的社交會更少,孤獨感也會更強。

2.1) 自動駕駛汽車到底是什麼形態?

軟體和硬體的協作

  • 未來的無人駕駛汽車由軟體公司和汽車企業聯合組建,雙方發揮各自的長處
    • 汽車公司將車身框架平台出售給下游的科技公司,科技公司在這些平台上把車變為自動駕駛汽車(很類似現在的 Windows 和 OEM 廠商的合作方式)
    • 或是稍好一些的汽車公司像蘋果公司一樣,獨立掌控軟體和硬體

不會從有人到無人漸進式演變

  • 汽車公司偏好從有駕駛員的輔助駕駛慢慢升級為完全的無人駕駛,但作者不這麼認為。人類和機器人不會輪流掌控方向盤
  • 原因:
    • 自動化偏見:一旦看到技術有效,人們就會很快信任技術,這樣人們就很難在投入到駕駛任務中了。
  • Google 的無人駕駛發展過程也驗證了這一點。
    • 前期的計劃都集中在部分無人駕駛
    • 後來表示只會集中於全自動化駕駛

Moravec』s Paradox (莫拉維克悖論):讓電腦在智力測試或者國際象棋中超過成人水平相對簡單,但如果想讓它表達一歲兒童的感知能力和移動水平則困難很多。

  • 人類感知環境和移動雖然一歲孩子就可以,但其實並沒有想像中那麼簡單:人類大腦中的神經元主要用具監控基本的身體機能和條件反射過程

2.2) 無人駕駛系統

  • 底層控制
    • 核心工作:將系統穩定在最佳設定值上。
    • 使用各種反饋控制設備管理汽車內部系統的運行方式,比如剎車,加速和轉向
    • 為何電動汽車更適合自動駕駛?
      • 燃油車的控制反饋是一個機械過程,會有一定滯後
  • 上層控制
    • 管理汽車的長期策略計劃,比如導航和路線規劃
  • 中層控制軟體
    • 使得汽車的操作系統能夠通過感測器感知周圍的環境並針對周圍的事物或事件作出最佳反應方案

中層控制非常關鍵,我們前面討論到 Moravec』s Paradox 提到過,對周圍環境的感知能力對機器人或是自動駕駛非常重要,這些感知能力就是由中層控制軟體決定的。下面是中層控制中的一些關鍵步驟

  • 物體識別
    • 這個問題沒辦法通過編寫基本規則來處理所有情況,因為現實情況下(比如十字路口)場景是無限多的,我們沒辦法創建一個全面規則

中層控制系統的四個模塊

  • 佔據柵格的軟體工具
    • 存儲汽車周圍實體對象的記錄。如今的佔據柵格已經可以實時、高清存儲汽車外的場景
  • 識別並標記流入佔據柵格的原始數據
    • 使用深度學習對物體進行標記
  • 預測性人工智慧軟體對障礙物用不確定性錐(Cones of Uncertainty) 替代
    • 預測汽車附近物體的位置和速度
  • 短期軌跡規劃器

2.3) 怎樣算安全?

很多人堅持無人汽車只有達到 100% 可靠性才能合法,但從軟體和硬體開發流程上看,這種情況是永遠無法達到的。另一方面,只要無人汽車能夠超過人類司機的安全性,它就是具有優勢的。

  • 人類司機大概 19 萬英里發生一次事故(可能是致命的也可能是一次擦碰)
  • (作者認為)基準線是:無人駕駛汽車的安全駕駛平均里程達到人類的兩倍。(比較好奇這個兩倍是怎麼得出的)

在未來,無人汽車的安全係數(多少倍於人類的安全駕駛里程)會成為汽車宣傳的特色。不同類型的車輛也會有不同的安全係數要求。

2.4) 蜂巢思維(Hive Mind)

和人類司機提升安全性不同的是,無人駕駛汽車可以通過相互之間的數據共享,指數倍地快速學習。只要車隊里的任何一輛車學習過這條路,其他車輛也就具備了同樣的能力。

2.5) 向民航飛機學習

  • 政府監管
    • 無人駕駛需要政府的監管,需要政府對機器人有充分了解,能夠權衡和量化機器人的駕駛能力
  • 高度模塊化和冗餘設計
    • 飛機上的關鍵模塊有雙重或者三重冗餘設計
  • 故障防護
    • 系統之間可以相互檢測故障,並且能夠容納一定程度的故障
  • 中控部分應該隔離人體,避免無意或事惡意破壞

3) 無人駕駛的早期探索 & 電子化高速公路

老哥在前面七個問題中提到說無人駕駛不需要對基礎設施做改造。但對無人駕駛的早期探索階段,曾經有過基於電子高速公路的無人駕駛。

1939 年,通用公司就夠想過未來的無人駕駛:自動化高速公路藉助一套無線電控制系統管理汽車

1956 年,聯邦政府通過了《聯邦高速公路法案》推動汽車運輸發展,開啟持續數十年的高速公路建設。汽車進入黃金時代,美國的 「汽車文化」 也由此誕生。

1958 年,通用公司完成電子化高速公路的全面展示

  • 車輛偵測系統檢測前後汽車並維持安全距離
  • 汽車前端有兩個用於距離引導的電磁線圈用來檢測汽車是否偏離方向

自動化高速公路衰亡的主要原因是成本。

目前國家政策制訂者對於 「智能交通運輸系統」 制定的政策並不一定包含機器人。他們更關注 V2X 技術。 V2X 一般包括 V2V (車對車通信)和 V2I (車對基礎設施通信)兩部分。而在作者看來,V2X 技術相比前面提到的無線電監控高速公路沒有很大提升。

後來由聯邦公路管理局負責的 Automated Highway System Program 成功定義和創造出了全自動化汽車-高速公路系統並且成功展示 demo。但這個活動仍然有一些缺點:

  • 無人導航駕駛技術不夠成熟
  • 展示中的自動高速公路系統仍然需要配置昂貴的基礎設施

作者認為 V2X 技術能夠有效提高道路安全,但是它只能在這兩種情況下才會發揮作用

  • 所有汽車全部自動化
  • 所有道路都安裝了 V2X 系統

但是很難把 V2X 技術普及到如此程度,如果只有 10% 的車安裝了 V2X,則最後只有 10% x 10% = 1% 的信息能夠實現交互。而且 V2X 技術對於黑客攻擊和系統干擾沒有什麼防範能力。

3.2) 非智能高速公路

前面討論了很長一段為什麼不需要智能高速公路,這裡列出了兩個主要原因

  • 投資智能高速公路的資金很難籌措到
  • 如果智能汽車能夠做到安全駕駛,我們就只需要保證最基本的要求:提供汽車需要的關鍵的車道標誌等視覺信息
  • 硬體技術很容易面臨迭代淘汰的危險

3.3) 如果我是聯邦政府

這裡老哥討論了一下他覺得聯邦政府應該做的

  • 設立專門的全自動化汽車管理機構(類似民航的監管機構)用於制定相關標準和政策
  • 機構應該致力於推廣無人駕駛技術,讓民眾對無人駕駛產生興趣
  • 機構應該撥款舉辦競賽(類似 DARAP 之前資助的比賽)
  • 劃分責任:如果無人汽車發生事故,應該如何劃分責任
  • 隱私保護:無人駕駛車能夠搜集大量數據,如何保證這些數據不會影響到隱私

4) 機器人的崛起

既然無人駕駛很早就有,為什麼能夠在這幾年突然爆發?老哥認為有亮點原因

  • 計算機處理速度增強,體積減小
  • 2001 年美國國會通過一項法案,要求 2015 年美國有 1/3 的軍用車輛必須使用全自動化汽車

第二個原因很神奇,自從法案通過之後,DARPA 開始從 2001 - 2007 資助了三場公路賽事。

  • 2004 年的比賽沒有勝出者
  • 2005 年的冠軍是斯坦福大學車隊,亞軍和季軍來自 CMU
    • 斯坦福的車隊使用的技術很具有啟發性。他們放棄了基於規則的人工智慧,而是通過中層控制軟體來識別和響應
  • 2007 年的比賽要求車輛完全擺脫人的協助。 CMU 和通用汽車聯合獲得冠軍,斯坦福獲得亞軍

無限狀態空間

  • 機器能夠在下棋比賽中戰勝人類,因為下棋的狀態是有限的。而無人駕駛面對的場景是無限的,直到近些年,人類才找到方法解決無限狀態下的感知和控制問題。

5) 無人駕駛汽車詳解

  • 高清數字地圖
    • 無人車需要比普通導航更清晰的高清地圖,而且需要包含更多的信息比如車道線、路口、施工路段等等
  • 數碼相機
    • 獲取周圍環境的 2D 影像
  • 激光雷達
    • 獲取環境的 3D 影像,得到的數據是點雲
  • 普通雷達
    • 雷達可以輕易穿透濃霧、暴雨、沙塵等等
    • 雷達不僅可以檢測物體的位置,還能通過多普勒效應檢測物體速度
  • 超聲波感測器
    • 優點:能夠穿透濃霧、塵土
    • 缺點:傳輸速度比電磁波慢很多
  • GPS
  • IMU 慣性單元
    • 可以在 GPS 不準確時保證汽車定位
    • 同時可以感受車輛的姿態
  • 線控技術
    • 用於將控制系統的操作轉換成實際操作

6) 深度學習

看到這裡,我們可以看出來,無人汽車的興起與深度學習非常相關,因為深度學習極大地增強了機器人對周圍環境的感知能力。

神經網路:

  • 在人的大腦里,當神經元受到刺激時會 「放電」,將這個刺激信號傳遞給其他細胞。對神經元來說,最重要的問題時 「我是否應該放電」。
  • 人類對神經網路的研究在 20 世紀 40 年代有了一個良好的開端。後來的研究包含了不同的方法,但有一些核心概念被普遍認同:
    • 神經元彼此連接形成一個去中心化的神經網路
    • 當個體神經元細胞之間的興奮加強或者減弱時,大腦開啟學習。
    • 只有達到一定閾值,神經元才能放電

感知器

  • 感知器時人類製造的用來模擬神經網路的基本結構,最早的感知器由 Cornell 的 Frank Rosenblatt 教授提出和製作。
  • 和編程時的硬編碼不同,感知器通過反饋來學習,經過不斷的訓練,感知器能夠對刺激做出越來越符合期望的反饋

人工智慧的冬天

  • MIT 的 Marvin Minsky 教授否認感知器能夠學會任何技能,並認為感知器沒有科學價值
    • 雙方都有道理
      • 只憑藉自己學習,感知器能學會的非常有限
      • 未來由多層感知器層層疊加之後的網路能夠學習更多內容
  • 從此人工智慧開始了兩大學派之爭
    • 符號主義:由程序員編寫代碼搭建邏輯模型;
    • 神經網路:機器學習為主

神經網路的復興

  • 1975 年,哈弗博士生 Paul Werbos 讓神經網路不僅能輸出 1 和 0,還能輸出分數數值;並提出了反向傳播演算法用於訓練多層神經網路
  • 20 世紀 90 年代神經網路的發展再次變慢。因為機器學習的發展太好,而神經網路的 overfitting, overspecialize 問題還沒得到解決

神經認知機(Neocognitron)

  • 圖像被 feed 給網路時被分成若干個像素,每個神經元細胞只和若干個像素相連
  • 神經元克隆,每個神經元都有成千上萬個突觸連接,但只需要幾個參數就能設置連接度
  • 兩種神經元:一種用於特徵提取,一種用於包容特徵變化

人們基於神經認知機創造出來卷積神經網路 CNN

雖然 CNN 的發明很早,但當時(20 世紀 80 年代)沒有足夠的計算能力做支撐,沒辦法訓練出層數超過 4 層的網路。

數據引擎

2010 年後,計算機價格下降,運算速度提高,手機兼具相機的功能,數據量迅速增加。深度學習開始盛行。

李飛飛的幾個成就

  • 2003 年創造出 Caltech 101,一款圖像存儲器,用於吧 9146 張圖像拆分成 101 種不同類型
  • 2006 年發展成 Caltech 256
  • 2009 年加入斯坦福大學搭建 ImageNet

GPU

數據急劇增加讓深度學習可以有足夠的訓練素材,同時 GPU 的發展讓深度學習的訓練變得更快

突破的開始

有了大量數據和 GPU 的計算能力作為支撐,此後的深度學習開始迅速發展,下面是 ImageNet Challenge 的比賽成績變化,可以明顯看出這種發展。(作為對比,人類識別同樣圖像的出錯率為 5%)

  • 2010 年,冠軍神經網路的出錯率為 28%

  • 2011 年,出錯率為 25%
  • 2012 年,東京大學 SuperVision 神經網路達到 85% 正確率
  • 2014 年,Google 團隊達到 6.66% 錯誤率
  • 2015 年,微軟北京實驗室錯誤率為 3.57%

後面關於神經網路更細節的介紹就省略掉了,有興趣的建議看原著里的描述。

7) 數據數據數據

無人駕駛的興起需要數據支撐的深度學習的支撐,無人駕駛興起之後可以產生巨量的數據,數據真的很重要。

  • 高清地圖是無人駕駛行業最重要的數據之一,因此無人駕駛的興起會有助於高清地圖行業的興起。
  • 數據推動駕駛能力提升的良性循環:
    • 無人駕駛搜集的數據越多,訓練出來的無人駕駛能力也就越強,無人駕駛也就可以跑更多地方(更多車,每個車跑更遠),就可以搜集更多數據
  • 預測交通
    • 搜集的巨量交通數據可以被用來預測交通的變化,提升模型的預測能力。
    • 而且隨著無人車越來越多,人類司機越來越少,交通中的不定變數越來越少,也就讓交通更能被預測
  • 個人隱私
    • 具備各種感測器,可以搜集各種信息,因此需要重視個人隱私的保護

道德倫理

這是無人車的一個重要議題,面對突發情況無人車應該怎麼選擇,尤其是在 「電車難題」 面前,無人車會做出怎樣的選擇,這個面臨的道德壓力非常大。

作者對這個問題有自己的看法:這種道德問題一直都存在,即使是人類司機也必須做出這種選擇,我們只是在設計無人車時必須正視這個問題,必須做出一個選擇。現在這個問題被正視了就引起了人們的恐慌。然而相比人類的直覺,機器人能夠更理性,利用更多數據做出決策,因此理論上時更好的一種方式。

8) 客觀分析 & 為何無人車會廣泛應用

縱觀科技發展史,革新的科技非常多,但是其中能夠廣泛被應用的卻只是其中一部分,到底無人車會不會被廣泛應用,同時怎樣的科技才能夠被廣泛應用呢?

零原則(Zero Principle):產品推出後,一項或者多項生產工作的成本降到幾乎為零。

  • 蒸汽機降低了鋼鐵產業的成本,鋼鐵催生了運輸業和造船業
  • 計算機降低了計算成本,催生了軟體行業和電子遊戲行業
  • 無人車能減少運輸成本,縮短運輸時間,同時降低社會成本:交通事故
    • 接近零傷害:降低車禍發生率
    • 接近零技術:去除了貨運和客運成本
    • 接近零耗時:駕駛時間減少到零
    • 接近零尺寸:因為安全性的提高,汽車的尺寸可以更小,貨車的大小可以幾乎和物品大小相等

工作崗位:無人駕駛可以改變很多行業

  • 貨車駕駛:貨車司機會大量減少
  • 汽車銷售:用車方式的改變會直接影響人們購買汽車的方式
  • 進一步惡化收入差距
  • 交通事故相關的企業收入會減少(醫院,保險,罰款)

未來汽車行業將分為兩大類:

  • 製造實用標準化運輸工具
  • 製造特殊顧客用途車輛

消費性汽車的設計再次興起

  • 對安全性關注度的降低,客戶可以更多的自定義

軟體機械師:根據不同汽車的人身安全評級為顧客提供專業的購買意見

降噪崗位:乘車體驗不斷提高,人們對降噪的要求會越來越高

路線投標:一些公司會付費給高清地圖公司,要求將自己的服務被宰地圖上標註成推薦地點,並在無人車服務過程中推薦這些服務

新型零售:

  • 運輸成本急劇下降之後,小企業也能在價格上與大公司競爭

  • 「本地出產」 吸引力會下降,因為運送時間縮短,成本降低之後,本地出產的商品競爭力會下降

形狀、大小各異的運輸車:

  • 有人類司機時,貨車的設計必須考慮司機的舒適程度,大小和形狀上會有限制。
  • 沒有了這種限制之後,安全限制減小了,形狀和大小也會更自由

線上購物更有魅力

  • 快速廉價的貨運

犯罪

  • 竊取無人車的數據會是一類犯罪
  • 劫持機器人會成為一種犯罪

娛樂

  • 車內娛樂不再局限於廣播,人們也開始看電影,玩遊戲
  • 車內性行為會增加

手動駕駛稱為一種娛樂

9) 寒武紀大爆發 & 機器人爆發

這是一個基於前面的發展和分析做出的一個推斷,無人車的興起其實也意味著機器人的大爆發可能會到來。

因為機器人發展依賴的幾項技術都在快速發展

  • 計算能力
  • 數據存儲
  • 交互能力(感測器,帶寬等等)
  • 演算法的進步

機器人的進化:如果我們把機器人看作一個物種,讓機器人隨機地把機器人零件放到一起製造虛擬機然後對計算機編程製作出下一代機器人(其實很像單細胞生物進化成人類)

  • 第一代:全部都是零件,都不能移動
  • 120 代:電線、發動機、關機依然是隨機安排,但是可以小幅度顫動和移動,這些動作幅度比其他零件好得多
  • 幾百代之後:這些移動震動性能明顯改進

推薦閱讀:

全國首個自動駕駛測試場啟用,恆潤科技自動駕駛車輛亮相
無人車第一大案閃電結束
激光雷達:谷歌Uber曾為此打得不可開交,馬斯克卻說它是無人車的拐杖
半自動駕駛大對決:特斯拉和凱迪拉克誰是真王
無人駕駛來了,安全怎麼保障?

TAG:無人駕駛車 | 讀書筆記 | 人工智慧 |