無人駕駛，個人如何研究？

12-28

網站啦，ios，android，linux kernel等只要有一台筆記本連網就能自學。無人駕駛技術應該怎麼學習(研究就說不上了)
都需要哪些基礎課程？哪些演算法？

無非就是智能控制技術，人工智慧，模式識別等知識吧？

作為一個在公司義務給應屆生和實習生培訓的「小師」，結合我自己學習的經歷，從操作手冊的角度，手把手教你「無人駕駛」從入門到轉行。

前言

先看看無人駕駛基本的硬體構造及其成本

圖片出處：https://www.wired.com/2015/04/cost-of-sensors-autonomous-cars/

看完圖，就會發現一個十分尷尬的問題——除了超聲波雷達以外，剩下的設備都買不起。

所以個人做無人駕駛研究，在沒有大資金支持的情況下，就不要考慮基於實車做研究了。

斷了從硬體方面著手做研究的念頭，我們直接看看軟體方面。

軟體方面可以做的工作就很多了，掌握其中某一項或多項技能，對你在該領域的發展都大有裨益。

操作系統安裝

必學指數：

易學指數：

既然是做軟體，首先得有個操作系統。常見的操作系統Windows/Linux/Mac...（打...的操作系統我也沒用過），考慮到社區支持、開發效率，推薦使用 Linux 作為無人駕駛研究的操作系統。

大部分做無人駕駛的團隊都用的 Linux，跟著大趨勢走，可以省很多事。

Linux 又分為很多版本，最常用且普及率很高的當屬 Ubuntu 系列。雖然 Ubuntu 已更新至 17.04，但從穩定性上，推薦安裝 14.04 版本。

推薦用一塊單獨的SSD安裝Linux，或者使用虛擬機安裝，最不推薦裝雙系統（不太穩定）

奉上 Linux Ubuntu 14.04 安裝包 + 虛擬機安裝方法

鏈接：http://pan.baidu.com/s/1jIJNIPg 密碼：147y

Linux基本指令

必學指數：

易學指數：

作為Linux的核心——命令行操作不僅對開發大有幫助，而且是裝X利器。

另一個好處是使用指令 apt-get install，可以快捷地完成很多軟體的安裝，不用像Windows那樣，在網上四處尋覓適配的安裝包。

Linux的指令很多，而且比較雜，使用起來需要多學，多用。

有道雲筆記分享：有道雲筆記-Linux基本指令介紹

開發環境安裝

必學指數：

易學指數：

開發環境會涉及很多實際使用的庫，不同的程序員處理相同的問題，可能使用不同的庫。

下面通過安裝我在工作和學習中經常使用到的庫，拋磚引玉，將開發者"引進門"。

搭建環境所需安裝包：

鏈接：http://pan.baidu.com/s/1sllta5v 密碼：eyc8

詳細的安裝方法見筆記：有道雲筆記-Linux開發環境搭建

開發環境介紹

必學指數：

易學指數：

集成開發環境IDE

前面安裝了一款開源的IDE qt，目前 qt 在 Linux 中的地位，就和 Visual Studio 在 Windows 中的地位一樣。除非是不使用 IDE 開發的高玩，大部分在 Linux 下做開發的團隊還是會選擇用 qt 開發的。

qt 的主要作用是做互動式的界面，比如在界面中顯示當前感測器採集到的各種信息。界面交互會明顯加快開發者調試程序和標定參數的過程。

Tips：

熟悉 qt 可以網上找教程，我更推薦系統地學習，比如買一本 Qt 的書。

買書或者去圖書館借書，注意看寫書的日期，越新越好，太老的書，相應的版本也很舊。

OpenCV

OpenCV是一個非常強大的庫，其中封裝了大量的可應用於無人駕駛研究的函數，包括各種濾波器演算法、特徵點提取、矩陣運算、投影坐標轉換、機器學習演算法等。

當然最重要的是，它在計算機視覺領域的影響力，相機標定，目標檢測、識別、跟蹤的介面使用起來十分方便。使用OpenCV庫完全可以做出這張圖展現的效果。

圖片出處：https://www.nvidia.com/en-us/gtc/sessions/self-driving-and-ai-cars/

Tips：

請至少購買版本為2.4以上的教程學習OpenCV，但目前市面上買得到的OpenCV中文教程都講的太淺，甚至連經典的Kalman Filter都不介紹。我推薦直接學習英文版的 Learning OpenCV3。

奉上電子版，講解很詳細，每次列印一章閱讀，循序漸進。

鏈接：http://pan.baidu.com/s/1dE5eom9 密碼：n2dn

libQGLViewer

libQGLViewer是大名鼎鼎的 OpenGL 適配 qt 的一個庫，編程介面及方法與 OpenGL 大同小異，我們經常在各大無人駕駛公司宣傳畫上看到的環境感知信息的顯示，就完全可以用 QGL 做出來。

圖片出處：http://open.163.com/movie/2015/10/U/U/MB1G83TR9_MB1GMCRUU.html

Tips：

學習 libQGLViewer 不需要購買任何教材，官網及壓縮包內的 example 就是最好的老師，按照官網的tutorial，把每個例子實現一遍，就基本入門了。

官網鏈接：libQGLViewer Home Page

Boost

Boost庫是有著「C++准標準庫」之稱。這個庫裡面有大量的」輪子「，對於C++開發者來說，方便直接調用，避免重造"輪子"。

Tips：

Boost是基於標準C++開發，其構造用盡精巧手法，不要貿然費時研讀，找一份和 Boost 庫相關的（電子或紙質）書，把目錄讀一遍，大致知道裡面有哪些功能即可，需要時就某一個點，花時間做研究。

QCustomplot

除了上面提到的libQGLViewer外，還可以通過平面圖的形式顯示車載感測器的信息。鑒於 qt 內部只提供了基本的直線、圓等繪圖工具，使用起來並不是很方便，因此QCustomplot誕生了。簡單地調用API，然後把想要顯示的數據作為參數輸入進去，就可以繪製出下面這些很棒的圖形。而且可以很方便地拖動和縮放。

圖片出處：QCustomplot Home Page

下面是我在實際開發過程中，使用 QCustomplot 顯示的部分感測器信息。

Tips：

官網提供了該庫的源碼下載，你只需要在你的工程中導入 .cpp 和 .h 文件即可。跟著官網提供的 tutorials 學習，可以快速上手。對照著example中的常式寫代碼，可以快速把自己的數據變成可視化圖像。

LCM（Lightweight Communications and Marshalling）

團隊開發軟體必然存在程序（多進程）的通信問題，多進程通信的方式很多，也各有優缺點，使用起來就見仁見智了。2014年12月MIT公布了他們在美國DARPA機器人挑戰賽中使用到的信號傳輸機制LCM，出處：MIT releases LCM driver for MultiSense SL。

LCM含多種語言如java,c++等專門針對實時系統在高帶寬和低的延遲的情況下進行消息發送和數據封送處理。它提供了一個發布/訂閱消息模型、自動封裝/解封代碼生成工具含多種編程語言版本。這個模式和 ROS 現在節點間的通信方式很類似。

Tips：

LCM兩個進程間通信的demo官網上有源代碼，按照官網上的tutorial就能快速建立屬於你自己的LCM通信機制。

官方網站：LCM Projcect

Git Github

Git是團隊開發不可缺少的版本控制工具，大家在寫論文時肯定每天一個版本，如果沒有特別標註每個版本改了些什麼時間久了就會忘記。寫代碼更是如此。

使用Git可以極大地提高多人開發的效率，而且版本管理規範，代碼追溯起來十分方便。

Github在軟體開發領域如雷貫耳，需要某些代碼時，直接上去搜索即可。

Tips：

目前世面上介紹Git的書，讓人看起來十分吃力，而且對細枝末節的東西介紹地太過深入，讓人無法快速上手。

於是我要強烈推薦Git入門的教程：廖雪峰的Git教程，淺顯易懂，而且還配合圖文+視頻，簡直良心。

以上基本介紹完了開發所需要的東西，掌握好這些東西，就可以來我司面試了。

———————分割線———————

現在有了自動駕駛開發的工具，那麼再掌握一些自動駕駛開發的流程就如虎添翼了。

下面開始介紹做自動駕駛開發過程需要了解的基礎知識。

自動駕駛開發流程

必學指數：

易學指數：

先分享某創業公司公開的一份PPT

鏈接：http://pan.baidu.com/s/1qYoJcUo 密碼：o3wx

實現一個智能駕駛系統，會有幾個層級：

感知層 → 融合層 → 規劃層 → 控制層

更具體一點為：

感測器層 → 驅動層 → 信息融合層 → 決策規劃層 → 底層控制層

各個層級之間都需要編寫代碼，去實現信息的轉化。

最基本的層級有以下幾類：採集及預處理、坐標轉換、信息融合

採集

感測器跟我們的PC或者嵌入式模塊通信時，會有不同的傳輸方式。

比如我們採集來自攝像機的圖像信息，有的是通過千兆網卡實現的通信，也有的是直接通過視頻線進行通信的。再比如某些毫米波雷達是通過CAN匯流排給下游發送信息的，因此我們必須編寫解析CAN信息的代碼。

不同的傳輸介質，需要使用不同的協議去解析這些信息，這就是上文提到的「驅動層」。

通俗地講就是把感測器採集到的信息全部拿到，並且編碼成團隊可以使用的數據。

預處理

感測器的信息拿到後會發現不是所有信息都是有用的。

感測器層將數據以一幀一幀、固定頻率發送給下游，但下游是無法拿每一幀的數據去進行決策或者融合的。為什麼？

因為感測器的狀態不是100%有效的，如果僅根據某一幀的信號去判定前方是否有障礙物（有可能是感測器誤檢了），對下游決策來說是極不負責任的。因此上游需要對信息做預處理，以保證車輛前方的障礙物在時間維度上是一直存在的，而不是一閃而過。

這裡就會使用到智能駕駛領域經常使用到的一個演算法——卡爾曼濾波。

坐標轉換

坐標轉換在智能駕駛領域十分重要。

感測器是安裝在不同地方的，比如毫米波（上圖中紫色區域）是布置在車輛前方的；當車輛前方有一個障礙物，距離這個毫米波雷達有50米，那麼我們就認為這個障礙物距離汽車有50米嗎？

不是的！因為決策控制層做車輛運動規劃時，是在車體坐標系下完成的（車體坐標系一般以後軸中心為O點），因此毫米波雷達檢測到的50米，轉換到自車坐標系下，還需要加上感測器到後軸的距離。最終所有感測器的信息，都是需要轉移到自車坐標系下的，這樣所有感測器信息才能統一，供規劃決策使用。

同理，攝像機一般安裝在擋風玻璃下面，拿到的數據也是基於攝像機坐標系的，給下游的數據，同樣需要轉換到自車坐標系下。

自車坐標系：拿出你的右手，以大拇指 → 食指 → 中指的順序開始念 X、Y、Z

然後把手握成如下形狀：

把三個軸的交點（食指根部）放在汽車後軸中心，Z軸指向車頂，X軸指向車輛前進方向。

各個團隊可能定義的坐標系方向不一致，只要開發團隊內部統一即可。

信息融合

信息融合是指把相同屬性的信息進行多合一操作。

比如攝像機檢測到了車輛正前方有一個障礙物，毫米波也檢測到車輛前方有一個障礙物，激光雷達也檢測到前方有一個障礙物，而實際上前方只有一個障礙物，所以我們要做的是把多感測器下這輛車的信息進行一次融合，以此告訴下游，前面有一輛車，而不是三輛車。

當然，信息融合中還涉及時延的補償，具體如下：

對於一些大容量數據，確實不能以很高的頻率發送（比如10Hz，100ms才發送一次）。這樣的數據對高速行駛中的汽車來說，肯定會有偏差。

這些偏差我們算一下：

感測器檢測到前方有一個靜止障礙物，我100ms之後收到了這個感測器的信息，告訴我這個障礙物離我有30m。如果自車這時正以60KM/h的速度行駛，則這100ms，自車行駛了60 / 3.6 * 0.1 = 1.67m。

所以實際上這個障礙與我的距離為31.67m。

所以面對通信中產生的時延問題，尤其是低頻率的信息，一定要考慮時延產生的後果。

時延補償的另外一個問題：程序處理時，不能保證任何時候都是按固定的頻率發送的。

這取決於硬體系統當時的環境，可能溫度高了，性能下降，處理速度變慢，10Hz 的發送頻率變成了 8Hz。如果我們的程序還是按固定的100ms去計算時延導致的偏差，必定會出現計算錯誤的情況。

因此我們需要引入時間戳，即在我們發送的信息中加入當前的系統時間，通過兩幀數據的時間差來判斷接受到的信號到底延時了多久，這種方式比根據頻率判斷來得更準確。

決策規劃

這一層次主要設計的是拿到融合數據後，如何正確做規劃。

規劃包含縱向控制和橫向控制。

縱向控制即速度控制，表現為什麼時候加速，什麼時候制動。

橫向控制即行為控制，表現為什麼時候換道，什麼時候超車等。

個人對這一塊不是很了解，不敢妄作評論。

———————分割線———————

微信公號：自動駕駛乾貨鋪

知乎專欄：無人駕駛乾貨鋪