無人駕駛模型整理——決策篇

無人駕駛模型整理——決策篇

摩爾定律,自1965年被戈登·摩爾先生提出以來,硬體世界真實的按照他的預言發展,每18-24個月,價格不變的情況下,同樣面積的集成電路上,器件數量增加一倍。預言靈驗了50多年,眼看著集成電路的器件密度已經越來越接近硅晶體管的物理極限。

有專業人士預計,硬體的指數式升級很有可能就要告一段落。下一個突破性的替代技術還沒有大批量被應用。有可能,我們將經歷一個硬體青黃不接的停滯期。

比較而言,軟體卻沒有這種物理極限的束縛,好的模型演算法從來都能給產品以根本性優勢。

本文的內容主要參考北京理工大學袁盛玥《自動駕駛車輛城區道路環境換道行為決策方法研究》和中國科技大學陳佳佳博士《城市環境下無人駕駛車輛決策系統研究》。

1 名詞解釋

1.1 MAS

Multi-Agent System,多主體系統,系統內的成員,即相互獨立互不干涉,又可以交涉協調解決遇到的問題,可擴張性強。

1.2 RNDF,

Road Netswork Definition File,路網描述文件,說明行程中路標位置形式的說明書。

1.3 MDP

Markov Decision Process,馬爾可夫決策過程,指過程具有馬爾可夫性,指系統的下個狀態只與當前狀態信息有關,而與更早之前的狀態無關。

無人駕駛汽車決策演算法大致可分為兩大類,基於規則的決策模型和基於統計的決策模型。

2 基於規則的決策模型

2.1 徐亮等人將車輛行為分為 7 種:加速、減速、保持、換到左邊車道、換到右邊車道、左轉和右轉。基於MAS系統,提出開放式行為決策模型。

(徐亮, 張自力. 基於 MAS 的駕駛行為決策模型的研究[J]. 計算機工程與科學, 2010, 32(5):154-158.)

2.2 Vanholme B認為,行為都是非連續量,每個行為都可對應一個狀態。只需要要對狀態進行識別和處理。這種方法符合駕駛員的邏輯思維,同時可以滿足交通規則,省去了大量的計算,因而能夠保證決策具有實時性,同時也使決策功能在較短時間內實現。

(Vanholme B, Gruyer D, Lusetti B, et al. Highly automated driving on highways based on legal safety[J]. Intelligent Transportation Systems, IEEE Transactions on, 2013, 14(1): 333-347.

Fletcher L, Teller S, Olson E, et al. The MIT–Cornell collision and why it happened[J]. Journal of Field Robotics, 2008, 25(10): 775-807.)

2.3 斯坦福大學的 Montemerlo M 將車輛行為細分,建立了一個擁有 13 個狀態的有限狀態機組成決策系統。其狀態分別為:初始狀態、前向駕駛、車道跟隨、避障、停止標誌前等待、路口處理、等待路口空閑、U-Turn、車輛在 U-Turn 前停止、越過黃線行駛、在停車區域內行駛、通過交通阻塞路段、在不匹配 RNDF 路網文件的情況下在路上行駛、任務結束。

(Montemerlo M, Becker J, Bhat S, et al. Junior: The stanford entry in the urban challenge[J]. Journal of field Robotics, 2008, 25(9): 569-597.)

2.4 將駕駛行為的子行為設計為有限狀態機中的子狀態,形成分層有限狀態機。

(Ziegler J, Bender P, Schreiber M, et al. Making bertha drive—An autonomous journey on a historicroute[J]. Intelligent Transportation Systems Magazine, IEEE, 2014, 6(2): 8-20.)

2.5 2007 年的美國 Darpa 自動駕駛車輛挑戰賽中,大多數自動駕駛汽車的決策模塊都是基於規則設計的。

(GindeleT,Jagszent D,PitzerB, et al. Design of the plannerof TeamAnnieWAY』s autonomous vehicle used in the DARPA Urban Challenge 2007[C]. Intelligent Vehicles Symposium, 2008 IEEE. IEEE, 2008: 1131-1136.)

2.6 卡耐基梅隆大學的 BOSS 使用行為推理方法進行決策,按照規定的知識及規則實時推理出相應的駕駛行為。基於不同的駕駛環境,BOSS 可以產生 3 個不同的頂層駕駛行為:車道行駛,路口處理和到達一個指定位姿,每一個頂層行為又由一系列子行為組成。其功能為在到達下一個參考路徑點的行駛路徑中生成間歇性的運動目標。狀態估計器與目標選擇器共同完成這項功能。狀態估計器得到當前車輛在道路模型中的位置,目標選擇器根據車輛位置和相應道路模型以及任務規劃所產生的全局目標軌跡,產生當前的、即將發生的、未來將要發生的運動目標,具體地說,包括路口處理,道路處理、停車處理等幾大模塊,以及相應的子模塊如換道、跟馳、路口等待、通過路口等等運動命令。

(Baker C R, Dolan J M. Traffic interaction in the urban challenge: Putting boss on its best behavior[C].Intelligent Robots and Systems, 2008. IROS 2008. IEEE/RSJ International Conference on. IEEE, 2008:1752-1758.)

2.7 Virginia Tech 和 TORC Technologies 組成了 VictorTango 參賽隊,車隊及合作者共同研發了 Odin,Odin是由2005版福特混合動力車改裝成的自主行駛車輛(Andrew Bacha et al., 2008)。決策模塊基於仲裁的方法,採用「勝者為王」的機制。為了區分路口,停車場和普通駕駛場景下的行駛,採用層次有限狀態機的方法。

2.8 無人車「Talos」主要由麻省理工大學開發,「Talos」的導航模塊負責制定決策任務,它不停地計算出下一個目標點的位置並朝目標點運動。通過路口,會車及路口優先順序判定; 超車; 道路阻塞時重新規劃; 根據信號燈信息轉向。

3 基於統計的決策模型

3.1 UlbrichS 等人為了適應在城市交通場景中不可避免的感測器雜訊,在駕駛時能夠做出實時決策,提出一種兩步演算法,使 POMDP 複雜度足夠低,在信號處理網路中考慮相對距離、相對速度和碰撞時間。滿足自動駕駛車輛決策實時性、一致性、遠慮性和可預測性要求。

(Ulbrich S, Maurer M. Probabilistic online POMDP decision making for lane changes in fullyautomated driving[C]. Intelligent Transportation Systems-(ITSC), 2013 16th International IEEE Conference on. IEEE, 2013: 2063-2067.)

3.2 基於規則的決策模型具有實時性,但它更側重於實現功能,而不是實現高駕駛性能。

(Guo M, Xu Y, Zhang Y, et al. A decision-making method for unmanned cars based on drivable area cutting[C]. Cloud Computing and Intelligent Systems (CCIS), 2012 IEEE 2nd International Conference on. IEEE, 2012:1210 - 1215.)

3.3 Brechtel S 等人指出自動駕駛汽車在決策時必須考慮幾個來源的不確定性:時間預測的不確定性,環境感知中存在的不確定性,由於感測器的檢測不可避免的含有雜訊並且大部分環境都被遮擋,車輛只能感知當前情形的一小部分。將連續狀態層次貝葉斯轉換模型嵌入 MDP 模型,使自動駕駛汽車在多車雙車道高速公路場景可以進行決策。

(Brechtel S, Gindele T, Dillmann R. Probabilistic decision-making under uncertainty for autonomousdriving using continuous POMDPs[C]. Intelligent Transportation Systems (ITSC), 2014 IEEE 17th International Conference on. IEEE, 2014: 392-399.)

3.4 WeiJ 等人將感測器雜訊、感知約束及周圍車輛行為作為屬性加以決策,使用 Markov 模型進行決策,增強了自動駕駛汽車在單車道內行駛的穩定性。

(Wei J, Dolan J M, Snider J M, et al. A point-based MDP for robust single-lane autonomous drivingbehavior under uncertainties[C]. Robotics and Automation (ICRA), 2011 IEEE International Conference on. IEEE, 2011: 2586-2592.)

3.5 使用 POMDP 方法在連續狀態和行動領域裡不容易找到最優解,因而 Cunningham A G 等人使用多准側決策方法 (MPDM)進行決策,同時在線評估決策結果,POMDP 被用來表明模型的近似和假設。

(Cunningham A G, Galceran E, Eustice R M, et al. MPDM: Multipolicy decision-making in dynamic,uncertain environments for autonomous driving[C]. Proc. IEEE Int. Conf. Robot. and Automation, Seattle,WA, USA. 2015.)

3.6 基於規則的決策模型能夠快速實現功能,基於統計的決策模型能夠充分考慮不確定性,結合兩者優點,為了適應城區環境中複雜的駕駛場景,Furda A 等人使用多屬性決策方法增強決策的舒適度和高效性

(Furda A, Vlacic L. Enabling safe autonomous driving in real-world city traffic using multiple criteria decision making[J]. Intelligent Transportation Systems Magazine, IEEE, 2011, 3(1): 4-17.

Furda A. Real-time decision making by driverless city vehicles: a discrete event driven approach[D]. Griffith University, 2010.)

3.7 陳佳佳在採用層次有限狀態機的方法行駕駛場景的轉換基礎上,基於人類駕駛員複雜場景下的決策過程,提出了一種基於多屬性決策方法的行為決策模型,抽取行駛過程中駕駛員關注的相關屬性,判斷、評價進行駕駛狀態的擇優,使得行為決策過程符合人類駕駛員的思維過程,解決了城市複雜交通場景下自動駕駛車輛的類人決策問題。

(陳佳佳. 城市環境下無人駕駛車輛決策系統研究[D]. 中國科學技術大學, 2014.)

3.8 為解決複雜城區道路環境中決策問題,ChenJ 等人採用多屬性決策方法來選擇自動駕駛汽車的最優策略,多屬性決策方法結合了層次分析法(AHP)及優劣解距離法(TOPSIS),使用 TOPSIS 來排列可選方案,AHP 把經驗駕駛員主觀和客觀的意見變成量化值。

(Chen J, Zhao P, Liang H, et al. A Multiple Attribute-based Decision Making model for autonomous vehicle in urban environment[C]. Intelligent Vehicles Symposium Proceedings, 2014 IEEE. IEEE, 2014: 480-485.)

3.9 彭剛、黃心漢等人(2008)為了解決移動機器人在決策中遇到的實際問題,建立了一種新的神經網路決策模型,該模型以足球機器人為實際背景,基於徑向基函數,藉助於神經元的訓練,可以更好的利用多源信息進行規劃,提升了決策的準確性。

(彭剛,黃心漢,楊濤,等.基於神經網路和模糊推理的移動機器人行為決策與控制[J].華中科技大學學報:自然科學版,2008 (S1).)

希望對你也有所幫助。


推薦閱讀:

帝國風暴步兵---傑達巡邏TK-14057 手辦開箱
想送男朋友一個模型,入門級的高達萬代或樂高?
hobby boss DDG-67科爾號模型小測評
他的夢想是「創造月球」,而且真的實現了
艦船模型的水景是如何製作的,有什麼技巧?

TAG:無人駕駛車 | 決策 | 模型 |