ADAS單目/雙目/三目到底有什麼區別?終於有結果了 | GGAI深度

一個月之前,《高工智能汽車》在蔚來ES8發布之時,曾發表了一篇關於三目攝像頭的文章。核心點是想要找出三目攝像頭在自動駕駛領域是一個什麼樣的存在,但最終結果並不盡如人意。有用戶也在後台提問到,最後到底是子丑寅卯?

我無法解答,問題縈繞心頭,一時竟無法釋然。一個偶然的機會,我和一家國內較早涉足ADAS的企業負責人聊到了這個話題,頓覺點亮了阿拉丁神燈。整理如下,文章略長,字數4千有餘,讀閉需7min左右。君若有心讀完,想必一定能解答一些N目攝像頭的疑問。

註:有表達不當或失准之處,還請各位專家多多指教,畢竟,吾乃一業外人士。

攝像頭的智能化

攝像頭在日常生活中非常常見,一般用來完成拍照、攝像這些基本的功能。但自動駕駛以及人工智慧的到來,使得人們有了從攝像頭中,獲取更為智慧的結果的需求,即通過攝像頭的視野,分析感知環境的變化,做出判斷,將結果反饋到終端或者雲端的處理器當中,服務於更豐富的應用。

自動駕駛作為最先嘗鮮的應用領域之一,攝像頭很早就進入了科研專家的考察範圍。業內研究最早同時實力最強的,是Mobileye。這家誕生於以色列的單目視覺公司,有著在汽車高級輔助駕駛系統領域12年的研發經驗,提供晶元搭載系統和計算機視覺演算法運行 DAS 客戶端功能。

公司的產品可實現車道偏離警告 (LDW)、基於雷達視覺融合的車輛探測、前部碰撞警告 (FCW)、車距監測 (HMW)、行人探測、智能前燈控制 (IHC)、交通標誌識別 (TSR)、僅視覺自適應巡航控制 (ACC) 等功能,產品佔據全球市場超過70%的份額。

之所以要花這麼大的篇幅去介紹Mobileye,是因為他們是業內單目攝像頭解決方案的絕對領導者。

對,沒有之一,也沒有任何含混不清,他們就是NO.1。這也是為什麼晶元巨頭英特爾願意花153億美金買下這家在從前名不見經傳的小公司的原因。

以上的表述中,眼尖的人一定主要到了一個詞:單目攝像頭。那麼什麼是單目攝像頭呢?文章開頭提到的三目攝像頭又是什麼鬼?有沒有雙目的呢?接下來,我將帶大家一一解開這一困擾我一個多月的問題。

單目攝像頭

目前應用於自動駕駛的路況判斷,多以單目攝像頭方案為主。也就是業界鼻祖Mobileye的看家本領。

但單目攝像頭有一個問題是,在測距的範圍和距離方面,有一個不可調和的矛盾,即攝像頭的視角越寬,所能探測到精準距離的長度越短,視角越窄,探測到的距離越長。這類似於人眼看世界,看的越遠的時候,所能覆蓋的範圍就窄,看的近的時候,則覆蓋的範圍就廣一些。

人眼是雙目的,在性能上要遠優於人造產品,但在觀察周遭環境的時候,也依然會遇到覆蓋不全的問題。通俗點來講,眼觀六路,耳聞八方常常用來形容一個人機敏,能快速感知周圍的環境狀況。我們將這樣的人視為聰慧的人,一般人很難達到這樣的水平。但一雙眼睛,怎能達到眼觀六路?

這不過是漢字語言的一種比喻的說法,並不能當真。因此,即使是如人一般昂貴精妙的雙眼,也在實際的使用環境中,有力所不能及的時候。

車載攝像頭是定焦的,它無法像人眼一樣快速變焦。不同的焦距可以滿足不同的範圍。

目前的ADAS(高級輔助駕駛)所要求的是40米-120米的範圍,未來將會達到200米甚至以上。Mobileye現在的技術水平,所能達到的也是120米範圍以內,但從下一代EyeQ4、EyeQ5開始,Mobileye將會達到150-200米的視距。

那麼如何用一個定焦鏡頭解決不同距離的觀察,就成為了困惑行業的難題。也因此,業內產生了雙目甚至多目的方案,用來解決不同距離下攝像頭看清、看準的問題。

多目攝像頭

不同焦距的攝像頭,與成像的清晰度是直接掛鉤的。車載攝像頭一般是固定焦距的,目前車載攝像頭每秒處理的圖像在20幀左右,每秒處理的數據量巨大。

一方面車載攝像頭從技術上是很難達到頻繁變焦的,另一方面單個攝像頭頻繁變焦根本無法應對秒級的巨量數據接收處理。

這也是為什麼Mobileye前兩年開始多目研究的原因。多目攝像頭,可以通過不同的攝像頭來覆蓋不同範圍的場景,既解決了攝像頭無法來回切換焦距的問題,也可以一次性解決不同距離下識別清晰度的問題。

比如說廣角鏡頭用來看近處的環境,80度的覆蓋30米左右的環境,60度覆蓋中遠距離,40度負責遠距離觀察。不同的攝像頭負責觀察不同距離、角度範圍的場景,各司其職,互不干擾。

但多目攝像頭目前也並不是完美的解決方案,它會生出另外的一些難解問題。

比如,第一,在汽車上如何放置的問題。汽車擋風玻璃處通常是各種配件聚集的地方,這裡本身需要安裝雨量感測器,以及有可能額外添加的激光雷達、行車記錄儀,攝像頭等等。這個地方本身已經擁擠不堪,留給多餘設備的空間並不大。

而多目攝像頭本身又有一些要求,比如攝像頭之間的距離要在10-20cm左右,這就更加劇了擋風玻璃處的擁擠。

第二,多目攝像頭的成本會翻倍,只從簡單的硬體上就是單目的N倍,而且演算法上的複雜度和成本也時成倍增加。多路圖像數據的處理比單路數據處理的難度要大,這對處理晶元的要求以及硬體的可靠性要求增高。

因此,多目攝像頭的出現,既解決了一些現有問題,也衍生出了各種各樣其它的問題。

雙目攝像頭

業內很多新興的初創公司,為了避開與Mobileye的正面競爭,選擇從雙目切入。但雙目也存在兩個關鍵的問題。第一是成本問題,第二是安裝位的問題。

第一個問題是,雙目的方案,兩個鏡頭理論上要一模一樣,因為一旦存在差異,會使得測量的準確性大打折扣。業內也會稱之為立體攝像頭。

但一個攝像頭是由6個光學的鏡片和一些感測器組成,而玻璃鏡片的生產製造是打磨出來的,並不是壓制而成的。這就從根本上產生了鏡片生產存在差異性的問題。

所謂的單反攝像機,最昂貴的莫屬一個個動輒數萬的鏡頭,原因就在這裡。大家都聽過卡爾蔡司鏡頭吧,這個公司已經有超過100年的歷史,他們的鏡頭在業內可謂鼎鼎大名。

曾經手機界的扛把子諾基亞,在自己的手機中使用的就是這家公司的鏡頭。不客氣的講,當時同檔次的諾基亞旗艦機N95的成像質量,真真是甩了iPhone一座珠港澳大橋的距離。

攝像機鏡頭一般都有些參數,比如畸變度,對焦度,隨著準確度的上升,誤差範圍的收窄,成本也是扶搖直上的,業內一般使用的鏡頭誤差在5%的範圍內。一般,單目攝像頭的誤差可通過後期演算法的調教,進行有效的處理。

但雙目攝像頭,由於本身測距的原理,導致會要求兩個鏡頭之間的誤差越小越好。如果兩個鏡頭各自都有5%左右的誤差,那麼對於後期調教的演算法,難度就會加大許多,而且還不能保證確定性。

而如果要將兩個攝像頭的誤差縮減到1%左右,達到使用的要求,那麼攝像頭的成本就會高不可攀。同時無論鏡頭生產商還是採購方,都需要面對產品不良率的問題。

雙目攝像頭同時也存在擺放位置的問題。兩個鏡頭之間的距離是10-20cm之間,這個距離需要非常精準,因為這會直接關係到測距的準確性。

由於汽車使用的環境複雜多變,只是溫度要求,都是在-40—85度。而傳統器材必然有熱脹冷縮的問題,那麼這就會影響到兩個鏡頭之間的距離。因此只有很高端的一些車型,會使用到立體攝像頭,而且即使是使用了,場景也會非常有限。主動巡航和自動駕駛根本做不到。

業內做的好的公司,能夠將單目攝像頭的誤差控制在3%以內。理論上立體攝像頭的誤差可以做到1%以內,但從實際的應用層面來看,1%跟3%在現有的應用環境下,並不存在太大的差別。尤其是在單目攝像頭搭配一些毫米雷達等感測器以後,完全可以達到類似的精度。

雙目攝像頭的方案,在成本、製造工藝、可靠性、精準度等等綜合因素的制約下,導致其難以在市場上推廣,而單目攝像頭低成本可靠性的解決方案,搭配其他感測器,完全可以滿足L1、L2以及部分L3場景下的功能。因此在現有市場環境下,單目攝像頭的解決方案依然會是主流。

ES8的全系產品都搭載了三目前向攝像頭、4個環視攝像頭、5個毫米波雷達、12個超聲波雷達。

三目攝像頭

除了較為多見的雙目攝像頭方案,三目攝像頭也進入了一些公司的視野,如蔚來的ES8。但三目攝像頭是終極的解決方案嗎?目前看來,並不是。

三目攝像頭誕生之初,目的是為了解決汽車前向測距的問題。眾所周知,汽車行駛的過程中,如果要滿足自動駕駛的要求,需要車身感知設備對前方兩百米左右的道路環境做到精準測量,以求做出相應的控制決策。

三個攝像頭在判斷、測算障礙物距離的時候,會有一個核心的邏輯問題。由於攝像頭的精準度是有一定的誤差範圍,因此三個不同的攝像頭,檢測障礙物的精準性都會有一定的誤差。

那麼在不同攝像頭覆蓋距離範圍的交匯處,兩個相鄰攝像頭測算出障礙物的距離很可能是不同的,會存在10米左右的誤差。

還有同樣一個場景,兩個鏡頭獲取到的圖像可能會不一樣。對於這些「不尋常」的情況,專家並沒有良策。而這些數據都是在同一時間獲取到的,後台的演算法會隨時處理,運算的結果也會直接反饋到中央控制器,用來對汽車的駕駛行為做出調整。

不同攝像頭獲取到同一場景的不同數據,需要在後台進行融合,某種意義上而言,就是數據處理結果的PK,誰更準確就採納誰。但由於硬體的差異性本身存在,導致後台目前對於這種誤差並沒有合理的規則和解決方案去進行優勝劣汰的處理。

這種無法決策的局面,還會同其它的感測器如激光雷達、毫米波雷達探測到的結果再進行一次融合(PK),多重的不確定性導致最終難以做出普遍意義上「正確合理」的決策。

Mobileye也正是因為無法解決這一根本性的邏輯處理問題,導致在嘗試了三目攝像頭的方案之後,又回到了原來的單目攝像頭的方案上。

5年內單目還是主流

處理攝像頭數據的晶元,是制約攝像頭解決方案的重要因素。Mobileye花了十年,才製造出了滿足汽車電子規範要求的晶元,可見,符合車規要求的晶元難度之大。

目前市場上,還未出現可以滿足雙目圖像處理、符合車規要求、大規模商業化量產的晶元,已經量產的一些車型中類似於斯巴魯使用的,仍然配合使用了FPGA的方案,來達到雙目演算法處理所需的算力要求。

現在市場上並沒有商業化的晶元能夠支持多目攝像頭的方案,都是FPGA的方式。而Mobileye的EyeQ4和 EyeQ5可以滿足這樣的要求,但Mobileye本身覺得這樣的搭配方案並沒有太大的必要。

人眼實際上就是立體攝像頭,但人都需要大規模的訓練,才能達到測距的準確性。但坦白講,印象中只有特種兵才可以通過手指比對的方式手動測出較為精準的距離,而我們普通人要通過雙眼判斷物體的準確距離,其實還是很困難的。

雙目攝像頭的方案,理論上是可以達到很高的精度,但需要非常專業的技術團隊,才有可能研發出來。但即使研發出來,也會面臨嚴重的成本問題。

企業本身做產品的目的就是推而廣之,讓產品大規模應用,而非束之高閣,以作觀瞻。一個產品如果價格居高不下,對於實際的商業化應用,並沒有太大的意義。

也因此,有部分業內人士表示,至少在5年內,單目攝像頭還將會是市場的主流,多目的方案還需匍匐前行。

異形鏡頭可能是新的出路

新的感測器技術,從鏡頭成像,到特殊異形鏡頭的設計,感測器技術的迭代更新,將有可能解決現有攝像頭存在的問題。

Mobileye用到的感測器是1/2.7寸的,或者1/3寸的,現在新的感測器技術可以達到1/1.7或1/1.5寸,已經提高了一到兩倍。Mobileye跟攝像頭廠商類似於舜宇這樣的企業,正在共同研發下一代的異形攝像頭。

通常,業內使用的鏡頭是球形、橢圓形的,而新的異形鏡頭光圈很大,可以覆蓋不同的測距範圍,同時保證成像質量。

另外,目前大部分攝像頭廠家使用的攝像頭都是100萬像素,而Mobileye下一代的EyeQ4或者EyeQ5則會使用到400萬甚至800萬像素的攝像頭。

隨著更大尺寸的感測器應用,單個攝像頭可以保證1-200米內,任何一個焦段成像清晰。這將會徹底解決多目攝像頭現存的一些問題,雖然目前成本較高,但它的前景還是非常值得期待的。


推薦閱讀:

深度好文:修行者的心境,就是『過而不留』(不看可惜) | 業務講堂
中國人,何時學會「尊嚴死」?
為什麼一定要讓孩子學會說「不」?(深度推薦)
深度解析――四柱命理、八卦六爻
英國 愛爾蘭10晚12日深度游(維珍航空 單直飛 雙古堡 牛津大學 寶爾勢格莊園 比斯特購物村 溫德...

TAG:深度 | 結果 | 區別 |