KIT: Automotive Vision汽車視覺學習筆記(2)Binocular Vision 雙目視覺

KIT: Automotive Vision汽車視覺學習筆記(2)Binocular Vision 雙目視覺

4 人贊了文章

本文僅作為自動駕駛方向愛好者的學習之用,不可用於任何商業途徑。

教程源自:KIT MRT所(KITTI由該所負責),作者:Dr. Martin Lauer。

本文主要為翻譯與自己學習記錄。

第二章:Binocular Vision 雙目視覺

1. 雙目視覺 / 立體視覺

通過2個camera組成,R3 ? R2 x R2,雙目視覺是模擬人類視覺原理,使用計算機被動感知距離的方法。從兩個或者多個點觀察一個物體,獲取在不同視角下的圖像,根據圖像之間像素的匹配關係,通過三角測量原理計算出像素之間的偏移來獲取物體的三維信息。得到了物體的景深信息,就可以計算出物體與相機之間的實際距離,物體3維大小,兩點之間實際距離。

2. 對極幾何 Epipolar Geometry

其中:virtual image planes在攝像機前距離為1的位置;

P, Fl, Fr 位於對極平面中;

極點e:左右攝像原點到在另一個虛擬平面上的投影。

對極面上的所有點都可以映射到在虛擬圖像平面上的點q,與極點e組成極線

對極幾何的意義在於:對於任意 q_{l}^{L} 一定在極線上,這就限制了搜索區域;同時一對極線描述同一個平面。

3. Fundamental Matrix基礎矩陣

當分析essential matrix E時,就需要用到camera的坐標。

在fundamental matrix F的情況下,首選圖像坐標:

舉例:圖像對比中的對極幾何

鏡頭水平平移:

鏡頭垂直移動:

鏡頭水平與垂直移動:

鏡頭沿著光學軸線平移

特殊例子:同樣的像平面image planes和內參數:

極線彼此平行

極點e位於無限的位置

4. disparity視差:

5. Rectification校正:

  • 校正:將具有相交極線的圖像對與具有平行極線的圖像對準。
  • starting point開始點: 2個camera具有不同的相機參數,和不同的坐標系
  • objective:為了定義2個虛擬的攝像機

-擁有相同的焦距

-以完全相同的方式對齊(定向)

-它的x軸平行於連接兩個焦點的基線

-它的焦點與原有的焦點完全一致

7. Correspondence Problem對應的問題:

對應的點:具有相同的灰度值

具有相同的局部環境

在同一對極線上

鄰域被保存(大部分時候)

左圖像中的u坐標大於右圖像中的u坐標(校正後的圖像)

8. Block Matching 塊匹配

基礎思路:對比2個點的局部環境

特徵選用:平均灰度值差異或者均方差

當鄰域的灰度差值一致,則可以視為同一塊

例子:通過計算視差:

Block Matching的

優點: 非常普通的方法,總是適用

並不需要知道對極幾何

缺點: 完整的搜索需求非常大的算力

一個清楚的分配只可能在,當局部環境中的灰度結構很豐富時(如果灰度變化很小,就很難區分)

較大的環境會增加計算時間,而較小的環境的灰度結構通常比較差。

備註:灰度值並不是獨立於光線,所以,快匹配在梯度圖像中表現更好(Laplace

or Sobel filtered images)

記錄: 課件篇幅有限很概略,還有很多理解不夠深入的地方。缺少標定的內容,但大體框架有了些理解,更細節的還得專門看這方面文獻。也請各位諒解我這渣排版。實在不想重新再把這麼多函數重新組織一次

推薦閱讀:

caffe 編譯bug匯總
FPGA圖像處理基本技巧
[CVPR2018筆記]Deep Layer Aggregation
《CV中的多視圖幾何》-RANSAC
[計算機視覺論文速遞] 2018-05-08

TAG:自動駕駛 | 計算機視覺 |