KIT: Automotive Vision汽車視覺學習筆記(3)Feature Point Methods 特徵點檢測

本文僅作為自動駕駛方向愛好者的學習之用,不可用於任何商業途徑。

教程源自:KIT MRT所(KITTI由該所負責),作者:Dr. Martin Lauer。

本文主要為翻譯與自己學習記錄。

第三章:Feature Point Methods 特徵點檢測

本章重要:特徵點,尺度空間不變性,SIFT,角點或者邊界點的檢測

1.Feature Point Methods

  • general assignment problem一般匹配問題:

-找到圖像中的對應的點

-沒有對極幾何關係

  • images might differ in圖表區別於:

Scaling 縮放,Rotation 旋轉, Brightness亮度,viewing angle可視角度

  • detection檢測:找到具有特別特徵的點(特徵點)
  • description描述:創建一個能識別考慮點的描述(描述符)
  • approaches方法: 存在不同的方法,這裡主要討論SIFT(scale invariant

    feature transform尺度不變特徵變換)的細節

2. Illumination Invariance 照度不變性

  • 關於照度的不變性:

-同樣的場景,不同的曝光

-生成的差別是不變的(關於照度)

  • 照度不變性和SIFT:

類似於前一個的想法,但利用 Laplacian of Gaussian 過濾(LoG)

3. Scale Invariance尺度不變性

  • LoG過濾:最大值隨著σ不斷增大,不停移動

  • LoG和圖片縮放的步驟可以互換,結果一致:

  • solution解決辦法:選擇2個不同的σ

  • scale space尺度空間表示為:

  • interest point detection興趣點檢測:找到局部尺度空間的最大值
  • 優點: 防止興趣點隨著縮放而移動;縮放不變性

4.Scale Space尺度空間

5.特徵點在SIFT中

一個特徵點需要滿足以下條件:

在一個經過LoG過濾的圖片中,它一定是尺度空間的局部最大值;

為了降低雜訊,LoG濾波器的反饋:顯著性的最大值一定比閾值大;

正確定義的最大值:(hessian矩陣的特徵值應該大致相同)。

6.Corners and Edges焦點與邊緣

不是所有局部σ 最大值都可以簡單被檢索,σ 在灰度角點容易被檢索,在邊緣則不容易被檢索。

兩者區別: 特徵點如何有效的被檢索how reliably can a given feature point be retrieved?

-feature point is maximum of L(u,v,σ).特徵點是L最大值

-local quadratic approximation of L L的局部二次逼近: H是hessian matrix

-一個最大值很好被定義:當H的特徵值都有相同的量級,特別是當:Tr為H的跡

-標準類似於「Harris corner detector」。

7. Feature Point Descriptors特徵點描述符

第一步:找到定義好的點

第二步:找到這些點的正確描述:

特徵,為了清除區分這些點

不變數:選擇,縮放,方向變化和照度

這些點的局部鄰域描述

(1)對於第一步:通常是分析局部鄰域中的灰度值。 (高維度)

(2)對於第二步:局部鄰域中的灰度的梯度

對於點和它的鄰域非常具有象徵性

照度不變性

沒有旋轉不變性

與HOG特徵相似(機器視覺中的)

8. Rotational Invariance旋轉不變性

過程:定義優先的方向;旋轉圖像段以獲得優先方向不變性;計算旋轉圖像的描述符

優先的方向:在工作環境中定義梯度方向

畫方向直方圖(36個區間,每個10°)

在直方圖中選擇最重要的方向

9. SIFT

第一步:找到定義好的點

在使用LoG後,尺度空間的最大值

顯著的最大值,大於閾值(為了降低雜訊)

正確定義的最大值:(H矩陣的特徵值大致相同)

第二步:找到每個點的描述符

計算優先方向並旋轉分割的圖片(旋轉不變性)

計算每個小segment的方向的直方圖

通過方向直方圖,建立一個特徵的向量feature vector

描述符可以用來檢索在另一個圖片中的特殊點。

10.相對於SIFT的其他演算法:

記錄:關於特徵邊緣提取,涉及多種運算元:canny運算元等,課件基本沒介紹,但還是可以幫助人初步認識這個領域的一些東西。涉及方向直方圖的內容有點類似點雲法向量,通過鄰域附近點的向量權重來獲得查詢點的方向,三維跟二維還是有點相近的地方。

本來計劃每一章節都深讀,但課程內容受限,現在準備快速通讀,有個整體概念,之後細細拜讀李飛飛教授的計算機視覺課程。

推薦閱讀:

3D卷積神經網路Note01
brox近期論文
腦洞大開的機器視覺多領域學習模型結構 | CVPR 2018論文解讀
圖像檢索之Large-Scale Image Retrieval with Attentive Deep Local Features
【小林的OpenCV基礎課 14】進擊的輪廓畫手/凸包

TAG:自動駕駛 | 計算機視覺 |