KIT: Automotive Vision汽車視覺學習筆記(3)Feature Point Methods 特徵點檢測
本文僅作為自動駕駛方向愛好者的學習之用,不可用於任何商業途徑。
教程源自:KIT MRT所(KITTI由該所負責),作者:Dr. Martin Lauer。
本文主要為翻譯與自己學習記錄。
第三章:Feature Point Methods 特徵點檢測
本章重要:特徵點,尺度空間不變性,SIFT,角點或者邊界點的檢測
1.Feature Point Methods
- general assignment problem一般匹配問題:
-找到圖像中的對應的點
-沒有對極幾何關係
- images might differ in圖表區別於:
Scaling 縮放,Rotation 旋轉, Brightness亮度,viewing angle可視角度
- detection檢測:找到具有特別特徵的點(特徵點)
- description描述:創建一個能識別考慮點的描述(描述符)
- approaches方法: 存在不同的方法,這裡主要討論SIFT(scale invariant feature transform尺度不變特徵變換)的細節
2. Illumination Invariance 照度不變性
- 關於照度的不變性:
-同樣的場景,不同的曝光
-生成的差別是不變的(關於照度)
- 照度不變性和SIFT:
類似於前一個的想法,但利用 Laplacian of Gaussian 過濾(LoG)
3. Scale Invariance尺度不變性
- LoG過濾:最大值隨著σ不斷增大,不停移動
- LoG和圖片縮放的步驟可以互換,結果一致:
- solution解決辦法:選擇2個不同的σ
- scale space尺度空間表示為:
- interest point detection興趣點檢測:找到局部尺度空間的最大值
- 優點: 防止興趣點隨著縮放而移動;縮放不變性
4.Scale Space尺度空間
5.特徵點在SIFT中
一個特徵點需要滿足以下條件:
在一個經過LoG過濾的圖片中,它一定是尺度空間的局部最大值;
為了降低雜訊,LoG濾波器的反饋:顯著性的最大值一定比閾值大;
正確定義的最大值:(hessian矩陣的特徵值應該大致相同)。
6.Corners and Edges焦點與邊緣
不是所有局部σ 最大值都可以簡單被檢索,σ 在灰度角點容易被檢索,在邊緣則不容易被檢索。
兩者區別: 特徵點如何有效的被檢索how reliably can a given feature point be retrieved?
-feature point is maximum of L(u,v,σ).特徵點是L最大值
-local quadratic approximation of L L的局部二次逼近: H是hessian matrix
-一個最大值很好被定義:當H的特徵值都有相同的量級,特別是當:Tr為H的跡
-標準類似於「Harris corner detector」。
7. Feature Point Descriptors特徵點描述符
第一步:找到定義好的點第二步:找到這些點的正確描述:
特徵,為了清除區分這些點
不變數:選擇,縮放,方向變化和照度
這些點的局部鄰域描述
(1)對於第一步:通常是分析局部鄰域中的灰度值。 (高維度)
(2)對於第二步:局部鄰域中的灰度的梯度
對於點和它的鄰域非常具有象徵性
照度不變性
沒有旋轉不變性
與HOG特徵相似(機器視覺中的)
8. Rotational Invariance旋轉不變性
過程:定義優先的方向;旋轉圖像段以獲得優先方向不變性;計算旋轉圖像的描述符
優先的方向:在工作環境中定義梯度方向
畫方向直方圖(36個區間,每個10°)
在直方圖中選擇最重要的方向
9. SIFT
第一步:找到定義好的點
在使用LoG後,尺度空間的最大值
顯著的最大值,大於閾值(為了降低雜訊)
正確定義的最大值:(H矩陣的特徵值大致相同)
第二步:找到每個點的描述符
計算優先方向並旋轉分割的圖片(旋轉不變性)
計算每個小segment的方向的直方圖
通過方向直方圖,建立一個特徵的向量feature vector
描述符可以用來檢索在另一個圖片中的特殊點。
10.相對於SIFT的其他演算法:
記錄:關於特徵邊緣提取,涉及多種運算元:canny運算元等,課件基本沒介紹,但還是可以幫助人初步認識這個領域的一些東西。涉及方向直方圖的內容有點類似點雲法向量,通過鄰域附近點的向量權重來獲得查詢點的方向,三維跟二維還是有點相近的地方。
本來計劃每一章節都深讀,但課程內容受限,現在準備快速通讀,有個整體概念,之後細細拜讀李飛飛教授的計算機視覺課程。
推薦閱讀:
※3D卷積神經網路Note01
※brox近期論文
※腦洞大開的機器視覺多領域學習模型結構 | CVPR 2018論文解讀
※圖像檢索之Large-Scale Image Retrieval with Attentive Deep Local Features
※【小林的OpenCV基礎課 14】進擊的輪廓畫手/凸包