【關於立體視覺的一切】視覺SLAM專用術語的一句話介紹

視覺SLAM(Simultaneous localization and mapping)是計算機視覺的一個重要方向,其中包含了大量的視覺相關的背景知識和專有名詞。這些名詞包含的大的主體框架下,穿插在負載的公式推導中,有時候令初學者難以看清它們的本來面貌。對於這些涉及到的名詞,是不是可以用一句話,讓讀者更通俗地理解他們的定義與作用。下面是一次大膽的嘗試!

視覺里程計:簡而言之,就是把新來的數據與上一幀進行匹配,估計其運動,然後再把運動累加起來的東西。

迴環檢測:就是如何有效的檢測出相機經過同一個地方這件事,它可以幫助消除長時間累計的誤差,本質是場景識別問題。

對極約束:描述的是兩幅視圖之間的內在射影關係,與外部場景無關,只依賴於攝像機內參數和這兩幅試圖之間的的相對姿態

基本矩陣:反映【空間一點P的像素點】在【不同視角攝像機】下【圖像坐標系】中的表示之間的關係。

本質矩陣:反映【空間一點P的像點】在【不同視角攝像機】下【攝像機坐標系】中的表示之間的關係。

兩視圖基礎矩陣和本質矩陣的最簡單推導 - CSDN博客

本質矩陣和基礎矩陣的區別是什麼? - apollon wong的回答 - zhihu.com/question/2758

單應矩陣:空間點三維坐標到像素坐標(齊次形式)的轉換矩陣。

單應矩陣,基本矩陣,本質矩陣 - 游振興 - 博客園

光流:通過檢測圖像中光點和暗點的移動,來判斷圖像中像素點相對於觀測者的移動速度。如果場景是靜止的,就可以得到觀測者的相對移動速度。

位姿圖:後端圖優化方法一,BA中,不管路標了,原來是路標和頂點之間構成邊,而這裡是頂點和頂點之間構成邊,求得是兩個相機位姿之間的相對運動。路標點這時候只是對姿態節點的約束。

因子圖:後端圖優化方法二,就是對函數因子分解的表示圖,一般內含兩種節點,變數節點和函數節點。我們知道,一個全局函數能夠分解為多個局部函數的積,因式分解就行了,這些局部函數和對應的變數就能體現在因子圖上。

貝葉斯網路:既形式上,一個貝葉斯網路就是一個有向無環圖,結點表示隨機變數,可以是可觀測量、隱含變數、未知參量或假設等;結點之間的郵箱邊表示條件依存關係,箭頭指向的結點依存於箭頭髮出的結點(父節點),每個結點都與一個概率函數相關。

KF:卡爾曼濾波,線性系統評估方法,通過給系統狀態方程輸入輸出觀測數據,對系統狀態進行最有評估的演算法。

EKF : 擴展卡爾曼濾波,非線性系統評估方法一,將期望和方差線性化,可應用於時間非線性的動態系統。

UKF:無損卡爾曼濾波,非線性系統評估方法二,結合了無損變換,使非線性系統方程適用於線性假設的KF。

PF:粒子濾波,非線性非高斯系統評估方法,通過尋找一組在狀態空間中傳播的隨機樣本來近似的表示概率密度函數,用樣本均值代替積分運算,進而獲得系統狀態的最小方差估計的過程,這些樣本被形象的稱為「粒子」,故而叫粒子濾波。

PnP:PnP問題解決了已知世界參考系下地圖點以及相機參考系下投影點位置時3D-2D相機位姿估計問題,不需要使用對極約束(存在初始化,純旋轉和尺度問題,且一般需要8對點),可以在較少的匹配點(最少3對點,P3P方法)中獲得較好的運動估計,是最重要的一種姿態估計方法。

ORB特徵:ORB(Oriented FAST and Rotated BRIEF)是一種基於FAST增加了主方向的快速特徵點提取和描述的演算法。

如果有理解錯誤或者更精確更巧妙的解釋,歡迎童鞋們不吝賜教!

持續添加中!


推薦閱讀:

如何快速用平面軟體做出立體效果?
立體畫是什麼原理?
好玩的東西 —— Zebra Imaging 3D 全息照片
深藍色背景下,為什麼黑色、紅色和白色的字放一起看很有立體感?

TAG:同时定位和地图构建SLAM | 立体视觉 | 计算机视觉 |