邊界效應與VOT2015
01-29
光陰荏苒歲月如流時間到了2015年,VOT2015競賽 VOT2015 Challenge | Home 如期而至,這一年有60個精挑細選的序列,62個tracker,最大看點是深度學習開始進擊tracking,MDNet直接拿下當年的冠軍,而結合深度特徵的相關濾波方法DeepSRDCF是第二名,主要解決邊界效應的SRDCF僅HOG特徵排在第四:
推薦閱讀:
接下來主要介紹相關濾波的邊界效應及解決方案,僅適合需要改進相關濾波類演算法或者需要對相關濾波演算法有更高要求的同學看,寫出來是為了全面,而且後續改進都是以犧牲幀率為代價的,效果雖好但很多演算法都無法實時了(任何演算法(人)都有優缺點,適合(你)的才是最好的)。
總體來說,相關濾波類方法對快速變形和快速運動情況的跟蹤效果不好。快速變形主要因為CF是模板類方法。容易跟丟這個比較好理解,前面分析了相關濾波是模板類方法,如果目標快速變形,那基於HOG的梯度模板肯定就跟不上了,如果快速變色,那基於CN的顏色模板肯定也就跟不上了。這個還和模型更新策略與更新速度有關,固定學習率的線性加權更新,如果學習率太大,部分或短暫遮擋和任何檢測不準確,模型就會學習到背景信息,積累到一定程度模型跟著背景私奔了,一去不復返。如果學習率太小,目標已經變形了而模板還是那個模板,就會變得不認識目標。(舉個例子,多年不見的同學,你很可能就認不出了,而經常見面的同學,即使變化很大你也認識,因為常見的同學在你大腦裡面的模型在持續更新,而多年不見就是很久不更新)快速運動主要是邊界效應(Boundary Effets),而且邊界效應產生的錯誤樣本會造成分類器判別力不夠強,下面分訓練階段和檢測階段分別討論。訓練階段,合成樣本降低了判別能力。如果不加餘弦窗,那麼移位樣本是長這樣的:
- 如果目標在中心附近,檢測準確且成功。
- 如果目標移動到了邊界附近但還沒有出邊界,加了餘弦窗以後,部分目標像素會被過濾掉,這時候就沒法保證這裡的響應是全局最大的,而且,這時候的檢測樣本和訓練過程中的那些不合理樣本很像,所以很可能會失敗。
- 如果目標的一部分已經移出了這個區域,而我們還要加餘弦窗,很可能就過濾掉了僅存的目標像素,檢測失敗。
- 如果整個目標已經位移出了這個區域,那肯定就檢測失敗了。
以上就是邊界效應(Boundary Effets),接下來簡單介紹解決邊界效應的方法,再次強調這些方法速度比較慢,相關濾波傲視群雄的高速已經不見了,但換來了可以匹敵深度學習方法的性能。
首先是VOT2015中最亮眼的相關濾波方法,Martin Danelljan大牛的SRDCF Learning Spatially Regularized Correlation Filters for Visual Tracking,主要思路:既然邊界效應發生在邊界附近,那就忽略所有移位樣本的邊界部分像素,或者說讓邊界附近濾波器係數為接近零:- Danelljan M, Hager G, Shahbaz Khan F, et al. Learning spatially regularized correlation filters for visual tracking [C]// ICCV. 2015.
SRDCF基於DCF,類SAMF多尺度,採用更大的檢測區域(padding = 4),同時加入空域正則化,懲罰邊界區域的濾波器係數,優化目標如下:
- Kiani Galoogahi H, Sim T, Lucey S. Correlation filters with limited boundaries [C]// CVPR, 2015.
- Kiani Galoogahi H,, Fagg A, Lucey S. Learning Background-Aware Correlation Filters for Visual Tracking [C]// arXiv preprint arXiv:1703.04590, 2017.
首先採用更大的檢測和訓練圖像塊,然後給循環移位樣本左乘一個0和1組成的掩膜矩陣P,以使真實訓練樣本的比例增加,優化目標如下:
推薦閱讀:
※網路結構中節點嵌入向量表達(network embedding)方法介紹
※《Image-to-Image Translation with Conditional Adversarial Networks》閱讀筆記
※CAMA-LAB 機器學習暑期研討班(2017)