標籤:

目標跟蹤演算法SRDCF論文筆記

==

該文作者為林雪平大學的Martin大神,發表於ICCV15,即對濾波器進行時域上正則處理的相關濾波方法,對濾波器進行顯式的正則也是該文的主要貢獻,可以有效的抑制背景區域的響應,從而可以擴大搜索區域,在大範圍運動,複雜背景等場景下獲得更佳的性能,該文也是後來CCOT和ECO的基礎,因此要想理解後面這些論文首先要弄懂SRDCF的原理(SRDCF的基礎是MOSSE和KCF這是相關濾波的兩篇最基礎的文章,網上有很多介紹,這裡就不贅述了)。

首先看文中的基礎公式

(4),這裡f為濾波器模板(m×n×d),角標l即為第l個通道,w為對濾波器加的正則係數矩陣(m×n),形狀如圖,這樣做的目的是很顯然的,在目標處正則係數較低,在背景處正則係數較高,這是希望使得到的濾波器能夠更多的關注目標信息,在背景處的濾波響應結果盡量低,這就是正則的作用,需要注意的能夠設計處這樣的正則形狀是有條件的,即必須使用線性操作,即f和樣本x是直接對應點相乘再求和的,即線性相關操作(文中和所有相關濾波方法一樣使用了循環樣本,這樣就能通過卷積操作快速算出所有循環樣本的響應,其本質仍然是相關操作)。

由於是線性相關操作,所以在時域空間上能夠直觀的構造出這樣的正則係數矩陣,如果使用的是非線性求響應的方法,即在對偶空間上使用非線性核,即,樣本也使用?函數映射到高維空間,如此一來我們無法得到w的具體形狀了,因為f和x不是相關操作了,除非我們能夠知道樣本映射後的空間形狀,而這一點一般是不可能的因為我們在對偶空間求解是使用的核技巧,並不需要映射函數的具體形式只需要知道兩個映射函數的內積形式即可。所以由此得到SRDCF的第一個缺點,即無法使用非線性核,從對偶空間的求解角度也能看出,只有線性核的才能求解帶有濾波器正則化操作的目標函數,即,如果我們不知道這個映射函數的具體形式那麼我們則無法求解。

理解了這個目標函數下面我們就需要對這個函數進行求解了,這個求解過程也是SRDCF最難的地方,這也是Martin厲害的地方。首先使用帕斯瓦爾定理將目標函數變換到頻域,需要注意帕斯瓦爾定理在點乘變換到卷積的時候需要除以一個係數,反之則不用。

然後將參數向量化,這是為了簡化求解過程:

其中粗體表示一維向量,D為對角化操作,C為循環化操作,幾個參數的維度分別為D(x^)(mn×mn),f^l(mn×1),yk^(mn×1),C(w^)(mn×mn),f^l(mn×1),k代表第k個樣本。通過循環操作可以去掉卷積的符號,因為卷積的本質是移位相乘相加。

由於f,x,y都是實數構成的所以它們的傅里葉變換是共軛對稱的,這裡作者考慮利用這個性質對求解過程進行加速,因為傅里葉變換後包括實部和虛部兩個數,如果我們能夠將兩個數合併為一個實數,又保持兩個矩陣相乘的結果不變的話,那麼我們求解的速度至少快一倍,這裡作者利用了共軛對稱性。

這裡以f為例,將屬於零頻,正頻,負頻域部分的點分別操作,將包含實部和虛部的矩陣轉換為了純實數矩陣,這樣設計可以保證乘積的結果不變,從而保證不改變求解結果。而這樣操作對於相同大小的矩陣來說可以通過左乘同一個變化矩陣B實現,這個矩陣必定是稀疏的而且是酉矩陣,因為每一行最多只對原數據的兩個點進行操作,其它都是零。通過一些變化操作之後為如下形式:

然後再通過向量化和塊對角化操作將對通道的求和符號去掉得到更加簡潔的形式如下:

這裡的D和W都變成了(dmn×dmn)的大小,對這樣一個凸函數對f求導得到f的極值即目標,其中,

『為了避免對A求逆,這裡使用了高斯塞爾德迭代的方法求解,利用了正則矩陣在頻域的稀疏性,和實數化矩陣B的稀疏性使得求解能在較少的迭代次數內到達一個收斂值。注意這裡使用了t個樣本,即整個跟蹤框架是利用了歷史樣本的,這樣能夠保證一定的記憶性,A和b的更新方法和論文CN2中如出一轍,可以減少更新時的計算量。論文重要的部分已經介紹完了,尺度檢測使用了SAMF金字塔方法,對樣本降採樣來加速計算,將最後得到的響應進行插值得到原尺度,然後利用牛頓迭代法找到響應最大的點。最後附上響應結果示例圖,明顯可以看到加了正則係數矩陣後得到的響應在背景處的值得到了明顯的抑制,從而可以擴大搜索域進行大範圍的跟蹤。


推薦閱讀:

【附真實審稿意見】SCI論文圖形製作live補充
幾個「除了」的辨析 / 老調重談
劇透:如何有效投稿和回複審稿意見
什麼是學術論文?

TAG:學術論文 |