一個加速trick一種相關濾波解釋

01-29

先上圖，benchmark更新了，借用一下圖片，版權歸王強所有，來自這裡 foolwood/benchmark_results：

目標跟蹤階段性總結

截止CVPR 2017，tracking的目前發展如上圖，Tracking方向還是以相關濾波CF和深度學習DL兩大陣營為主：

右半邊是相關濾波CORR. FILTER，根據特徵分兩小類：結合hand-craft特徵如HOG(Histogram of Oriented Gradient), CN(Color Names)或Color Histogram的相關濾波，速度可以做到很快，同時精度也很好，ECO-HC和Staple；結合CONV. FEAT.卷積特徵的相關濾波可以做到最好精度，而且預訓練CNN模型的卷積特徵非常強力，而且泛化能力非常優秀，但速度差一些，如ECO目前位於tracking領域的頂端。總結：相關濾波性能的提升離不開深度學習。
左邊是深度學習Deap Learning，採用CNN+end2end traning，也可以分兩小類：以精度為主從CNN-SVM到MDNet，及擴展TCNN, ADNet, SANet，在測試集上可以比肩頂尖相關濾波演算法，但由於訓練集的限制，泛化能力可能尚有疑問（具體情況請等待VOT 2017的結果，去年的冠軍TCNN沒中任何會議~~）；速度為主的SiamFC，及擴展DCFNet, CFNet和HART，在GPU上能達到遠超實時的速度，尤其DCFNet和CFNet引入CF layer，相關濾波在CNN框架中實現end2end訓練，讓卷積特徵提取可以配合相關濾波檢測，實現聯動，讓CNN框架也可以實現密集檢測，精度和速度都能達到較高水平。總結：深度學習框架中可以加入相關濾波層端到端訓練。

綜上，CF和DL已經不是對立關係了，互相融合互相促進是發展方向，或許已不存在兩大陣營。

目前tracking領域亟待解決的難題，僅供參考：

以HOG特徵為代表的相關濾波可以做到很快的速度，但HOG特徵的旋轉不變性很差，也就是說這類演算法對平面類旋轉基本無解。MD大神最新論文DCCO證明深層卷積特徵具有較好的旋轉不變性，但引入卷積特徵會損失速度優勢。如何保證速度的同時解決平面旋轉問題？
不管是卷積特徵和端到端訓練的CNN框架，速度都是硬傷，forward passing time是設計網路的關鍵，搭建小網路代替常用的VGG-16以期實現CPU上實時，CNN模型的壓縮加速是目前研究的熱點之一；但CNN需要海量訓練數據，目前缺乏這樣的資料庫，做到訓練集和測試集嚴格獨立，才能保證演算法的泛化能力。如果引入深度學習後解決CPU上無法實時的問題？

ICCV 2017的相關論文過段時間再來分析，等VOT2017的結果出來吧，到時候論文代碼也應該就開源了，也留給我時間慢慢讀論文。。

最近專欄更新比較慢，一半是VOT結果還是沒出，另一半是我在學習其他方向，要與時俱進還是很不容易的。如果有必要，我也會和大家分享一些其他方向的乾貨論文，感謝支持。

***********************************分割線********************************

速度優化trick

很多人問我速度怎麼優化，真的沒有什麼秘密。這裡介紹一個在C-COT和ECO中大量使用的加速方法，保守估計該trick的加速比在20%以上，而且是完全沒有任何性能損失的trick，但在這兩篇論文中完全沒有提到，下面這段話來自C-COT的Supplementary Material：

Since the Fourier coefficients of a real function obey the Hermitian symmetry, we only need to process half the Fourier coefficients 0 ≤ k ≤ K. This effectively halves the computations and memory consumption of the training procedure.

相關濾波速度的來源之一就是濾波操作在傅里葉域進行，這一加速trick簡單來說就是利用實數傅里葉譜的共軛對稱性減少一半的計算量和內存消耗。

從基礎開始介紹。首先來分析圖像的傅里葉係數：

clearnclose allnnfys = imread(fys.bmp);nimg = rgb2gray(fys);nfigure(1),nsubplot(1,2,1),imshow(fys,[]);nsubplot(1,2,2),imshow(img,[]);nnfc = fft2(double(img));nfigure(2),nsubplot(1,3,1),imshow(log(real(fc)),[]);nsubplot(1,3,2),imshow(log(imag(fc)),[]);nsubplot(1,3,3),imshow(log(real(fc).^2 + imag(fc).^2),[]);nnfcc = fftshift(fc);nfigure(3),nsubplot(1,3,1),imshow(log(real(fcc)),[]);nsubplot(1,3,2),imshow(log(imag(fcc)),[]);nsubplot(1,3,3),imshow(log(real(fcc).^2 + imag(fcc).^2),[]);n

結果如下，首先是讀入圖像並灰度化：

然後計算傅里葉譜並顯示，依次是實部，虛部和幅值，這時候傅里葉譜的中心在左上角點，這時候可能很難看出對稱性：

fftshift移頻操作，將中心移動到圖像中心，這時候對稱性就非常清晰了，注意是共軛對稱性：

所以C-COT和ECO在計算圖像特徵的fft時會多了fftshift移頻操作，傅里葉正變換被封裝成這樣：

function xf = cfft2(x)nn% Find the data typendata_type_complex = complex(zeros(1, like, x));nn% calculate output sizenin_sz = size(x);nn% if both dimensions are oddnif all(mod(in_sz(1:2), 2) == 1)n xf = fftshift(fftshift(fft2(x), 1), 2);nelsen out_sz = in_sz;n out_sz(1:2) = out_sz(1:2) + mod(out_sz(1:2)+1,2);nn % allocaten xf = zeros(out_sz, like, data_type_complex);nn xf(1:in_sz(1),1:in_sz(2),:,:) = fftshift(fftshift(fft2(x), 1), 2);nn if out_sz(1) ~= in_sz(1)n xf(end,:,:,:) = conj(xf(1,end:-1:1,:,:));n endn if out_sz(2) ~= in_sz(2)n xf(:,end,:,:) = conj(xf(end:-1:1,1,:,:));n endnendn

傅里葉逆變化被封裝成這樣：

function x = cifft2(xf)nnif isa(xf, gpuArray)n x = real(ifft2(ifftshift(ifftshift(xf, 1), 2)));nelsen x = ifft2(ifftshift(ifftshift(xf, 1), 2), symmetric);nendn

有了對稱性，接下來在所有頻譜計算都只需要計算頻譜的一半，這部分直接降低計算量50%，特徵的頻譜係數在經過一些列預處理以後，直接壓縮為緊湊傅里葉係數如下代碼：

function xf = compact_fourier_coeff(xf)nn% Creates a compact fourier series representation by removing the strict rightn% half plane.nnif iscell(xf)n xf = cellfun(@(xf) xf(:,1size(xf,2)+1)/2,:), xf, uniformoutput, false);nelsen xf = xf(:,1size(xf,2)+1)/2,:);nendn

最後，計算好濾波器的頻譜係數之後，根據共軛對稱性補全頻譜係數就可以了，頻譜重構如下代碼：

function xf = full_fourier_coeff(xf)nn% Reconstructs the full Fourier series coefficients.nnif iscell(xf)n xf = cellfun(@(xf) cat(2, xf, conj(rot90(xf(:,1:end-1,:), 2))), xf, uniformoutput, false);nelsen xf = cat(2, xf, conj(rot90(xf(:,1:end-1,:), 2)));nendn

就是這麼簡單，這麼NIUBILITY，沒有任何代價的相關濾波加速技巧，並沒有出現的論文中，或許他認為太簡單了，MD大神只在C-COT的Supplementary Material 中section 3 的最後提了一下。

只要是相關濾波演算法，這一trick就是普適的，沒有理由不用，LETS MOVE!

**********************************分割線********************************

一個加速trick一種相關濾波解釋

目標跟蹤階段性總結

速度優化trick

相關濾波的直觀解釋