初見相關濾波與OTB

人生若只如見,一切都從2013年開始說起,那一年的冬天和往常一樣冷。。如果你問別人近幾年有什麼比較niubility的跟蹤演算法,大部分人都會扔給你吳毅老師的論文,OTB50OTB100(OTB50這裡指OTB-2013,OTB100這裡指OTB-2015,50個和100個序列方便記憶,感謝指正):

  • Wu Y, Lim J, Yang M H. Online object tracking: A benchmark [C]// CVPR, 2013.

  • Wu Y, Lim J, Yang M H. Object tracking benchmark [J]. TPAMI, 2015.

頂會轉頂刊的頂級待遇,在加上引用量1200+200多,影響力不言而喻,已經是做tracking必須跑的資料庫了,測試代碼和序列都可以下載: Visual Tracker Benchmark,OTB50包括50個序列:

論文在資料庫上對比了包括2012年及之前的29個頂尖的tracker,有大家比較熟悉的OAB, IVT, MIL, CT, TLD, Struck等,都是頂會轉頂刊的神作,由於之前沒有比較公認的資料庫,論文都是自賣自誇,大家也不知道到底哪個好用,所以這個database的意義非常重大,直接促進了跟蹤演算法的發展,後來又擴展為OTB100,有100個序列,我們這裡參考OTB100的結果(標出了一些性能速度都比較著名的演算法):

接下來再看看這29個頂尖TRACKER在OTB100上的實驗結果:

上結論:平均來看Struck, SCM, ASLA等演算法的性能比較高,排在前三,著重強調CSK,第一次向世人展示了相關濾波的潛力,排第四362FPS簡直逆天了。請注意另一篇速度很快的經典演算法CT(64fps,CSK的1/5),排名倒數第四(CSK正數第四)(還有很多基於係數編碼的方法,這段時間是壓縮感知大熱的時候,這裡能看到很多稀疏相關演算法,滿滿都是歷史的痕迹)。如果對更早期的演算法感興趣,推薦另一篇經典的survey(反正我是沒興趣也沒看過):

  • Yilmaz A, Javed O, Shah M. Object tracking: A survey [J]. CSUR, 2006.

自從2012年AlexNet問世以後,CV各個領域都有了很多變化,所以我猜你肯定還想知道2013到2017年發生了什麼,抱歉我也不知道,不過我們可以肯定的是,2013年以後的論文確定以及必定都會引用OTB50這篇論文,藉助谷歌學術中的被引用次數功能,得到如下結果:

這裡僅列舉幾個排名靠前的,依次是Stuck轉PAMI, 三大相關濾波方法KCF, CN, DSST, 和VOT競賽,這裡僅作示範,有興趣可以去試試。(這麼做的理論依據是:一篇論文,在它之前的工作可以看它的引用文獻,之後的工作可以看誰引用了它;雖然引用量並不能說明什麼,但好的方法大家基本都會引用的;之後還可以通過限定時間來查看某段時間的相關論文,如2016-2017就能找到最新的論文了,至於論文質量需要仔細甄別;其他方向的重要論文也可以這麼用,順藤摸瓜,然後你就知道大牛是哪幾位,接著關注跟蹤一下他們的工作(以上小技巧,如果你不知道,不謝!)這樣我們就大致就知道目標跟蹤領域的最大發展應該就是相關濾波無疑了,再往後還能看到相關濾波類演算法有SAMF, LCT, HCF, SRDCF等等。引用量也與時間有關,建議分每年來看,這裡就不貼圖了(相關濾波類新論文也可以通過引用KCF的論文去找)。此外,最新版本OPENCV3.2除了TLD,也包括了幾個很新的跟蹤演算法 OpenCV: Tracking API:

TrackerKCF介面實現了KCF和CN,影響力可見一斑,這一點就可以說明很多問題了,還有個GOTURN是基於深度學習的方法,雖然在GPU上跑100FPS,在VOT2014上接近DSST,在OTB上遠不如KCF,與同樣發表在ECCV2016的SiamFC差太多了,而後者在GPU上也可以跑83FPS,GOTURN雖然是高速深度學習方法的開山之作,但性能一般,OPENCV加入這個方法竊以為太激進了。

以上就是2012年以前目標跟蹤演算法的大致情況,之後就是相關濾波和深度學習崛起了!
推薦閱讀:

3D目標識別與定位技術的最新進展?有哪些技術瓶頸?
什麼是One/zero-shot learning?
從人臉識別 到 行人重識別,下一個風口
GAN能合成2k高清圖了!還能手動改細節 | 論文+代碼,英偉達出品
《面經篇》一個深度腦殘的實習面試經歷

TAG:图像处理 | 计算机视觉 | 机器学习 |