使用深度學習演算法實現圖像目標跟蹤,該怎麼做?機器學習剛入門,完全沒頭緒。?


對於剛入門的同學,建議先把非deep learning的傳統方法怎麼做跟蹤稍微學習一下。

dl只是一種優化方法。但是如果連要優化什麼都不知道的話,顯然是不應該閉著眼睛擼deep models的。畢竟地球變暖人人有責


我也認為應該先把傳統的方法搞清楚,再去看一系列用深度學習來做的演算法,不然估計理解困難


目標跟蹤與深度學習沒有什麼必然的聯繫。

深度學習是通過神經網路學習出圖像合理的特徵,也就是把圖片轉成合理的字元串,深度學習主要是用來解決分類的。

目標跟蹤是在分類識別或選定一個物體以後,持續跟蹤其運動狀態。建議你可以看看TLD,這是非常經典的跟蹤演算法。時間上來說,識別在前,跟蹤在後。但對於跟蹤來說,對物體進行分類識別並不是必須的。


你可以邀請@Naiyan Wang 大神來回答,絕對專業!


把深度學習基礎理論、CNN、FCN,各種常用的網路框架,以及kcf學一下,然後讀一下iccv2015裡面用深度學習做跟蹤的文章(hcf,fcnt等),以及mdnet。還有CVPR2016的SINT。


multi object tracking benchmark裡面有一些開源的代碼,有基於深度學習做的!深度學慣用來做tracking,利用的主要是深度學習可以提取更加具有表徵能力的特徵向量!如果樓主短期內想做一個小的demo的話,先裝一個RGB大神的fast R CNN庫,找一個data association方法,把相鄰幀的檢測結果連起來!順序播放每一幀!以上體提的思路算是目前做tracking的一個方向!邏輯混亂還請見諒!


發表一下拙見。
我認為目標跟蹤可以看成連續的物體識別問題。就是識別特定的物體,這一方面跟人臉識別什麼應該類似。
另外,跟蹤物體可能會涉及到多角度問題,一會可能是後面,一會可能是側面,對於這,可對於一些不同角度建立訓練空間,用集成方法解決。
比如周志華老師有篇論文,多角度識別人臉,就是用多個神經網路分別識別不同角度的人臉,在用一個神經網路對他們進行集成。
不對的地方請大家指教。


DS KCF


你現在有思路了么?


深度學習的坑已經這麼爛了么。。。剛入門就來


推薦閱讀:

如何看待用機器學習已經可以根據化學分子的特點預測它的氣味?
占星,算命等可否理解為一種神經網路演算法?
有大神講講深度學習在語音分離的應用嗎?

TAG:深度學習DeepLearning |