CVPR—II | 經典網路再現,全內容跟蹤

今天接著上一篇的內容繼續,內容簡單明了,希望可以給您帶來一些幫助,消除炎熱夏天帶來的一絲絲燥熱,謝謝!

註:推薦精彩文章

深度學習的昨天、今天和明天

人臉檢測與識別的趨勢和分析

人臉檢測與識別技術(怎麼去創新?)

今天首先給大家帶來「YOLO」!也被上一篇「Faith」讀者說對了,在此也感謝大家的關注與閱讀,O(∩_∩)O謝謝

YOLO

看到這個封面,相信很多很多都閱讀過,其實這是一篇「基於回歸方法的深度學習目標檢測演算法」的經典之作,如果興趣的您,可以再一次閱讀。

會不會有朋友認為YOLO的縮寫是You Only Live Once???O(∩_∩)O,其實是You Only Look Once

相比於之前介紹的幾個網路,明顯高於之前說的幾個簡單目標檢測網路。下面來一個YOLO V2的宣傳片!有興趣的您,可以自己去做一個模型玩一玩,其實過程很不錯!(「計算機視覺戰隊」微信平台的人臉檢測與識別技術(怎麼去創新?)也有簡單的Demo。)

基於深度學習人臉檢測與識別_騰訊視頻 https://v.qq.com/x/cover/c0382mi94u7/c0382mi94u7.html

回歸正題,開始說內部的內容!

我自己來總結下YOLO:

YOLO網路的結構和在之前得模型比較類似,主要是最後兩層的結構,卷積層之後接了一個4096維的全連接層,然後後邊又全連接到7*7*30維的張量上。實際上這個7*7就是劃分的網格數,現在要在每個網格上預測目標兩個可能的位置及這個位置的目標置信度和類別,也就是每個網路預測兩個目標,每個目標的信息有4維坐標信息(中心點坐標+長寬),1個目標的置信度,還有類別數20(因為在VOC數據集上,所以是20),總共就是(4+1)*2+20=30維的張量。這樣就可以利用前面4096維的全連接映射特徵直接在每個網格上回歸處目標檢測需要的信息(BBClass)。

Result

其實整個過程也是比價間的明了,不斷去選擇BB 的對角點,改變BB的尺寸大小。

最近也在整理資料,後期將分享在平台共享專欄!


推薦閱讀:

簡單自編碼器實現zero-shot learning (CVPR 2017)--論文筆記
多風格生成網路——實時風格轉換
首發——Large Margin Object Tracking with Circulant Feature Maps

TAG:深度学习DeepLearning | CVPR | 目标检测 |