detnet詳細解讀(網路主幹分類任務部分)
來自專欄 視覺技術論文筆記
總體來說演算法工程價值的貢獻更多。因為主要來分析detnet-59的結構,切入正題之前先簡單說一下resnet-50的結構,他們之間基本上網路的複雜程度是一樣的。
一、resnet簡要介紹。
res-50和殘差單元如下圖所示:
從結構圖中,我們可以看到res-50中stage2至stage5分別經過3,4,6,3次殘差單元,並且殘差單元中前兩次卷積的信道是第三次卷積信道的四分之一。這裡detnet的作者已經寫的很清楚了,stride為2是stage1,以此類推。
二、detnet改進的結構
先來一張論文裡面的對於殘差單元改進的圖:
圖A為改進的帶有空洞卷積殘差單元。圖B在A的基礎上在殘差單元的支路加了一層卷積,目前沒有代碼,推測這一層卷積之後還會有relu和bn的操作。圖C是原始殘差單元結構。detnet在stage4之前是和resnet結構一樣的,在stage4之後會用圖D的結構,首先生成stage5需要經過3個殘差單元,圖D中的意思是把原來的3個殘差單元用一次B和兩次A的結構做替換以此來輸出stage5,然後用相同的結構(添加三個改進的殘差單元,9次卷積)來生成stage6,此時這個stage6輸出的特徵圖的尺寸為14×14×256來鏈接FC層做預測。由於從stage6是detnet自己添加3個改進的殘差單元生成的,所以網路叫做detnet-59。
這裡我想較真一下,明明圖B中支路多經過了一次卷積,所以整體結構應該經過了4次卷積,圖B總共出現過兩次,所以嚴謹一點,我感覺這個網路應該叫detnet-61呀,如果有不對的地方,歡迎指正,特別是曠世的大佬們。
三、detnet總體結構
弄明白改進的殘差單元和自己添加的網路結構之後,總體設計如下圖所示:
四、實驗結果
論文給出了在imagenet上的分類結果:
雖然detnet對於檢測部分的區域候選網路意義更大,但是這裡對於分類來說,增大網路複雜度,來提升的準確率還是具有一定性價比的。
推薦閱讀:
※入門教程 | 使用 Colab,玩轉谷歌深度學習全家桶!
※大數據與機器學習(1)
※【用Sklearn進行機器學習】第一篇 - 介紹Scikit-Learn
※鋼鐵直男的救世主來了!讓AI告訴你妹子到底是啥意思
※機器學習面試題,更有大廠內推機會
TAG:深度學習DeepLearning | 圖像識別 | 機器學習 |