detnet詳細解讀(網路主幹分類任務部分)

detnet詳細解讀(網路主幹分類任務部分)

來自專欄 視覺技術論文筆記

總體來說演算法工程價值的貢獻更多。因為主要來分析detnet-59的結構,切入正題之前先簡單說一下resnet-50的結構,他們之間基本上網路的複雜程度是一樣的。

一、resnet簡要介紹。

res-50和殘差單元如下圖所示:

resnet總體結構

殘差單元

從結構圖中,我們可以看到res-50中stage2至stage5分別經過3,4,6,3次殘差單元,並且殘差單元中前兩次卷積的信道是第三次卷積信道的四分之一。這裡detnet的作者已經寫的很清楚了,stride為2是stage1,以此類推。

二、detnet改進的結構

先來一張論文裡面的對於殘差單元改進的圖:

detnet改進的殘差單元結構以及深層網路主幹的設計

圖A為改進的帶有空洞卷積殘差單元。圖B在A的基礎上在殘差單元的支路加了一層卷積,目前沒有代碼,推測這一層卷積之後還會有relu和bn的操作。圖C是原始殘差單元結構。detnet在stage4之前是和resnet結構一樣的,在stage4之後會用圖D的結構,首先生成stage5需要經過3個殘差單元,圖D中的意思是把原來的3個殘差單元用一次B和兩次A的結構做替換以此來輸出stage5,然後用相同的結構(添加三個改進的殘差單元,9次卷積)來生成stage6,此時這個stage6輸出的特徵圖的尺寸為14×14×256來鏈接FC層做預測。由於從stage6是detnet自己添加3個改進的殘差單元生成的,所以網路叫做detnet-59。

這裡我想較真一下,明明圖B中支路多經過了一次卷積,所以整體結構應該經過了4次卷積,圖B總共出現過兩次,所以嚴謹一點,我感覺這個網路應該叫detnet-61呀,如果有不對的地方,歡迎指正,特別是曠世的大佬們。

三、detnet總體結構

弄明白改進的殘差單元和自己添加的網路結構之後,總體設計如下圖所示:

detnet網路總體結構

四、實驗結果

論文給出了在imagenet上的分類結果:

imagenet分類結果

雖然detnet對於檢測部分的區域候選網路意義更大,但是這裡對於分類來說,增大網路複雜度,來提升的準確率還是具有一定性價比的。


推薦閱讀:

入門教程 | 使用 Colab,玩轉谷歌深度學習全家桶!
大數據與機器學習(1)
【用Sklearn進行機器學習】第一篇 - 介紹Scikit-Learn
鋼鐵直男的救世主來了!讓AI告訴你妹子到底是啥意思
機器學習面試題,更有大廠內推機會

TAG:深度學習DeepLearning | 圖像識別 | 機器學習 |