標籤:

語義分割:Large Kernel Matters

語義分割:Large Kernel Matters

論文地址:[1703.02719] Large Kernel Matters -- Improve Semantic Segmentation by Global Convolutional Network

參考鏈接:Large Kernel Matters 論文筆記 @加油可好

讀後感:

分割任務含有分類和定位兩個有挑戰的任務,一個好的語義分割模型應該能夠同時處理好這兩個任務。

對於分類任務:模型必須是具有不變性的,以適應目標的各種形式,如平移和倒轉。

對於定位任務:模型應該是對變換敏感的,即能夠精確定位語義類別的每個像素。

本文的設計原則:

  • 從定位的角度看,模型結構應該是完全卷積的,以保持定位性能,不應該使用全連接或全局池化層,因為這些層會丟棄位置信息
  • 從分類的角度看,網路結構應該採用較大的核大小,使特徵映射和逐像素分類器之間能夠緊密地連接起來,以增強應對變換的能力。

本文設計的結構:

從定位的角度來看,這種結構必須是全卷積的,因為許多分類網路所使用的全連接層或全局池化層會丟棄位置信息。

從分類的角度出發,在分類模型緊密連接結構的啟發下,卷積核大小應儘可能大。特別的,如果kernel大小增加到特徵映射的空間大小(全局卷積),則該網路將變的與純分類模型相同。

因此提出了一種新的方法---全局卷積網路(GCN),圖2.B所示。

此外,提出一個邊界細化模塊(BR),圖2.C所示。

個人感覺:

large Kernel 應該可以解決大目標內的類內不一致的問題。具體效果有待測試。

詳情可見參考鏈接翻譯的版本或直接看論文。

推薦閱讀:

run-length 編碼和解碼
Deep Learning for Brain MRI Segmentation: State of the Art and Future Directions 論文筆記
3d segmentation
CVPR2018語義分割相關論文摘要翻譯及框架
ICCV2017語義分割相關論文摘要及框架

TAG:圖像分割 |