語義分割：Large Kernel Matters

09-10

論文地址：[1703.02719] Large Kernel Matters -- Improve Semantic Segmentation by Global Convolutional Network

參考鏈接：Large Kernel Matters 論文筆記 @加油可好

讀後感：

分割任務含有分類和定位兩個有挑戰的任務，一個好的語義分割模型應該能夠同時處理好這兩個任務。

對於分類任務：模型必須是具有不變性的，以適應目標的各種形式，如平移和倒轉。

對於定位任務：模型應該是對變換敏感的，即能夠精確定位語義類別的每個像素。

本文的設計原則：

本文設計的結構：

從定位的角度來看，這種結構必須是全卷積的，因為許多分類網路所使用的全連接層或全局池化層會丟棄位置信息。

從分類的角度出發，在分類模型緊密連接結構的啟發下，卷積核大小應儘可能大。特別的，如果kernel大小增加到特徵映射的空間大小(全局卷積)，則該網路將變的與純分類模型相同。

因此提出了一種新的方法---全局卷積網路（GCN),圖2.B所示。

此外，提出一個邊界細化模塊（BR),圖2.C所示。

個人感覺：

large Kernel 應該可以解決大目標內的類內不一致的問題。具體效果有待測試。

詳情可見參考鏈接翻譯的版本或直接看論文。