語義分割:Large Kernel Matters
09-10
語義分割:Large Kernel Matters
論文地址:[1703.02719] Large Kernel Matters -- Improve Semantic Segmentation by Global Convolutional Network
參考鏈接:Large Kernel Matters 論文筆記 @加油可好
讀後感:
分割任務含有分類和定位兩個有挑戰的任務,一個好的語義分割模型應該能夠同時處理好這兩個任務。
對於分類任務:模型必須是具有不變性的,以適應目標的各種形式,如平移和倒轉。
對於定位任務:模型應該是對變換敏感的,即能夠精確定位語義類別的每個像素。
本文的設計原則:
- 從定位的角度看,模型結構應該是完全卷積的,以保持定位性能,不應該使用全連接或全局池化層,因為這些層會丟棄位置信息
- 從分類的角度看,網路結構應該採用較大的核大小,使特徵映射和逐像素分類器之間能夠緊密地連接起來,以增強應對變換的能力。
本文設計的結構:
從定位的角度來看,這種結構必須是全卷積的,因為許多分類網路所使用的全連接層或全局池化層會丟棄位置信息。
從分類的角度出發,在分類模型緊密連接結構的啟發下,卷積核大小應儘可能大。特別的,如果kernel大小增加到特徵映射的空間大小(全局卷積),則該網路將變的與純分類模型相同。因此提出了一種新的方法---全局卷積網路(GCN),圖2.B所示。
此外,提出一個邊界細化模塊(BR),圖2.C所示。
個人感覺:
large Kernel 應該可以解決大目標內的類內不一致的問題。具體效果有待測試。
詳情可見參考鏈接翻譯的版本或直接看論文。
推薦閱讀:
※run-length 編碼和解碼
※Deep Learning for Brain MRI Segmentation: State of the Art and Future Directions 論文筆記
※3d segmentation
※CVPR2018語義分割相關論文摘要翻譯及框架
※ICCV2017語義分割相關論文摘要及框架
TAG:圖像分割 |