一個 MXNet 實現的 Mask R-CNN.
MX Mask R-CNN
一個 MXNet 實現的 Mask R-CNN.
項目地址:TuSimple/mx-maskrcnn
論文地址:[1703.06870] Mask R-CNN
Mask-RCNN 的結果在不加任何 trick 的情況下能夠超過各種數據增強加持下的 COCO 2016 分割挑戰的冠軍 FCIS 了,一個特點就是 Mask-RCNN 的檢測和分割是並行出結果的,而不像以前是分割完了之後再做分類,結果是很 amazing 的。Mask-RCNN 大體框架還是 Faster-RCNN 的框架,可以說在基礎特徵網路之後又加入了全連接的分割子網,由原來的兩個任務(分類+回歸)變為了三個任務(分類+回歸+分割)主要改進點在:1. 基礎網路的增強,ResNeXt-101+FPN的組合可以說是現在特徵學習的王牌了2. 分割 loss 的改進,由原來的 FCIS 的 基於單像素softmax的多項式交叉熵變為了基於單像素sigmod二值交叉熵,經 @Oh233同學指正 ,softmax會產生FCIS的 ROI inside map與ROI outside map的競爭。但文章作者確實寫到了類間的競爭, 二值交叉熵會使得每一類的 mask 不相互競爭,而不是和其他類別的 mask 比較 。3. RoIAlign 層的加入,說白了就是對 feature map 的插值,直接的ROIPooling的那種量化操作會使得得到的mask與實際物體位置有一個微小偏移,個人感覺這個沒什麼 insight,就是工程上更好的實現方式文章還指出在物體檢測中,Mask-RCNN 比一般的 state-of-the-art 方法(用Fatser-RCNN+ResNet-101+FPN實現)在 bounding-box 的 AP 上高3.6個點,1.1來自ROIAlign,0.9來自多任務訓練,1.6來自更好的基礎網路(ResNeXt-101)說一點個人愚見,這麼好的效果是由多個階段的優化實現的,大頭的提升還是由數據和基礎網路的提升:多任務訓練帶來的好處其實可以看作是更多的數據帶來的好處;FPN 的特徵金字塔,ResNeXt更強大的特徵表達能力都是基礎網路
作者:cfzd
鏈接:cfzd:如何評價 Kaiming He 最新的 Mask R-CNN?
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
這個項目很多是基於 mx-rcnn 實現的 Faster RCNN 項目地址:
precedenceguo/mx-rcnn
推薦閱讀:
※域名關聯模型:讓惡意軟體自我暴露
※新手學機器學習一個月後,一些第一手乾貨分享
※李宏毅機器學習2016 第十五講 無監督學習 生成模型之 VAE
※從Nesterov的角度看:我們為什麼要研究凸優化?
※想學習「機器學習」,需要學習哪些先導課程?