如何在faster—rcnn上訓練自己的數據集(單類和多類)??

本人剛開始接觸這方面的東西,目前已經完成了在fast—rcnn上單類和多類的trainning和detection。

但是由於運行selective—search實在是太慢啦,希望用更快的方法。

我是根據網上的教程一步一步的完成的,但是網上目前好像只有fast—rcnn的詳細教程。

希望各位前輩們能夠提供出自己寶貴的經驗(數據集的構建也相當重要,如果包含數據集按照什麼樣的格式構建,感激不盡),如果有詳細的faster—rcnn的教程的話,分享出網址也十分感謝 : )


自己搭建了個圖片標記平台,可以通過瀏覽器標定圖片,直接拉框選類提交保存就行了,標定速度很快的,若只標記一類(滑鼠拉框後不需要選擇類別了)每小時可以標定一千張左右的圖片。

當然了,平台必定包含直接導出PASCAL VOC的xml格式數據的功能。


CSDN 博主小鹹魚_的系列博客

將數據集做成VOC2007格式用於Faster-RCNN訓練

Faster-RCNN+ZF用自己的數據集訓練模型

Faster-RCNN+VGG用自己的數據集訓練模型


使用faster rcnn訓練自己的數據(py-faster-rcnn )

深度學習 - 香蕉麥樂迪的博客

主要是照著pascal voc改一下自己數據集的格式。代碼那邊主要改的就是factory.py和pascal.py,另外最好對著原論文一步步追一下訓練過程。換數據集可能會出現點bug,比如你的annotation沒有Pascal voc數據集有的某些屬性,順著走下來有bug修改就行了。自己排查不出來的可以參看rbg git上的issue:Issues · rbgirshick/py-faster-rcnn · GitHub 。

另外rbg給的訓練代碼實在是太繞了,捋一遍後可以自己寫一個。


如果你已經把數據轉換到了voc 那麼你可以試試我這個 https://github.com/Microos/py-faster-rcnn-data-interface-generator


其實你自己用PASCAL VOC數據集,一步步追蹤訓練過程,就知道了。我就是這麼做的


推薦閱讀:

caffe為什麼要使用lmdb資料庫?
怎麼使用caffe實現人臉的識別?
caffe官方將會支持TX1的fp16的特性嗎?
caffe下用FCN做圖像分割,如何製作訓練集?
怎樣在windows下輸出訓練caffemodel的log日誌並畫出accuracy和loss曲線?

TAG:深度學習DeepLearning | Caffe深度學習框架 |