深度學習之目標檢測系列(1) - kitti目標檢測2D數據集

kitti數據集介紹

KITTI數據集由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯合創辦,是目前國際上最大的自動駕駛場景下的計算機視覺演算法評測數據集。該數據集用於評測立體圖像(stereo),光流(optical flow),視覺測距(visual odometry),3D物體檢測(object detection)和3D跟蹤(tracking)等計算機視覺技術在車載環境下的性能。KITTI包含市區、鄉村和高速公路等場景採集的真實圖像數據,每張圖像中最多達15輛車和30個行人,還有各種程度的遮擋與截斷。整個數據集由389對立體圖像和光流圖,39.2 km視覺測距序列以及超過200k 3D標註物體的圖像組成,以10Hz的頻率採樣及同步。

kitti數據採集平台介紹

KITTI數據採集平台包括2個灰度攝像機(Grayscale cameras),2個彩色攝像機(Color cameras),一個Velodyne 3D激光雷達(Laserscanner),4個光學鏡頭(Varifocal lenses),以及1個GPS導航系統(Inertial Navigation System), 詳細參數如下:

  • 1 Inertial Navigation System (GPS/IMU): OXTS RT 3003
  • 1 Laserscanner: Velodyne HDL-64E
  • 2 Grayscale cameras, 1.4 Megapixels: Point Grey Flea 2 (FL2-14S3M-C)
  • 2 Color cameras, 1.4 Megapixels: Point Grey Flea 2 (FL2-14S3C-C)
  • 4 Varifocal lenses, 4-8 mm: Edmund Optics NT59-917

kitti目標檢測(object detection)2D數據集

我們這裡只下載左側彩色攝像頭採集的數據以及數據標註文件,如下圖:

數據集下載完成預覽如下:

標註文件下載完成預覽如下:

可以看出每個圖像文件對應一個標註文件。

kitti目標檢測(object detection)2D數據集標註描述文件,如下圖:

下載壓縮解壓後的readme.txt文件中描述如下:

對應標註文件示例如下:

再查看該張數據對應原圖片如下:

標註解釋(value表示字元個數),按照標註文件分割如下:

  • type(類型),有Car, Van, Truck, Pedestrian, Person_sitting, Cyclist, Tram, Misc or DontCare這幾種類型,其中DontCare表示可以忽略,這張圖片類型是Pedestrian(行人)。
  • truncated(是否截斷),0-1之間的值,這張圖片為0.00沒有截斷。(備註:截斷就是目標對象在採集圖像的邊緣被截斷了,是不完整的。)
  • occluded(被遮擋程度),0表示沒有遮擋,1表示部分遮擋,2表示大面積遮擋,3表示不清楚,這張圖為0,表示沒有遮擋。
  • alpha(攝像機的偏轉視角)。
  • bbox(目標在圖像中的位置坐標),4個數字分別為左、上、右、下,這張圖片為712.40(左)、143.00(上)、810.73(右)、307.92(下)。
  • dimensions+location/rotation_y(圖像的三維坐標),這裡位數是2種情況,可能為6位或者4位,這裡不做分析。
  • score(分數),表示對p/r曲線需要檢測,越高越好。越高表明越可能是個物體。

參考鏈接

kitti目標檢測2D數據集:

The KITTI Vision Benchmark Suite?

www.cvlibs.net

數據集下載

數據集下載地址:

https://s3.eu-central-1.amazonaws.com/avg-kitti/data_object_image_2.zip?

s3.eu-central-1.amazonaws.com

標註文件下載地址:

https://s3.eu-central-1.amazonaws.com/avg-kitti/data_object_label_2.zip?

s3.eu-central-1.amazonaws.com

標註描述文件下載地址:

https://s3.eu-central-1.amazonaws.com/avg-kitti/devkit_object.zip?

s3.eu-central-1.amazonaws.com

歡迎小夥伴掃描進微信群一起打怪升級,學習交流,不方便翻牆下載的小夥伴也可以進群索要數據集。


推薦閱讀:

TAG:深度學習(DeepLearning) | 圖像處理 | 目標檢測 |