行人檢測數據集匯總(持續更新)
原文首發於極市平台。
行人檢測( Pedestrian Detection) 是計算機視覺領域內應用比較廣泛和比較熱門的演算法,一般會與行人跟蹤,行人重識別等技術進行結合,來對區域內的行人進行檢測識別跟蹤,廣泛應用於安防,零售等領域。由於行人的外觀易受穿著、尺度、遮擋、姿態和視角等影響,行人檢測也具有一定的挑戰性。本文我們收集了行人檢測常用的一些數據集,方便大家來學習和研究行人檢測演算法。所有數據集均為網上公開數據集,文末附有下載鏈接。
1.MIT-CBCL Pedestrian Database(MIT行人資料庫)
該資料庫為較早公開的行人資料庫,共924張行人圖片(ppm格式,寬高為64x128),肩到腳的距離約80象素。該資料庫只含正面和背面兩個視角,無負樣本,未區分訓練集和測試集。Dalal等採用「HOG+SVM」,在該資料庫上的檢測準確率接近100%。
2.USC Pedestrian Detection Test Set(USC行人資料庫)
該資料庫包含三組數據集(USC-A、USC-B和USC-C),以XML格式提供標註信息。USC-A[Wu, 2005]的圖片來自於網路,共205張圖片,313個站立的行人,行人間不存在相互遮擋,拍攝角度為正面或者背面;USC-B的圖片主要來自於CAVIAR視頻庫,包括各種視角的行人,行人之間有的相互遮擋,共54張圖片,271個行人;USC-C有100張圖片來自網路的圖片,232個行人(多角度),行人之間無相互遮擋。
3.Caltech Pedestrian Detection Benchmark(Caltech行人資料庫)
該資料庫是目前規模較大的行人資料庫,採用車載攝像頭拍攝,約10個小時左右,視頻的解析度為640x480,30幀/秒。標註了約250,000幀(約137分鐘),350000個矩形框,2300個行人,另外還對矩形框之間的時間對應關係及其遮擋的情況進行標註。
4.Daimler Pedestrian Detection Benchmark (戴姆勒行人檢測標準資料庫)
該資料庫採用車載攝像機獲取,分為檢測和分類兩個數據集。檢測數據集的訓練樣本集有正樣本大小為18×36和48×96的圖片各15560(3915×4)張,行人的最小高度為72個象素;負樣本6744張(大小為640×480或360×288)。測試集為一段27分鐘左右的視頻(解析度為640×480),共21790張圖片,包含56492個行人。分類資料庫有三個訓練集和兩個測試集,每個數據集有4800張行人圖片,5000張非行人圖片,大小均為18×36,另外還有3個輔助的非行人圖片集,各1200張圖片。
5.DukeMTMC-reID
DukeMTMC-reID 為 DukeMTMC數據集的行人重識別子集。原始數據集包含了85分鐘的高解析度視頻,採集自8個不同的攝像頭。並且提供了人工標註的bounding box.
6.INRIA Person Dataset(INRIA行人資料庫)
該資料庫是目前使用最多的靜態行人檢測資料庫,提供原始圖片及相應的標註文件。訓練集有正樣本614張(包含2416個行人),負樣本1218張;測試集有正樣本288張(包含1126個行人),負樣本453張。圖片中人體大部分為站立姿勢且高度大於100個象素,部分標註可能不正確。圖片主要來源於GRAZ-01、個人照片及google,因此圖片的清晰度較高。在XP操作系統下部分訓練或者測試圖片無法看清楚,但可用OpenCV正常讀取和顯示。
7.BIWI Walking Pedestrians dataset
該數據集中所有圖片均是採用鳥瞰視角,對繁忙場景下散步行走的路人進行的記錄。
8.Central Pedestrian Crossing Sequences
這是在ICCV07論文中使用的三個行人穿越序列。每個序列都帶有跟蹤對象的地面實況框圖注釋和相機校準。每四幀進行一次標定。
9.Dataset used in our ICCV 07 paper Depth and Appearance for Mobile Scene Analysis
該數據集出自於Eth Zurich(蘇黎世聯邦理工學院)。當中記錄了12298個行人的樣本。
10.Human detection and tracking using RGB-D camera
該數據集出自復旦大學計算機視覺實驗室,當中的所有圖片均采自於一家服裝店中。
11.CUHK Occlusion Dataset
該數據集出自於香港中文大學,可應用於行為分析和行人檢測。包含了1063張行人圖片。
12.CUHK Person Re-identification Datasets
這也是出自於香港中文大學的數據集,使用了兩個(不相交的)視角,對971個行人進行了記錄。每個行人在每個視角中均進行了兩次取樣。
13.CUHK Square Dataset
港中大的廣場數據集。包含了一段長達60分鐘的交通視頻序列。(大小為720×576)
行人檢測數據集打包下載鏈接:https://pan.baidu.com/s/1o8aanoQ
密碼:xkka
相關文章
人臉識別常用數據集大全(長期更新中)
PS.點擊訂閱極市 Email list,定期收穫前沿資訊和項目需求資訊。
推薦閱讀: