做圖像檢索,圖像庫從哪兒能下載到?


這個問題對於每個剛做圖像檢索的人都會碰到,我剛開始CBIR的時候也是谷歌圖像庫漫天搜,後來隨著論文讀得多了,接觸到的圖像庫也漸漸多了。回到正題,目前做CBIR用得比較多且流行的有下面幾個:

  • 手寫數字圖像庫MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges,這個庫有共70,000張圖片,每張圖片的大小是28*28,共包含10類從數字0到9的手寫字元圖像,在圖像檢索里一般是直接使用它的灰度像素作為特徵,特徵維度為784維。

  • CIFAR-10 and CIFAR-100 datasets,這個資料庫包含10類圖像,每類6k,圖像解析度是32*32。另外還有一個CIFAR-100。如果嫌CIFAR-100小,還有一個更大的Tiny Images Dataset,上面CIFAR-10和CIFAR-100都是從這個庫里篩選出來的,這個庫有80M圖片。
  • Caltech101和Caltech256,從後面的數據可以看出它們分別有多少類了。雖然這兩個庫用於做圖像分類用得很多,不過也非常適合做CBIR,前面給的兩個資料庫由於圖像大小尺寸較小,在檢索可視化的時候顯示的效果不是很好。所以我比較推薦用Caltech256和Caltech101,Caltech256有接近30k的圖片,用這個發發論文完全是沒什麼問題的。如果要做幾百萬的實際應用,那得另尋資料庫。

  • INRIA Holidays,也是一個在做CBIR時用的很多的資料庫,圖像檢索的論文里很多都會用這個資料庫。該數據集是Herve Jegou研究所經常度假時拍的圖片(風景為主),一共1491張圖,500張query(一張圖一個group)和對應著991張相關圖像,已提取了128維的SIFT點4455091個,visual dictionaries來自Flickr60K,鏈接。

  • Oxford Buildings Dataset,5k Dataset images,有5062張圖片,是牛津大學VGG小組公布的,在基於辭彙樹做檢索的論文裡面,這個資料庫出現的頻率極高,鏈接。

  • Oxford Paris,The Paris Dataset,oxford的VGG組從Flickr搜集了6412張巴黎旅遊圖片,包括Eiffel Tower等,鏈接。

  • 201Books and CTurin180,The CTurin180 and 201Books Data Sets,2011.5,Telecom Italia提供於Compact Descriptors for Visual Search,該數據集包括:Nokia E7拍攝的201本書的封面圖片(多視角拍攝,各6張),共1.3GB; Turin市180個建築的視頻圖像,拍攝的camera有Galaxy S、iPhone 3、Canon A410、Canon S5 IS,共2.7GB,鏈接。

  • Stanford Mobile Visual Search,Stanford Mobile Visual Search Dataset,2011.2,stanford提供,包括8種場景,如CD封面、油畫等,每組相關圖片都是采自不同相機(手機),所有場景共500張圖,鏈接;以後又發布了一個patch數據集,Compact Descriptors for Visual Search Patches Dataset,校對了相同patch。

  • UKBench,UKBench database,2006.7,Henrik Stewénius在他CVPR06文章中提供的數據集,圖像都為640*480,每個group有4張圖,文件接近2GB,提供visual words,鏈接。

  • MIR-FLICKR,MIR-FLICKR-1M,2010,1M張Flickr上的圖片,也提供25K子集下載,鏈接。

此外,還有COREL,NUS-WIDE等。一般做圖像檢索驗證演算法,前面給出的四個資料庫應該是足夠了的。

參考:圖像檢索公開數據集


@小白菜 已經總結得很好了。

補充兩個 適合深度學習 的 大型訓練數據集

  1. retrieval-SfM Dataset(論文發表在ECCV2016)http://cmp.felk.cvut.cz/~radenfil/projects/siamac.html 提供了 120,000 張建築物訓練圖像。
  2. DukeMTMC-reID Dataset(論文發表在ICCV2017)提供了 16,522張行人訓練圖像, (17,661 + 2,228)張行人測試圖像。 以人搜人。


這裡對圖像領域常用的數據集的獲取做一個總結,具體的數據集的詳細信息和使用方法都可以在鏈接中學習到,先就不贅述了。

1. The 【CIFAR-10】 dataset

http://www.cs.toronto.edu/~kriz/cifar.html

2. 【IAPR TC-12】 Benchmark

http://www.imageclef.org/photodata

3. The 【MIRFLICKR】 RetrievalEvaluation

http://press.liacs.nl/mirflickr/

4. 【SUN Database】: Scene Categorization Benchmark

http://vision.princeton.edu/projects/2010/SUN/

5. The 【MNIST】 DATABASE ofhandwritten digits

http://yann.lecun.com/exdb/mnist/

6. TEXMEX: 【ANN_SIFT10K】,【ANN_SIFT1M】, 【ANN_GIST1M】, 【ANN_SIFT1B】

http://corpus-texmex.irisa.fr/

並可以找到Matlab讀取.fvecs, .ivecs和.bvecs後綴的mat文件

7. 【Tiny】 Images Dataset

http://horatio.cs.nyu.edu/mit/tiny/data/index.html

8. 【Photo Tourism】 (Exploring photo collection in 3D)

http://phototour.cs.washington.edu/

9. 【NUS-WIDE】

A Real-World Web Image Database from National University ofSingapore

http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm

這個也可以參考下哦

http://www.datatang.com/data/13693

10. The 【INRIA】 Holidaydataset

http://lear.inrialpes.fr/~jegou/data.php#holidays

11. 【LabelMe】

http://labelme2.csail.mit.edu/Release3.0/browserTools/php/dataset.php

這個可以需要自己使用matlab代碼運行下載或者在線使用。

http://people.csail.mit.edu/torralba/code/spatialenvelope/

可以參考一下這個鏈接的數據:The LabelMe-12-50k dataset

http://www.ais.uni-bonn.de/download/datasets.html

這裡也提供兩個可以下載其gist特徵提取後的mat數據集:

http://cs.nyu.edu/~fergus/research/tfw_cvpr08_code.zip

http://www.cs.toronto.edu/~norouzi/research/mlh/data/LabelMe_gist.mat

12. 【ILSVRC2010】

http://www.image-net.org/challenges/LSVRC/2010/

13. 【Caltech-256】

http://www.vision.caltech.edu/Image_Datasets/Caltech256/#Benchmarks

這個比Caltech-101改進許多,建議可以使用256

也附上Caltech-101的鏈接:

http://www.vision.caltech.edu/Image_Datasets/Caltech101/

14. Places Database: A scene recognition database

http://places.csail.mit.edu/

15.

Datasets

這個鏈接包含了深度學習中用到的音樂數據集, 自然圖片數據集(哈希可用),人工數據集,臉部數據集,文本,演講,推薦系統等的比較全面的數據集介紹以及詳細頁面鏈接。供參考。


看來知乎上CBIR的人不多啊, 你要寫論文還是要做應用? 現在ImageNet是最好的庫了

Corel和Caltech 都是很老的庫了,也就是說的tuned的差不多了, 現在的頂級期刊都沒人用這些庫了, 最多做個baseline 庫而已, 建議你直接上手ImageNet, 做deeplearning和large-scale image retrieval 的都用這個,圖多 類多 而且diverse。做應用直接上flicker , 直接選200k的那個庫, 原因就不用解釋了吧。 在2014年不管是寫論文還是做應用 還在用corel 和caltech的都弱爆了好么。。

當然也要看你做的領域 CBIR也有很多細分的 比如說做face, 做scene的 做OCR的 用的庫都不一樣 給你個鏈接:CVonline: Image Databases 這裡有詳細劃分和相關的鏈接


Content Based Image Retrieval / Image Database Search Engine (SIMPLIcity, WIPE, Virtual Microscope)


這個是Corel圖像資料庫

http://wang.ist.psu.edu/docs/related/


想問下有沒有關於醫學圖像的資料庫。。


想問LZ有沒有找到關於做圖像檢索的開源代碼 網上關於這方面用VS的很少 LZ有沒有資源啊T.T


推薦閱讀:

沐神的第三代parameter server的worker節點只需要保存部分參數,怎麼理解?
目前世界上有對強人工智慧的嘗試嗎?具體瓶頸是什麼?
目前火熱的Deep Learning會滅絕傳統的SIFT/ SURF的特徵提取的演算法嗎?
目前主流的attention方法都有哪些?
CNN為什麼能使用在NLP?

TAG:人工智慧 | 計算機視覺 | 圖像檢索 | 深度學習DeepLearning |