做圖像檢索，圖像庫從哪兒能下載到？

01-07

這個問題對於每個剛做圖像檢索的人都會碰到，我剛開始CBIR的時候也是谷歌圖像庫漫天搜，後來隨著論文讀得多了，接觸到的圖像庫也漸漸多了。回到正題，目前做CBIR用得比較多且流行的有下面幾個:

手寫數字圖像庫MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges，這個庫有共70,000張圖片，每張圖片的大小是28*28，共包含10類從數字0到9的手寫字元圖像，在圖像檢索里一般是直接使用它的灰度像素作為特徵，特徵維度為784維。
CIFAR-10 and CIFAR-100 datasets，這個資料庫包含10類圖像，每類6k，圖像解析度是32*32。另外還有一個CIFAR-100。如果嫌CIFAR-100小，還有一個更大的Tiny Images Dataset，上面CIFAR-10和CIFAR-100都是從這個庫里篩選出來的，這個庫有80M圖片。
Caltech101和Caltech256，從後面的數據可以看出它們分別有多少類了。雖然這兩個庫用於做圖像分類用得很多，不過也非常適合做CBIR，前面給的兩個資料庫由於圖像大小尺寸較小，在檢索可視化的時候顯示的效果不是很好。所以我比較推薦用Caltech256和Caltech101，Caltech256有接近30k的圖片，用這個發發論文完全是沒什麼問題的。如果要做幾百萬的實際應用，那得另尋資料庫。
INRIA Holidays，也是一個在做CBIR時用的很多的資料庫，圖像檢索的論文里很多都會用這個資料庫。該數據集是Herve Jegou研究所經常度假時拍的圖片（風景為主），一共1491張圖，500張query（一張圖一個group）和對應著991張相關圖像，已提取了128維的SIFT點4455091個，visual dictionaries來自Flickr60K，鏈接。
Oxford Buildings Dataset，5k Dataset images，有5062張圖片，是牛津大學VGG小組公布的，在基於辭彙樹做檢索的論文裡面，這個資料庫出現的頻率極高，鏈接。
Oxford Paris，The Paris Dataset，oxford的VGG組從Flickr搜集了6412張巴黎旅遊圖片，包括Eiffel Tower等，鏈接。
201Books and CTurin180，The CTurin180 and 201Books Data Sets，2011.5，Telecom Italia提供於Compact Descriptors for Visual Search，該數據集包括：Nokia E7拍攝的201本書的封面圖片（多視角拍攝，各6張），共1.3GB； Turin市180個建築的視頻圖像，拍攝的camera有Galaxy S、iPhone 3、Canon A410、Canon S5 IS，共2.7GB，鏈接。
Stanford Mobile Visual Search，Stanford Mobile Visual Search Dataset，2011.2，stanford提供，包括8種場景，如CD封面、油畫等，每組相關圖片都是采自不同相機（手機），所有場景共500張圖，鏈接；以後又發布了一個patch數據集，Compact Descriptors for Visual Search Patches Dataset，校對了相同patch。
UKBench，UKBench database，2006.7，Henrik Stewénius在他CVPR06文章中提供的數據集，圖像都為640*480，每個group有4張圖，文件接近2GB，提供visual words，鏈接。
MIR-FLICKR，MIR-FLICKR-1M，2010，1M張Flickr上的圖片，也提供25K子集下載，鏈接。

此外，還有COREL，NUS-WIDE等。一般做圖像檢索驗證演算法，前面給出的四個資料庫應該是足夠了的。

參考：圖像檢索公開數據集

@小白菜已經總結得很好了。

補充兩個 適合深度學習 的大型訓練數據集

retrieval-SfM Dataset（論文發表在ECCV2016）http://cmp.felk.cvut.cz/~radenfil/projects/siamac.html 提供了 120,000 張建築物訓練圖像。
DukeMTMC-reID Dataset（論文發表在ICCV2017）提供了 16,522張行人訓練圖像， (17,661 + 2,228）張行人測試圖像。以人搜人。

這裡對圖像領域常用的數據集的獲取做一個總結，具體的數據集的詳細信息和使用方法都可以在鏈接中學習到，先就不贅述了。

1. The 【CIFAR-10】 dataset

http://www.cs.toronto.edu/~kriz/cifar.html

2. 【IAPR TC-12】 Benchmark

http://www.imageclef.org/photodata

3. The 【MIRFLICKR】 RetrievalEvaluation

http://press.liacs.nl/mirflickr/

4. 【SUN Database】: Scene Categorization Benchmark

http://vision.princeton.edu/projects/2010/SUN/

5. The 【MNIST】 DATABASE ofhandwritten digits

http://yann.lecun.com/exdb/mnist/

6. TEXMEX: 【ANN_SIFT10K】,【ANN_SIFT1M】, 【ANN_GIST1M】, 【ANN_SIFT1B】

http://corpus-texmex.irisa.fr/

並可以找到Matlab讀取.fvecs, .ivecs和.bvecs後綴的mat文件

7. 【Tiny】 Images Dataset

http://horatio.cs.nyu.edu/mit/tiny/data/index.html

8. 【Photo Tourism】 (Exploring photo collection in 3D)

http://phototour.cs.washington.edu/

9. 【NUS-WIDE】

A Real-World Web Image Database from National University ofSingapore

http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm

這個也可以參考下哦

http://www.datatang.com/data/13693

10. The 【INRIA】 Holidaydataset

http://lear.inrialpes.fr/~jegou/data.php#holidays

11. 【LabelMe】

http://labelme2.csail.mit.edu/Release3.0/browserTools/php/dataset.php

這個可以需要自己使用matlab代碼運行下載或者在線使用。

http://people.csail.mit.edu/torralba/code/spatialenvelope/

可以參考一下這個鏈接的數據：The LabelMe-12-50k dataset

http://www.ais.uni-bonn.de/download/datasets.html

這裡也提供兩個可以下載其gist特徵提取後的mat數據集：

http://cs.nyu.edu/~fergus/research/tfw_cvpr08_code.zip

http://www.cs.toronto.edu/~norouzi/research/mlh/data/LabelMe_gist.mat

12. 【ILSVRC2010】

http://www.image-net.org/challenges/LSVRC/2010/

13. 【Caltech-256】

http://www.vision.caltech.edu/Image_Datasets/Caltech256/#Benchmarks

這個比Caltech-101改進許多，建議可以使用256

也附上Caltech-101的鏈接：

http://www.vision.caltech.edu/Image_Datasets/Caltech101/

14. Places Database: A scene recognition database

http://places.csail.mit.edu/

15.

Datasets

這個鏈接包含了深度學習中用到的音樂數據集，自然圖片數據集（哈希可用），人工數據集，臉部數據集，文本，演講，推薦系統等的比較全面的數據集介紹以及詳細頁面鏈接。供參考。

看來知乎上CBIR的人不多啊，你要寫論文還是要做應用？現在ImageNet是最好的庫了

Corel和Caltech 都是很老的庫了，也就是說的tuned的差不多了，現在的頂級期刊都沒人用這些庫了，最多做個baseline 庫而已，建議你直接上手ImageNet，做deeplearning和large-scale image retrieval 的都用這個，圖多類多而且diverse。做應用直接上flicker ，直接選200k的那個庫，原因就不用解釋了吧。在2014年不管是寫論文還是做應用還在用corel 和caltech的都弱爆了好么。。

當然也要看你做的領域 CBIR也有很多細分的比如說做face，做scene的做OCR的用的庫都不一樣給你個鏈接：CVonline: Image Databases 這裡有詳細劃分和相關的鏈接

Content Based Image Retrieval / Image Database Search Engine (SIMPLIcity, WIPE, Virtual Microscope)

這個是Corel圖像資料庫

http://wang.ist.psu.edu/docs/related/

想問下有沒有關於醫學圖像的資料庫。。

想問LZ有沒有找到關於做圖像檢索的開源代碼網上關於這方面用VS的很少 LZ有沒有資源啊T.T