圖像檢索文獻綜述
1.1圖像檢索概述
隨著數字圖像的數量的急速增長,如何快速、高效地從海量圖像資料庫中檢索出客戶所需要的數據和信息是當前圖像應用領域的重要問題。伴隨著資料庫管理技術和機器視覺的發展,圖像檢索技術自20世紀70年代以來,一直成為人們研究研究的熱門課題。從圖像檢索技術發展的過程來看,主要經歷了兩個階段:基於文本的圖像檢索階段和基於內容的圖像檢索階段,圖1-1分別為兩個階段圖像檢索過程的流程圖。
1.1.1
基於文本的圖像檢索簡介
基於文本的圖像檢索(KBIR,Keywords-Based Image Retrieval)研究已經非常成熟而且應用也非常廣泛,對圖像數據的管理就是對圖像給予一些指定的屬性信息,並且在關係資料庫中將兩者聯繫起來看作格式化數據,圖像的檢索只能局限於對這些屬性關鍵字字元串的匹配。這種方法通過利用圖像文件名和圖像相關的一些關鍵字屬性,為圖像建立索引。索引的提取一般為利用人工標註來實現。用戶通過輸入對應屬性關鍵字來檢索圖像,系統通過匹配輸入的關鍵字和圖像的索引,返回查詢結果。如圖1-1(a)所示,有人形象的稱之為「以字搜圖」。此方法的優點是實現過程簡單,容易理解,查詢速度快,能夠反映用戶的查詢意圖,並且檢索結果較為精確。但是人工標註需要耗費大量的人力,無法滿足大型的多媒體資料庫,也難以適應大量新數據的出現,無法解決標註人員在內容感知和描述上的主觀性。
圖像的內容可以概括的分為兩大類:語義內容和視覺內容。為了檢索需要的圖像,首先要為圖像庫中的圖像建立索引,CBIR技術中首先提取圖像特徵,用這些特徵對圖像進行描述,然後對圖像的特徵進行格式化。建立通用高效的圖像檢索系統是一項非常繁瑣而且間距的工作,這主要是由兩個方面的原因所造成的,第一是人們對事物認知的主觀性,其次是圖像內容的複雜性。目前,圖像中有關視覺內容的索引主要通過圖像的一些物理特徵或者低層特徵來描述;而圖像的語義的索引一般用描述圖像的文字來表達,除了特徵提取方式來獲取圖像的語義內容之外,還有待在今後克服「語義鴻溝」取得新的研究進展。
基於內容的圖像檢索,英文簡寫為CBIR[4]。是現在圖像檢索中的一個重要研究方向。用戶通過輸入相關圖像進行搜索,系統首先提取檢索圖像的特徵,後計算檢索圖像的特徵和特徵庫中特徵之間的相似度,輸出檢索結果。這種根據特徵相似度,給出查詢結果的方法,又稱之為「以圖搜圖」。如圖1-1(b)所示,為CBIR框架的基本組成。系統的運行過程如下:
(1)首先是建立圖像特徵資料庫,具體描述是對圖像資料庫中的每張圖像進行特徵提取,用提取的特徵來建立圖像特徵資料庫,圖像的特徵提取也是整個系統的核心部分,所以選取的圖像特徵對檢索結果有著決定性作用;
(2)人機介面通過人機交互提取檢索圖像特徵,並對提取的特徵進行匹配,匹配過程其實就是有個相似度計算的過程,計算檢索圖像的特徵和特徵資料庫中特徵的相似度,根據相似性度量結果進行系統輸出;
(3)對檢索結果進行評價打分,並將評價結果反饋給系統,系統會根據反饋的信息調整相應的比重權重,達到優化系統的目的。
最初CBIR研究主要集中在如何用合適的圖像特徵去描述圖像的內容和怎樣計算圖像特徵間的相似度。現在,仍然沒有一種有效的特徵描述子能夠獲取圖像的高級語義特徵,但是,如何提取一些有效的圖像描述運算元以便於檢索和儲存卻有著實際的研究價值。
1.2圖像檢索的國內外研究狀況
CBIR技術是在圖像領域中於19世紀90年代初發展起來的一門技術學科,與這門學科相關的學科非常多,如數學、物理等學科,這門技術的發展對信息檢索有一定的推動作用。在國外,有許多科研機構和高校都對圖像檢索技術做了深入的研究,在這個領域做了深入研究的科研機構有IBM、MIT等,著名高校如Columbia、Stanford、UIUC等也話費大量精力在這個領域做了相關研究。
在國內,CBIR也是被各大高校和科研機構所青睞,也相繼研究CBIR在音頻和視頻等領域的擴展。其中在國家863高新技術研究發展項目中,清華大學對「網路上基於內容的圖像檢索」展開了研究,這個項目的目的是,在WEB上,通過網站頁面進行檢索,利用有關顏色、紋理和形狀等低層特徵提取技術或者一些工具和方法,比如樣本圖像檢索。浙江大學也在這個領域研發了Photo Engine、Photo Navigator和Web Scope CBR等圖像檢索系統,「基於特徵的多媒體信息檢索系統(MIRES)」是中國科學院計算技術研究所和北京圖書館在CBIR的基礎上聯合研發的一個多媒體檢索系統。總而言之,目前越來越多的高校和科研機構都開始了研究基於內容的圖像檢索。
目前,基於內容的圖像檢索是一個非常熱門的研究和應用領域,關於它的報道不斷。隨著這個領域的發展,開發者和研究者所面臨的問題和挑戰也相應的發生著變化。在研究前期主要關心的問題是如何從一個大圖像資料庫中利用提取的特徵檢索出目標圖像;當前研究則主要集中在改進CBIR技術上面,如何能開發出能滿足用戶的具體需求的圖像檢索系統,研究的主要方向包括新的圖像特徵、表示方法以及相似度的計算等等。顯而易見,CBIR系統不能只滿足於傳統的文字查詢方式,但這不意味著傳統的基於關鍵字的查詢不能包含在CBIR系統中。已經有研究專家將基於文本的圖像檢索與CBIR系統結合起來,也就是將圖像相關文字描述與圖像的低層特徵融入到一個CBIR系統中。各方專家在研究過程中發現全自動的特徵提取似乎是不太可能的,而且用戶優勢也無法明確地描述圖像的一些特徵。很多研究人員將工作已經轉向通過人機交互的半自動圖像檢索中去。現階段的互動式圖像檢索廣泛應用了機器學習技術以及相關反饋技術。還有一些該領域的科研工作者提出了「語義圖像檢索」技術,由於他們在研究時發現無法完整的建立圖像的「高層語義」和低層特徵之間的聯繫。結合圖像檢索的發展過程不難發現,CBIR的發展經歷了幾個發展階段,每個階段都體現了對「圖像相似」的概念的理解的變化,並且均取得了一定的技術支持(包括信息檢索、資料庫技術、機器視覺、模式識別等)。
目前,基於內容的圖像檢索的研究主要集中在表1-1所示的幾個方面[6]。
表1-1 國內外研究熱點
CBIR技術對大規模圖像的信息的訪問和訪問提供有力支持。CBIR可以廣泛的應用於信息檢索服務、醫療診斷、地理信息和遠程遙感、商標和知識產權等領域。目前比較成熟的應用有物體跟蹤、以圖搜圖、指紋識別等。總之,CBIR是一項快速發展並且很有利用價值的前瞻性技術,在很多應用領域都具有很高的應用價值。
推薦閱讀:
※信號處理與數字媒體
※如何理解卷積,另外如何理解圖像處理中的卷積?
※使用電腦進行圖像處理(視頻、照片、繪圖、設計)工作,顯示器色彩空間為何不能統一?怎麼解決?
※有哪些辦法將圖形轉化為聲音?