標籤:

數字圖像處理

第1、2章 緒論、圖象處理的基本概念。

第3、4章 空域和頻域變換

第5、8章 圖象增強和圖象復原。

第6章 圖象編碼

第7、9章 圖象分割和形態學。

第1章 緒論

1.1 從圖象到圖像工程

圖象和數字圖象

圖象技術和圖象工程

相關學科和領域

1.2 圖象處理和分析

圖象處理和分析系統

圖象採集、顯示、存儲、通訊、處理和分析模塊

1.1 從圖象到圖像工程

1.1.1 圖象和數字圖象

什麼是圖象?

圖象(image)是泛指照片、動畫等等形成視覺景象的事物。圖象與計算機圖形學中的圖形的區別是:計算機圖形學是從建立數學模型到生成圖形,而圖象通常是指從外界產生的圖形。

客觀世界是三維空間,但一般圖象是二維的。二維圖象在反映三維世界的過程中必然丟失了部分信息。即使是記錄下來的信息也可能有失真,甚至於難以識別物體。因此,需要從圖象中恢復和重建信息,分析和提取圖象的數學模型,以至於形成人 們對於圖象記錄下的事物有正確和深刻的認識。這個過程就成為圖象處理過程。

為什麼需要數字圖象(digital image )?

普通圖象包含的信息量巨大,需要使用計算機對圖象進行處理。因此,需要把普通圖象轉變成計算機能處理的數字圖象。現在的數碼相機可以直接地把視覺圖象變成數字圖象。數字圖象類似於光柵圖形,由有限行和有限列組成。每個基本單元叫做一個象素(pixel)。三維圖象的象素又叫做體素(voxel)。通常的二維數字圖像是一個矩型,可以用一個二維數組 I(x,y) 來表示,其中 x,y是二維空間中的某坐標系的坐標,I(x,y)表示圖像在該點處的灰度值等性質。彩色可以是紅綠藍三個單色的一定灰度值的合成。一般來說,這些坐標和灰度值是實數,不僅依賴於坐標系的選取,而且依賴於灰度值的度量單位。但是,數字計算機只可能表示有限字長的有限個數字。所以必須把灰度值離散化。簡單地說,數字圖象等同於一個整數值的有限矩陣。數字圖像是數字圖像處理和分析的對象。

1.1.2 圖象技術和圖象工程

數字圖象處理的簡史

數字圖象的產生遠在計算機出現之前。最早有電報傳輸的數字圖象。六、七十年代,隨著計算機硬體的發展和快速傅立葉變換演算法的發現使得用計算機能夠處理圖象。八十年代開始處理三維圖象,九十年代以來,隨著計算機性能的大幅提高和廣泛使用,圖象處理技術已經涉及社會的各個角落。圖象逐漸在傳播媒體中佔據了主導地位,產生的許多的新行業新商機。未來圖象處理的發展是不可限量的。數字圖象處理屬於計算機科學,但是它的90%依賴於數學。從這個特點來看,對於本專業的學生來說,數字圖象處理技術是一個十分理想的發展方向。

哪些屬於圖象技術?

圖象技術是與圖象有關部門的技術的總稱。它是一類綜合技術工程。它包括圖象的採集、獲取、編碼、存儲和傳輸、圖象的生成、顯示和輸出、圖象的變換、增強、恢復和重建、圖象的分割、目標的檢測、表達和描述、特徵的提取、圖象的分類、識別、圖象模型的建立和匹配、圖象和場景的理解。

狹義的數字圖象處理是指圖象的增強、恢復和重建,操作的對象是圖象的象素,輸出的是圖象。

什麼是圖像工程?(廣義的數字圖像處理)

它是由圖像處理、圖像分析和圖像理解三個系統所組成。圖像處理包括圖像採集和從圖像到圖像的變換,以改善主觀的視覺效果和為圖像分析和圖像理解作初步的處理。圖像分析是從圖像中取出感興趣的數據,以描述圖像中目標的特點。圖像理解是在圖像分析的基礎上研究各目標的性質和相互關係,以得出圖像內容的理解和對原場景的解釋。圖像處理、圖像分析和圖像理解是處在從低到高的三個不同的抽象程度上的過程。本課程著重於圖像處理和分析系統。

1.1.3 相關學科和領域

圖象工程是一門系統地研究各種圖象理論、技術和應用的交叉學科。

從它的研究方法看,它與數學、物理學、生物學、心理學、電子學、計算機科學可以互相借鑒,從它的研究範圍看,它與模式識別、計算機視覺、計算機圖形學等學科交叉。

1.2 圖象處理和分析

1.2.1 圖象處理和分析系統

圖像處理和分析系統包括如下模塊:圖像採集模塊、圖像顯示模塊、圖像存儲模塊、圖像通訊模塊和圖像處理和分析模塊。

1.2.2 模塊

圖象採集模塊 CCD

圖象顯示模塊 CRT,LCD

圖象存儲模塊 內存、幀緩存、硬碟

圖象通訊模塊 LAN、WAN

圖象處理和分析模塊

圖象文件的數據結構

一個完整的圖象處理程序的基本功能有:打開圖象文件、顯示圖象、對圖象文件進行指定的處理、存儲圖象文件。由於圖象文件比較大,通常需要在儲存前進行壓縮。所以打開和存儲圖象文件涉及到文件的格式。

圖象文件的格式

圖像文件指包含圖像數據的文件。文件內除圖像數據本身以外,一般還有圖像的描述信息,以便圖像的讀取和顯示。表示圖像常用矢量形式或光柵形式。

矢量形式中圖像用一系列線段或線段的組合體來表示,線段的灰度可以不同,組合體的各部分可用不同的灰度來填充。矢量形式文件中有一系列的命令和數據,執行的結果是畫出圖像來。

圖像數據文件主要是用光柵形式,即圖像是一些圖像點的集合,比較適合變化複雜的圖像。它的主要缺點是缺少對象和像素點之間的聯繫,且在伸縮圖像的過程中圖像會改變。例如,常見的圖象文件類型有bmp,jpg等等。圖象處理的程序必須考慮圖象文件的格式,否則無法正確地打開和保存圖象文件。

pgm格式

美國的許多大學用pgm格式,避免使用壓縮文件格式,對初學者來說是很方便的。下面是一幅該格式的圖象。

補充:圖象和視覺基礎

2.1 概論和綜述

2.2 人眼與亮度視覺

2.3 顏色視覺

2.4 光度學和成象模型

2.5 成象變換

2.6 採樣和量化

2.7 象素間聯繫

2.8 算術和邏輯運算

2.9 坐標變換

第2章 圖象和視覺基礎

2.1 概論和綜述

該基礎包括視覺基礎、成像基礎和圖像基礎三部分:

視覺基礎(人眼與亮度視覺,顏色視覺)

成像基礎(模型、幾何和採樣量化)

圖像基礎(像素間聯繫、圖像運算和圖像坐標變換)

注意:

視覺:指光對感官的刺激和視覺系統的感覺。

視知覺:指如何通過視覺形成關於外部世界的表象。

2.2 人眼與亮度視覺

2.2.1 人眼成象

人的眼球是一個複雜的視覺器官。眼球的前部有晶狀體,相當於照相機的鏡頭。眼球內側的後部有視網膜。視網膜表面分布著兩種感光細胞:錐細胞和柱細胞。眼內有六、七百萬的錐細胞,它們對明亮的光和顏色很敏感。人眼藉助於錐細胞來區分細節,因為每個錐細胞都連到神經末梢。錐細胞的視覺稱為適亮視覺。眼內有75萬到150萬柱細胞。它們分布面大,且幾個柱細胞連到一個神經末稍。解析度低,主要提供整體視覺印象。雖然它們對顏色不敏感,但是對弱光較敏感。柱細胞的視覺稱為適暗視覺。

視網膜的中心是中央凹,面積約1.5?1.5mm2,錐細胞的密度達到150000個/mm2,是眼內最敏感的區域。

2.3 採樣和量化

一幅圖像需要經過離散化成為數字圖像後才能被計算機處理。圖像的空間坐標的離散化叫做空間採樣,灰度的離散化叫做灰度量化。採樣分為均勻採樣和量化和非均勻採樣和量化。假設圖像是一個長方形。在平面上取M?N個大小相同的網格,並把灰度分成G個等級。取各網格中的某點處的灰度值最接近的整數作為該網格的灰度。通常,取M=2m, N=2n和G=2k。則存儲一幅圖像的需要的位數等於b=MNk。例如,一幅128?128、64個灰度等級的圖像需要220位,512?512、256個灰度等級的圖像需要226位。採樣的個數和灰度等級的選取與解析度和儲存的能力兩者有關,需要綜合考慮。例如:

圖像空間解析度變化產生的效果。

圖像灰度解析度變化產生的效果。

圖像空間和灰度解析度同時變化產生的效果。

非均勻採樣和量化

對給定的空間解析度,圖像的質量可以根據圖像特性利用自適應的採樣過程來改進。例如,在灰度變化顯著的有很多細節的區域應當採用較密的採樣。又例如,可以計算所有灰度值出現的頻率。若某範圍內的灰度值出現頻繁,而在其他範圍內灰度值出現較稀,則在該範圍內量化灰度就要較密,在其他範圍內較稀。

算術和邏輯運算

圖像的四則運算中是逐個像點進行的。加法常用來去除噪音,減法常用在醫學成像,乘除法常用來矯正圖像中的灰度陰影。

常用的邏輯運算有

(1)與(AND)

(2)或(OR)

(3)補(NOT)

以上運算既可用於整幅圖像的運算,也可以用於鄰域運算。例如,一點及其8-鄰域的算術平均作為該點的新值。現在常用算術和邏輯運算的單元ALU來加速運算。

第3章 象素空間關係

圖象是由象素組成。圖象以象素為單位建立坐標系。通常是x軸向左,y軸向下。

圖象的坐標變換就是象素的坐標變換。所謂空間變換就是把象素從一個空間變換到另一個空間的坐標變換。

坐標變換的一個應用是對圖象的幾何失真進行校正。

3.1 象素間聯繫

一個象素的鄰域是指該象素周圍的象素集合。

一個象素p的周圍有八個象素,它們共同組成了該象素的8-鄰域N8(p) 。一個象素與上下左右的四個象素組成了4-鄰域N4(p)。一個象素與四個角上的象素組成了對角鄰域ND(p)。

同類灰度的象素間的鄰接,連接和連通問題:

兩個象素彼此落在對方的4-鄰域內,稱為4-連接

兩個象素彼此落在對方的8-鄰域內,稱為8-連接

如果兩個象素或者是4-連接,或者不是4-連接但落在對方的對角鄰域ND(p)內,那麼稱為混合連接(m-連接)

混合連接可以避免8-連接造成的多路問題。

兩個象素集合的連通是指它們在指定的鄰域內有一條通路

第4章 空域增強技術

圖象增強技術是使圖象的某種指定效果更好。例如,使X透視照片更清晰。

分成兩大類:空域增強技術和頻域增強技術。其中,空域指象素組成的空間。

空域增強技術直接作用於象素。可以表示為

g(x,y) = EH(f(x,y))

其中f和g分別是增強前後的圖象.這個變換不改變象素的位置,僅改變象素的灰度f(x,y)。

4.1空間技術分類

如果變換EH僅用一個點,稱EH為點運算(點處理)。如果變換EH還用到點(x,y)鄰域內的點,那麼記變換EH為 g(x,y)=EH(f(x,y),n),

稱為模板處理。

點操作可以分為灰度操作和集合操作,它們僅根據該點的灰度和位置,分別改變原灰度為新灰度(稱為灰度變換或灰度映射)和原位置為新位置的象素.

灰度操作可以把不同的灰度變成同一個灰度,集合操作可以把不同位置變成同一個位置.因此,它們可能不是可逆的變換.

線性濾波器

技術分類和實現原理

技術分類 根據功能分成平滑濾波和銳化濾波。

平滑濾波減弱和消除高頻分量,使圖象灰度平滑。

銳化濾波減弱和消除低頻分量,是圖象反差增大。

2. 模板卷積

方形模板在圖象中漫遊,中心對準一個象素。

非線性濾波

分成三個發展方向:邏輯、幾何和代數,分別基於集合、形狀和排序。下面介紹基於排序的方向。

4.6.1 非線性平滑濾波器

1-D中值濾波原理

非線性、基於模板。設模板尺寸M=2r+1,r為半徑。

給定一維信號{fi}, I=1,2,…,N.則中值濾波的輸出為

gj = 數組fj-r,fj-r+1,…,f0,…,fj+r-1,fj+r的中值。

其中,fj的下標在0到N之間。這意味著對該數組排序,然後

輸出一個數, 使它既不大於又不小於其中的r+1個數。

中值濾波能完全消除孤立的脈衝(零脈衝響應)和不影響理想的階躍響應。

能被中值濾波完全除去的脈衝的最大長度依賴於濾波器的模板長度M。

局部增強

對圖象的一部分進行增強

例如,

將圖象分成一系列子圖象,並對子圖象進行直方圖等操作

利用局部的均值m和均方差?

g(x,y) = A(x,y)[f(x,y)-m(x,y)]+m(x,y),

其中,A(x,y)=kM/?(x,y)稱為局部增益函數,M為平均灰度,k為比例係數.g(x,y)右邊的第一項能放大圖象的局部變化,第二項恢復均值.

*********************************************

*********************************************************************

*********************************************************************************


推薦閱讀:

圖像去霧項目中遇到的問題
Matlab插入高質量無白邊圖
生命科學的領地,現在深度學習來了
深度反向投影網路(DBPN)--通過Back-Projection來超解析度的新方法
如果你的內存比較小

TAG:圖像處理 |