為什麼用圖像二維傅里葉變換的相位譜進行反變換,能夠大致得到原圖的形狀,而幅度譜則不行呢?

如題所示。圖像傅里葉變換幅度譜和相位譜有什麼具體意義呢?謝謝!


我也問過自己這個問題,一句話的回答:對於自然圖像,相位包含了更多的視覺信息。

我知道你不滿意,所以再解釋一下。由於自然圖像都具有低通的特性(低頻成分佔據大部分能量),所以事實上大部分圖像的幅度譜長得都很像(在matlab里做2-D fft,然後fftshift,得到的頻譜中幅度都是中間/低頻是比較大的值,周圍/高頻是比較小的值)。但是不同圖像的相位譜差異很大。

如何理解這個現象呢?在學習傅里葉級數的時候,我們知道相同周期的函數,可以用同樣的傅里葉basis來表達。之所有有不同的波形/函數,是因為不同頻率成分/諧波分量的幅值、相位不同。由於自然圖像都具有低通特性,所以不同諧波分量的幅值具有類似的分布特性。那麼圖像的差異,更多的來自於不同諧波分量相位的差異。

比如圖像(尤其是醫學圖像)可以看成piecewise smooth,甚至piecewise constant。下面兩個一維圖像在視覺上是很不同的。但他們的諧波分析中,幅度譜完全一致,差異來自相位譜的不同。

有趣的是,對於音樂信號,似乎幅度譜中包含了更多聽覺信息。比如不同樂器的音色不同,主要是因為不同諧波分量的幅值不同。當然也有人分析過相位在音色中扮演的作用。


相位譜包括了所有的邊緣信息,而幅度譜反應的平均灰度值


因為時域平移等於頻域相移,空間位置的信息在相位里,但是顯然幅度和相位都重要,光相位能還原出來的應該是很特殊的圖。

而且你們真的不要再對整張圖做fft了,我們做語音也不是把整句話做fft的啊,說好的短時平穩呢


不太明白,光一個相位譜或者幅度譜怎麼反變換


一個猜測, 如果一個方法可以比較好的重建出圖像的空間相關性,那麼這個重建是好的。

如果丟掉相位信息,那麼結果就直接是白噪音或者其他噪音,相關性無法被重建。

如果丟掉的是幅度信息,那麼....我想想


在傅里葉變換世界裡,我們普通常見的圖像都是由一組組正弦波組成。由中學知識我們知道頻率相位幅度即可決定一個正弦波y=Acos(ωx+φ)的全部特徵。

DFT變換得到圖像的譜(傅里葉譜或稱為頻譜)分量,這些譜分量含有組成圖像信號的正弦波的幅度信息。傅里葉譜中說明了各種正弦波的幅度信息,幅度越大,圖像中該頻率的正弦波越突出,幅度越小,該頻率處正弦波較少。我們可以把幅度信息理解為圖像上灰度變化的程度,灰度變化明顯的地方就是圖像的邊緣信息。知道幅度幅度信息就知道了整個圖像由哪些正弦波組成的。有了譜,就知道圖像是有哪些頻率的正弦波所組成以及這些正弦波的幅度。

但是到此我們還不知道這些組成圖像的正弦波的相位信息。這時候我們就需要用到圖像的相位譜,相位譜告訴我們每一種頻率分量的相位信息。在二維傅里葉變換中,相位信息表徵了各個正弦分量偏離原點的程度,也就是每一個正弦波在圖像中的位置。

有了以上兩種信息,我們就知道,圖像由什麼波組成,波的幅度是多少,各個波在什麼位置。所以有了頻譜信息,有了相譜信息,OK,完美了。

牢記:灰度信息是由頻譜攜帶,位置信息是由相譜攜帶。


我覺得岡薩雷斯的數字圖像處理4.6.5章節已經說的明白了(對於我來說)。圖像的DFT的幅度陣列包含了圖像的灰度信息,相位陣列則攜帶了較多的關於圖像中可辨別的物體的定位信息。

如圖,b為相位陣列所顯示的圖片,僅僅有相位變換得到的圖像中,可以依稀的看出圖像的輪廓信息(準確?),但是如果只從幅度變換得到圖像,因為缺失了相位的信息,所以在圖d中全部集中在了中心的0頻處。有趣的是,我有了相位譜,但我如果使用其他圖像的相位譜,比如圖e用的是矩形的幅度譜,變換得到的圖像也是人臉的信息,雖然灰度不如原圖那麼準確。但是有力的證明了,幅度譜只是包含了灰度的信息。


推薦閱讀:

如何系統的學習PS?
灰度圖像中如何提取模糊邊緣,進行精確計數?
傅立葉變換頻譜圖怎麼看?
圖像配准問題…也就是如何用C++編程實現在一個大矩陣里尋找一個與它一個子矩陣最為相似的一個等維小矩陣?

TAG:數學 | 圖像處理 | 傅里葉變換FourierTransform | 數字信號處理 | 工程數學 |