為什麼用圖像二維傅里葉變換的相位譜進行反變換，能夠大致得到原圖的形狀，而幅度譜則不行呢？

01-11

如題所示。圖像傅里葉變換幅度譜和相位譜有什麼具體意義呢？謝謝！

我也問過自己這個問題，一句話的回答：對於自然圖像，相位包含了更多的視覺信息。

我知道你不滿意，所以再解釋一下。由於自然圖像都具有低通的特性（低頻成分佔據大部分能量），所以事實上大部分圖像的幅度譜長得都很像（在matlab里做2-D fft，然後fftshift，得到的頻譜中幅度都是中間/低頻是比較大的值，周圍/高頻是比較小的值）。但是不同圖像的相位譜差異很大。

如何理解這個現象呢？在學習傅里葉級數的時候，我們知道相同周期的函數，可以用同樣的傅里葉basis來表達。之所有有不同的波形/函數，是因為不同頻率成分/諧波分量的幅值、相位不同。由於自然圖像都具有低通特性，所以不同諧波分量的幅值具有類似的分布特性。那麼圖像的差異，更多的來自於不同諧波分量相位的差異。

比如圖像（尤其是醫學圖像）可以看成piecewise smooth，甚至piecewise constant。下面兩個一維圖像在視覺上是很不同的。但他們的諧波分析中，幅度譜完全一致，差異來自相位譜的不同。

有趣的是，對於音樂信號，似乎幅度譜中包含了更多聽覺信息。比如不同樂器的音色不同，主要是因為不同諧波分量的幅值不同。當然也有人分析過相位在音色中扮演的作用。

相位譜包括了所有的邊緣信息，而幅度譜反應的平均灰度值

因為時域平移等於頻域相移，空間位置的信息在相位里，但是顯然幅度和相位都重要，光相位能還原出來的應該是很特殊的圖。

而且你們真的不要再對整張圖做fft了，我們做語音也不是把整句話做fft的啊，說好的短時平穩呢

不太明白，光一個相位譜或者幅度譜怎麼反變換

一個猜測，如果一個方法可以比較好的重建出圖像的空間相關性，那麼這個重建是好的。

如果丟掉相位信息，那麼結果就直接是白噪音或者其他噪音，相關性無法被重建。

如果丟掉的是幅度信息，那麼....我想想

在傅里葉變換世界裡，我們普通常見的圖像都是由一組組正弦波組成。由中學知識我們知道頻率相位幅度即可決定一個正弦波y=Acos(ωx+φ)的全部特徵。

DFT變換得到圖像的譜（傅里葉譜或稱為頻譜）分量，這些譜分量含有組成圖像信號的正弦波的幅度信息。傅里葉譜中說明了各種正弦波的幅度信息，幅度越大，圖像中該頻率的正弦波越突出，幅度越小，該頻率處正弦波較少。我們可以把幅度信息理解為圖像上灰度變化的程度，灰度變化明顯的地方就是圖像的邊緣信息。知道幅度幅度信息就知道了整個圖像由哪些正弦波組成的。有了譜，就知道圖像是有哪些頻率的正弦波所組成以及這些正弦波的幅度。

但是到此我們還不知道這些組成圖像的正弦波的相位信息。這時候我們就需要用到圖像的相位譜，相位譜告訴我們每一種頻率分量的相位信息。在二維傅里葉變換中，相位信息表徵了各個正弦分量偏離原點的程度，也就是每一個正弦波在圖像中的位置。

有了以上兩種信息，我們就知道，圖像由什麼波組成，波的幅度是多少，各個波在什麼位置。所以有了頻譜信息，有了相譜信息，OK，完美了。

牢記：灰度信息是由頻譜攜帶，位置信息是由相譜攜帶。

我覺得岡薩雷斯的數字圖像處理4.6.5章節已經說的明白了（對於我來說）。圖像的DFT的幅度陣列包含了圖像的灰度信息，相位陣列則攜帶了較多的關於圖像中可辨別的物體的定位信息。

如圖，b為相位陣列所顯示的圖片，僅僅有相位變換得到的圖像中，可以依稀的看出圖像的輪廓信息（準確？），但是如果只從幅度變換得到圖像，因為缺失了相位的信息，所以在圖d中全部集中在了中心的0頻處。有趣的是，我有了相位譜，但我如果使用其他圖像的相位譜，比如圖e用的是矩形的幅度譜，變換得到的圖像也是人臉的信息，雖然灰度不如原圖那麼準確。但是有力的證明了，幅度譜只是包含了灰度的信息。