【反老法師通俗演義】圖像質量評價標準基礎科普(上)
歡迎關注公眾號「蘭拓相機租賃」或「qicaidang」,有我們的全部評測文章和免費在線課堂。
前言
雖然機器是人製造出來的,但人類和機器面對這個世界時候「觀察」和「思維」的方式,甚至比人和狗之間的差距還要大。我作為一個已經習慣機器思維方式的人類,每每跟人類中的萌妹子交流的時候都會壓力山大,其實是一個不錯的例證。嗯跑題了,下面正式開始。
注意,在下面的分析當中我們提到的所有「圖像」都指的是灰度圖像。對於彩色圖像,實際上是三張灰度圖像的加權疊加,分析方法完全一致。為了討論簡便,做此說明。
第一章 萬事皆信號 萬物皆系統
讓我們從一個叫做「信號」的詞說起。
提到信號(Signal)這個詞,大家首先想到的是什麼?
是交通信號燈?
還是手機信號?
而當數學家們說起「信號」的時候,他們腦海中想到的並不是交通指示燈所發出的閃爍光芒或者手機屏幕頂部的天線圖案,而是一段可以被攜帶與傳播的信息,可以是聲音,可以是圖像,也可是遙感測量數據。簡單地說,它是一個函數,定義在通常的一維或者多維空間之上。
而系統這個詞是伴隨著信號而生的。一個事件的發生,在信號學上就被認為是一個信號通過一個系統(System)得到的一個響應(Response)。比如拍照這個過程,可以認為是外界攜帶信息的光線通過相機鏡頭這個系統,得到了一個被叫做圖片的響應。
實際上,聲音就是一種非常典型的信號——無論是在信號與系統的專業研究當中,還是在我們的日常生活上,都非常易於理解「聲音信號」這個詞的概念。
按照我們上面對於信號這個詞的定義,不難理解圖像其實也是完全符合這種定義的,實際上,一張圖片可以被看做一個三維空間中的函數f(l,x,y),其中(x,y)是每一個像素點的坐標,而l的值就是這個像素的亮度。
對應的,聲音信號是一個二維空間中的函數f(x,t),t是時間,而x指的是該時間點處聲音的強度。
從這種簡單的類比當中我們可以得出一個結論——圖像和聲音,實際上是可以採用完全相同的研究方式的。甚至一個三維的圖像,完全可以通過下面的方式轉換成二維函數f(x,l):
其中圖1是一個曲頂柱體——三維空間中函數的圖像。自己用板子畫得圖,比較難看,各位勿怪。如果大家學過高數,肯定就會知道一個概念叫做「偏導數」。這裡的操作方法和它是類似的,即認為第三個變數固定(取截面),而研究另外兩個變數之間的關係。
插一句題外話,這也是為什麼解析度測量要同時測水平解析度和垂直解析度才有意義的原因。因為一般情況下f(x,l)和f(y,l)具有不相同的特性。
一旦能夠理解圖像可以採用和波形聲音相同的研究方法,很快,你就會發現找到新世界大門的感覺。
所以,我們就從聲音開始,一起去探尋這個新世界的秘密。
第二章 工科男與萌妹子
最常見的攜帶規律信息的聲音信號應該就是音樂了。那麼,你眼中的音樂,是什麼樣子的呢?
如果你是一個工科男,或者做音頻處理的人,應該會告訴我,我眼中的音樂,是這個樣子的:
這是工科男們對音樂的理解——一段隨著時間而變化的振動。
但是,如果去問一個學樂器的萌妹子,它給出的答案一定是這樣:
這是巴赫Partita No.3小提琴譜中的前幾個小節。
而上面那個波形聲音,就是把這段曲子演奏出來,通過麥克風采樣之後,打出來的波形。
因此我們就有了一個很顯然,但是又細思恐極的結論:
上面的兩張圖片,表示的是同一件東西。
實際上,上面兩種方式就是信號的兩種不同表示方法。
第一張圖片表達的是信號隨時間而變化的規律,我們把這種表示方式叫做時域。
而第二張圖片表達的是組成這整個信號的所有頻率成分(如果你初中物理不是體育老師教的,那你應當明白不同的音高對應的是發聲體不同的振動頻率)。這種表示方式我們把它叫做頻域,這張樂譜在信號學上有另一個名字,這個名字還經常被用於各種保健品宣傳當中,叫做頻譜。
所以實質上頻域這個概念對大家來說並不算陌生,只是大家沒有注意到而已。
聲音的頻率好理解,就是發聲體每秒振動的次數(次/秒,或者叫Hz),那麼,類比到圖像當中,頻率的概念又是什麼呢?
如果你經常關注攝影器材評測的解析度部分,應當見過一個神奇的單位,叫做線對每毫米(lp/mm)。
空間中從左往右數一共遍歷了多少線對,再算一算走過了多少毫米,兩者相除得到的就是線對每毫米
時域中從前往後看一共振動了多少次,再算一算振動了多少秒,兩者相除得到的就是次每秒
兩者完全一樣
也就是說,只要你能理解赫茲作為頻率單位的概念,就同樣不難理解,圖像的基礎解析度單位lp/mm,其實也是一個頻率單位。
這裡的頻率我們把它叫做空間頻率(Spatial Frequencies)。
將上面圖片中的時域信號轉變成下面圖片中的頻域信號,需要用的數學工具很多人應該都聽說過,叫做傅里葉變換(Fourier Transform)。
在聲音當中,傅里葉同學告訴我們,任何周期函數,都可以看作是不同振幅,不同相位正弦波的疊加。在聲音里我們可以理解為,利用對不同琴鍵不同時間點的敲擊,可以組合出任何一首樂曲。
以下圖中的方波為例:
第一幅圖是一個鬱悶的正弦波cos(t);
第二幅圖是2個賣萌的正弦波的疊加cos(t)+cos(3t);
第三幅圖是4個發春的正弦波的疊加;
第四幅圖是10個便秘的正弦波的疊加。
隨著正弦波數量逐漸的增長,他們最終會疊加成一個標準的矩形,大家從中體會到了什麼道理?
(只要努力,彎的都能掰直!)
圖像當中其實也一樣。利用不同頻率的「圖像元」在空間中不同位置放置,可以疊加生成任意一張圖像。
很多玄學黨會提到「微反差」這個概念,但如果能接受圖像是以1lp/mm、2lp/mm……這種頻率成分疊加起來而生成的話,這個概念也就不再玄學了。由於不同光學系統在不同頻率下其特性不同,而人眼又是對頻域敏感(其實人耳也是,你聽音樂時候聽的不是時域波形,而是頻域音高),所以不同的光學系統確實是有「味道」上的微小差異,而且是可以量化測量的。這種測量方法我們把它叫做空間頻率響應(Spatial Frenquencies Response,SFR)。以往的解析度測試實際上只針對了高頻部分的響應特性,在我看來,中低頻的特性對於一張照片觀感影響其實更加大——大家都在LR或者ACR里調整過對比度/清晰度的吧?跟銳化相比是不是對整張照片的影響更大?
第三章 弦外之音
我們繼續來講「解析度」這個詞後面一點一滴不尋常的東西。
SFR測試相比單純的解析度測試,最突出的特點是它能夠反映光學系統在中低頻,人眼觀感更敏感的部分的特徵。而解析度其實是SFR的一小部分。在首先定義了SFR之後,通常意義上的解析度便有了清晰明確的定義。
這是一個典型的SFR曲線,拍攝標板(後面我們會講到解析度測試卡的原理,其實並不像大家想的那麼簡單)後對得到的數據做傅里葉變換,便能得到這個曲線。
LW/PH(線寬每圖高)和lp/mm相似,也是一個解析度單位,同時是空間頻率單位。橫坐標是頻率,縱坐標是相對響應值(0到1)。
ps:圖片中上部的Cy/Pxl(周期每像素)這個單位也是解析度單位,其更能反映解析度測試的頻域特徵——周期(頻率的倒數)這個概念,本來就是頻域中所特有的。
定義:MTF **解析度即是該光學系統的頻率響應特性(可以認為是是否能夠還原原始信號一個特徵指標)下降到最大值的**%時,其對應的空間頻率(也即截止頻率)。
從這裡我們也可以看出,空間頻率越高,則光學系統對其響應特性越差。這符合我們對相機和鏡頭的常規認知。
圖中有L(Luminance)、R、G、B四條曲線,四條曲線並不重合。這說明光學系統對不同色光的響應特性是不一樣的,這也是色散產生的原因之一。四條線重合度越高,證明系統的色差越小——這就是我們後面要提到的鏡頭色散測試的基本原理。
大家對照上面這張圖看看是不是這回事。
好了,講完解析度,我們接著來講頻域分析法的一些其他結論。
其實老法師們常說的「味道」這種東西,和樂器的「音色」,倒也是有幾分相似之處。
同樣是一個音符do,用鋼琴彈出來,和用二胡拉出來,小提琴拉出來……大家隨便一聽,就能聽出它們的區別。
同樣的音高不應該對應著一樣的振動頻率么?為什麼會有區別呢?
實際上,我們平時所說的中央C頻率=261.62Hz,指的是整根弦的振動頻率。而與此同時,半根弦、1/3根弦、1/4根弦……也在獨立的振動,形成了複雜而具有韻律的諧波。
圖中每一個小色塊覆蓋的區域都是一個正弦波,獨立的對外發出對應頻率的聲音。
在數學上,我們可以將所有小正弦波疊加起來,便可以得到整個弦的振動特性。
是不是似曾相識?和昨天我們講的傅里葉分析法正好相反?
是的,這個過程叫做傅里葉反變換,這種求解弦振動問題的方式叫做傅里葉解或者駐波法。下次再碰到彈鋼琴拉小提琴的萌妹子的時候,咳,知道該怎麼裝逼了吧……
ps:振動問題還有一類懸空自由振動,求解它可以使用行波法——在以後為大家講超聲波馬達原理的時候,會簡單提一下。
回到圖像當中來,圖像的頻域疊加方式實際上也是這樣的。你看到的是一個空間低頻色塊,實際上裡面包含了很多的高頻信息。類似於樂器的音色,這就產生了不同光學系統所特有的成像特徵。
我不是想給老法師翻案,我只是想說,矯枉不可過正。中醫里的某些東西尚且可以為現代醫學所吸收利用,給「味道」之類的玄學一個可量化的方法和解釋,為什麼就不可以呢。
畢竟測鏡頭只測解析度(空間截止頻率)的話,能反映出來的信息太少太少了。
最後提一下,Photoshop中的「高反差保留」功能其實就是一個數字圖像濾波器,可以有選擇性的抽取圖像中的頻率成分,在我們的攝影后期當中有著非常廣泛的應用。
第四章 四海定兮書同文 萬世開兮車同轍
解析度標板這個東西,很多人對它應該並不陌生。
按照我們之前對於「拍照」這件事的新定義,「一個信號通過一個系統得到一個響應」,解析度標板所要做的事情就是提供一個標準化的原始空間信號——就像我們在測試天線的時候,經常使用各種頻率的正弦波一樣。
空間中各種頻率的「正弦波」是什麼呢?
是這個。
根據空間頻率的概念,從右到左越來越密集的線條,對應的就是從低到高的空間頻率。對光學系統輸入這個信號,取不同點分析,便可以得到不同空間頻率下系統的SFR。
但這個東西有個巨大的問題——精度實在是太TM的低了。要在普通的印刷甚至激光曬板之下保證每個點頻率的精確性,在目前的技術下非常困難。
不過畢竟人類的智慧是無窮的,一條路不好走,可以換一條嘛。死磕到底,那不是聰明人的風格。
如果你仔細看了我昨天的推送,應該還有一個印象——無窮多個從低頻到高頻的正弦波可以疊加成為一個方波。
那麼,空間方波會不會是一個良好的待測信號呢?
來做個題:求下圖中周期方波的傅里葉級數。*
*:傅里葉變換的數學方式不止一種,對於周期信號可以用傅里葉級數展開,對於非周期信號叫做傅里葉變換,對於數字信號可以用離散傅里葉變換。但在物理上的作用大致相同。
這才叫真Cosplay(玩餘弦),跑漫展什麼的都弱爆了。
對於覺得太長不看的,直接給出結果:
所以我們得到了一個令人震驚的結論:一個簡單的方波,其實包含了無窮無盡的頻率信息,是一種極好的頻域參考信號。(單函數sin nωt的頻率為nω/2π)
而空間中的方波是什麼呢?沒錯,就是這個!
一個從黑到白突然跳變的方塊。
黑白跳變這種做法,對精度的要求實際上低了很多。畢竟沒有了線距和線寬的硬性要求,SFR測試精度達到了極高的水平。所以現在的測試卡,早已不是過去的那種ISO12233,而都變成了這個樣子:
這真的是一張SFR解析度測試卡,色卡和灰卡用來測其他參數,真正有效的便是那一個個「方波」——黑色的方塊。由於方塊可以做的很小,覆蓋率也達到了喇叭圖所不能比擬的高度。
承蒙這種SFR測試方法,我們新定製的標板已經突破了5000萬像素對應解析度的測試精度,萬事俱備,只欠5Ds R了。
推薦閱讀:
※日不落帝國玩轉地球
※旅途中最不想錯過的,是落日
※[快訊]最有逼格的圖片庫Stocksy開放供稿人簽約申請
※攝影研究所 | 入門第一步,解讀攝影構圖技巧
※大片分析出調色思路