【技術綜述】傳統方法怎麼設計美學特徵
文章首發於微信公眾號《與有三學AI》
傳統方法怎麼玩計算機審美說我們今天走到了科學與藝術的交叉口,是完全沒問題的。
在深度學習還沒有遍地開花,在神經網路還處於低谷時期,有沒有人在玩計算機攝影?當然有。
他們是怎麼玩的?傳統方法必然要手動設計大量特徵來研究計算機美學這個問題。
都主要有什麼特徵,這就是本篇文章的目的,單刀直入也不廢話了。
這裡,我們有必要將其分為兩類特徵:
1 底層的圖像特徵
l Subject-Background Contrast
攝影裡面有一個很重要的原則,那就是簡單。我們希望一張照片主體突出,背景不要有各種各樣的干擾,這一點,其實可以從圖像的高頻特徵中看出。
下面是兩幅圖的邊緣特徵【1】,
我們可以去猜想,圖2原圖其實是一朵花,圖1是一個辦公室或者家裡的一角。圖2的邊緣更好完整,簡潔,而圖1顯得很雜亂。對應的,原圖像2的質量想必是高於圖1的。
這個邊緣,就可以反映出圖像的簡單性。
當然還有對前背景的更多屬性,如曝光,飽和度,色調等計算對比度的方法【3】,他們的目標都是一致的,即反映出前背景的對比度信息。
l Color Distribution Feature
顏色分布特徵,這是一個很古老,也是在傳統的圖像檢索中使用非常多的特徵,最直觀
的就是顏色直方圖。直方圖現在每個攝影機上都有,好一點的後期軟體也都有。
好的照片,一般會有一個統一的風格。或偏暖色,或偏冷色,這些都可以通過彩色直方
圖表徵出來。同時,局部直方圖的複雜程度,也可以反映出圖像風格的一致性。
由於直方圖是很常用的圖像特徵,這裡就不舉具體的例子說明了。
l Hue harmanic
這是從色調的特性上來分享一張好圖。
一張好的靜物攝影,色調一般會比較單一,不會五顏六色的各種顏色都雜糅在一起,如下面的圖【1】,單調乾淨的色調。
好的色調和配色,才會有好的視覺感受,也會呈現出和諧。
文【2】是文【1】的後續研究,補充了攝影中的另2個原理,即90 color scheme和complementary color scheme。
這個是設計學裡的經典配色方案,從下面的色調輪中看,具有視覺美感的主色調搭配方案,常常是區間相隔180度,或者90度左右。
【2】其中提供了具體的計算這個色調特徵的方法,下面是一個好圖的示例。
具體計算這個hue的複雜度,就是要把圖像轉換到HSV空間,得到H通道。然後將其等分成多個bins,設定閾值,來計算色調的種類。
l Blur
如果不是刻意表達某些,一張模糊的照片肯定是不如一張清晰的照片的。傳統的圖像
質量評估裡面,PSNR和SSIM是圖像雜訊和模糊的定量評估指標,這也被用過。
l Contrast 和 brightness
對比度和亮度,似乎一直形影不離。
說起亮度,攝影中常常有一句話,叫做50度灰,說的就是照相機會自動將一張
圖調整到50度灰,這也是自動曝光。但是,對於一張美圖來說,我們常常喜歡主體曝光,背景越簡單越好。
這是對圖像亮度的期望,也是對對比度的期望。
有方法是基於saliency detectiing的原理,把顯著目標當作前景,其他當作背景,從而計算出一些前景和背景的指標。
關於對比度和亮度的計算方法,【1-5】中都有具體的原理,感興趣的可以自己閱讀。
l clearness and the colorfulness【3】
用dark channel feature【2】 來measure the clearness and the colorfulness of the subject areas,也虧他們想得出,這是對暗通道的強加使用,不過效果還不錯。
不過,更多的還是參考【3】。
l 通用圖像特徵與專用圖像特徵
說起這個,那就是人盡皆知的那些東西了。SIFT,Bag- of-Visual-Words (BOV) ,Fisher Vector (FV) 全部搬出來,計算一遍,上SVM分類,極其自然。只是效果嘛,聽天由命。對於某些風景照,LBP, HOG 會比較有效。而對於某些特定類型的照片,比如商業人臉照片,人臉表情,姿態特徵會比較有用。
2 與攝影有關的特徵[3]
l the rule of thirds.
三分構圖法則,是非常普遍的。
早期,文【3】通過將圖像分為9宮格,然後計算每一個宮格的色調的方法,來評判一張圖的三分特性。
l the Low Depth of Field Indicators
當主體是單個的目標是,利用大光圈製造的淺景深,是提升美學質量的重要方法。
有人利用小波特徵來計算每一個grid的景深。
當然還有曝光等特徵,就不一一提了。
更多請移步
1,我的gitchat達人課
龍鵬的達人課
2,AI技術公眾號,《與有三學AI》
從alexnet到resnet,初探深度學習演算法玩攝影
3,以及攝影號,《有三工作室》
論我眼中的國產動畫崛起
[1] Y. Ke, X. Tang, and F. Jing, 「The design of high-level features for photo quality assessment,」 in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), vol. 1, 2006, pp. 419–426
[2] Luo W, Wang X, Tang X. Content-based photo quality assessment[C]// International Conference on Computer Vision. IEEE, 2011:2206-2213.
[3] Wong L K, Low K L. Saliency-enhanced image aesthetics class prediction[C]// IEEE International Conference on Image Processing. IEEE Press, 2009:993-996.
[4] Aydin T O, Smolic A, Gross M. Automated Aesthetic Analysis of Photographic Images[J]. IEEE Transactions on Visualization & Computer Graphics, 2015, 21(1):31..
[5] Spathis D. Photo-Quality Evaluation based on Computational Aesthetics: Review of Feature Extraction Techniques[J]. 2016.
[6] Deng Y, Chen C L, Tang X. Image Aesthetic Assessment: An experimental survey[J]. IEEE Signal Processing Magazine, 2017, 34(4):80-106.
推薦閱讀:
※2017年歷史文章匯總|深度學習
※【小林的OpenCV基礎課 10】Canny邊緣檢測
※深度學習的「警察」與「小偷」
※Rocket Training: 一種提升輕量網路性能的訓練方法
※讀Focal Loss