【技術綜述】傳統方法怎麼設計美學特徵

文章首發於微信公眾號《與有三學AI》

傳統方法怎麼玩計算機審美mp.weixin.qq.com圖標

說我們今天走到了科學與藝術的交叉口,是完全沒問題的。

在深度學習還沒有遍地開花,在神經網路還處於低谷時期,有沒有人在玩計算機攝影?當然有。

他們是怎麼玩的?傳統方法必然要手動設計大量特徵來研究計算機美學這個問題。

都主要有什麼特徵,這就是本篇文章的目的,單刀直入也不廢話了。

這裡,我們有必要將其分為兩類特徵:

1 底層的圖像特徵

l Subject-Background Contrast

攝影裡面有一個很重要的原則,那就是簡單。我們希望一張照片主體突出,背景不要有各種各樣的干擾,這一點,其實可以從圖像的高頻特徵中看出。

下面是兩幅圖的邊緣特徵【1】,

我們可以去猜想,圖2原圖其實是一朵花,圖1是一個辦公室或者家裡的一角。圖2的邊緣更好完整,簡潔,而圖1顯得很雜亂。對應的,原圖像2的質量想必是高於圖1的。

這個邊緣,就可以反映出圖像的簡單性。

當然還有對前背景的更多屬性,如曝光,飽和度,色調等計算對比度的方法【3】,他們的目標都是一致的,即反映出前背景的對比度信息。

l Color Distribution Feature

顏色分布特徵,這是一個很古老,也是在傳統的圖像檢索中使用非常多的特徵,最直觀

的就是顏色直方圖。直方圖現在每個攝影機上都有,好一點的後期軟體也都有。

好的照片,一般會有一個統一的風格。或偏暖色,或偏冷色,這些都可以通過彩色直方

圖表徵出來。同時,局部直方圖的複雜程度,也可以反映出圖像風格的一致性。

由於直方圖是很常用的圖像特徵,這裡就不舉具體的例子說明了。

l Hue harmanic

這是從色調的特性上來分享一張好圖。

一張好的靜物攝影,色調一般會比較單一,不會五顏六色的各種顏色都雜糅在一起,如下面的圖【1】,單調乾淨的色調。

好的色調和配色,才會有好的視覺感受,也會呈現出和諧。

文【2】是文【1】的後續研究,補充了攝影中的另2個原理,即90 color scheme和complementary color scheme。

這個是設計學裡的經典配色方案,從下面的色調輪中看,具有視覺美感的主色調搭配方案,常常是區間相隔180度,或者90度左右。

【2】其中提供了具體的計算這個色調特徵的方法,下面是一個好圖的示例。

具體計算這個hue的複雜度,就是要把圖像轉換到HSV空間,得到H通道。然後將其等分成多個bins,設定閾值,來計算色調的種類。

l Blur

如果不是刻意表達某些,一張模糊的照片肯定是不如一張清晰的照片的。傳統的圖像

質量評估裡面,PSNR和SSIM是圖像雜訊和模糊的定量評估指標,這也被用過。

l Contrast 和 brightness

對比度和亮度,似乎一直形影不離。

說起亮度,攝影中常常有一句話,叫做50度灰,說的就是照相機會自動將一張

圖調整到50度灰,這也是自動曝光。但是,對於一張美圖來說,我們常常喜歡主體曝光,背景越簡單越好。

這是對圖像亮度的期望,也是對對比度的期望。

有方法是基於saliency detectiing的原理,把顯著目標當作前景,其他當作背景,從而計算出一些前景和背景的指標。

關於對比度和亮度的計算方法,【1-5】中都有具體的原理,感興趣的可以自己閱讀。

l clearness and the colorfulness【3】

用dark channel feature【2】 來measure the clearness and the colorfulness of the subject areas,也虧他們想得出,這是對暗通道的強加使用,不過效果還不錯。

不過,更多的還是參考【3】。

l 通用圖像特徵與專用圖像特徵

說起這個,那就是人盡皆知的那些東西了。SIFT,Bag- of-Visual-Words (BOV) ,Fisher Vector (FV) 全部搬出來,計算一遍,上SVM分類,極其自然。只是效果嘛,聽天由命。對於某些風景照,LBP, HOG 會比較有效。而對於某些特定類型的照片,比如商業人臉照片,人臉表情,姿態特徵會比較有用。

2 與攝影有關的特徵[3]

l the rule of thirds.

三分構圖法則,是非常普遍的。

早期,文【3】通過將圖像分為9宮格,然後計算每一個宮格的色調的方法,來評判一張圖的三分特性。

l the Low Depth of Field Indicators

當主體是單個的目標是,利用大光圈製造的淺景深,是提升美學質量的重要方法。

有人利用小波特徵來計算每一個grid的景深。

當然還有曝光等特徵,就不一一提了。

更多請移步

1,我的gitchat達人課

龍鵬的達人課gitbook.cn圖標

2,AI技術公眾號,《與有三學AI》

從alexnet到resnet,初探深度學習演算法玩攝影mp.weixin.qq.com圖標

3,以及攝影號,《有三工作室》

論我眼中的國產動畫崛起mp.weixin.qq.com圖標

[1] Y. Ke, X. Tang, and F. Jing, 「The design of high-level features for photo quality assessment,」 in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), vol. 1, 2006, pp. 419–426

[2] Luo W, Wang X, Tang X. Content-based photo quality assessment[C]// International Conference on Computer Vision. IEEE, 2011:2206-2213.

[3] Wong L K, Low K L. Saliency-enhanced image aesthetics class prediction[C]// IEEE International Conference on Image Processing. IEEE Press, 2009:993-996.

[4] Aydin T O, Smolic A, Gross M. Automated Aesthetic Analysis of Photographic Images[J]. IEEE Transactions on Visualization & Computer Graphics, 2015, 21(1):31..

[5] Spathis D. Photo-Quality Evaluation based on Computational Aesthetics: Review of Feature Extraction Techniques[J]. 2016.

[6] Deng Y, Chen C L, Tang X. Image Aesthetic Assessment: An experimental survey[J]. IEEE Signal Processing Magazine, 2017, 34(4):80-106.

推薦閱讀:

2017年歷史文章匯總|深度學習
【小林的OpenCV基礎課 10】Canny邊緣檢測
深度學習的「警察」與「小偷」
Rocket Training: 一種提升輕量網路性能的訓練方法
讀Focal Loss

TAG:計算機視覺 | 攝影 |