如何評價德國計算機神經網路科學家發表的這篇可以讓電腦模仿任何畫家的風格作畫的論文?

一位德國計算機神經網路科學家發表了篇可以讓電腦模仿任何畫家的風格作畫的論文,我的問題有以下幾個:

1.此程序或演算法是否一種革命性的新成就,或者只是現有技術的複雜化?

2.此技術的發展前景如何,程序是否有一天會發展到可以脫離模仿,自己創造畫風獨立創作?

3.從美術角度看,畫的藝術價值如何?

4.這項技術今後的大規模發展,是否會導致一些畫家失業?(這裡指的不是頂尖的有自己風格的大師,而是水準相對平庸的畫匠。)

5.這程序有下載或在線版么?如果能找到的話求銜接。

詳情如下:

文章的arXiv鏈接:http://arxiv.org/abs/1508.06576


目測會被玩壞。

個人覺得在聖地巡禮的後期優化上發揮的餘地很大呀。

這是我在日本宇治市『上低音號』巡禮,午夜爬大吉山拍的渣圖:

沒錯,都怪小米手機。

然後這是動畫第8集的原景圖:

接下來就是見證奇蹟的時刻:

使用拍攝圖作為 content_image, 使用動畫原景圖作為 style_image, 利用該論文的方法渲染:

有那麼點意思了不是? 注意這還是我使用默認的參數的結果。模型迭代了1000次並沒有收斂,也並沒有使用 GPU 加速。如果注意參數調優以及圖片的平滑會好很多。

==================================================================

該程序在 GitHub 上可以找到,之前也有答主提到了。安裝相關平台還是蠻麻煩的, 需要 protobuf, loadcaffe, torch 三件套。而且有些 trick 比如 lua 版本要足夠新否則會有包安裝不上的問題 (luarocks),都需要查閱相關的郵件列表以及 github issue 以及 FAQ 耐心解決。

注意 luarocks install nn/image/.... 注意遺漏的包

可以不適用默認的參數,將 num_iterations 調大一些。


自己搭了一個demo玩了一下(源程序來自reddit分享,特此說明),github地址如下:
jcjohnson/neural-style · GitHub

效果拔群:
素描版:

雕(gui)版(chu)畫:

梵高版:

穆夏:

克林姆:

想不來更新奇的腦洞了,收工!

PS:這篇論文其實很好讀的,像我這種純碼農,琢磨琢磨也能看的懂個大概,調調參數,跑跑demo。真正牛逼的地方在於那個style reconstruction的loss的定義上面,這個作者並沒有闡述他們的intuition,如果是蒙的那簡直也是太牛逼了。

畫家們最後會失業么?比較難說。不過出現一大批半吊子的「計算藝術家」那是指日可待的! 2333


謝邀

有電腦了,就好好回答一下這個問題。

究竟什麼叫做風格?這很難給出一個數學上的定義,但有兩點特性是可以確定的:
一是風格的表達應當是局部的。receptive field越大,特徵越接近語義,即"這個東西是什麼",而不是風格,當然也不能太小,因為風格這東西還是個比較複雜的模式(pattern)。
二是全局共享同一個風格,如果各處都是不一樣的,那就變成大雜燴,而不能稱為具有某種風格。

說到這裡,對卷積神經網路比較熟悉的可以想到,中層的卷積特徵符合這兩個特性。在我們還未明確什麼是風格這個特徵的時候,可以找一個比較大的網路(例如vgg),將中層卷積特徵的分布當做風格。

這篇文章主要解決了兩個問題:

第一個問題是如何能同時保證生成的圖像還像原來的東西,即」這個東西原來是什麼,現在還是什麼「。之前說過,這個在學術界有個名詞叫做語義(semantic),處在神經網路的高層中。因此原圖和結果圖的高層語義特徵之差應盡量小。

第二個問題是「風格」這個pattern到底是什麼,文中的答案是所有卷積層的特徵Orz...這跟我們上邊分析得到的「中層特徵」不是很相符,高層特徵會帶來一些具體的物體,比如梵高星空中的大漩渦(抱歉我真不知道這是什麼),竊以為這個具體的物體不叫風格。
為了實現平移不變性,作者使用了所有空間位置上,特徵的協方差矩陣來衡量特徵的分布。通過減小原圖和風格圖的特徵分布之間的差距,使得原圖和風格圖的風格盡量接近。

上邊提到了兩個」減小「,對應著兩個損失函數,通過優化,即可得到文中所示的結果。

這篇工作是開創性的,即找到了新的應用,所以很值得肯定。希望大神們多多研究,將神經網路繪畫發展成一個單獨的方向,就不會再有人問"這東西能不能提高識別率"這樣的問題了。

再說說缺點吧:
1、論文里用了conv5_1來提風格,但這一層其實已經有object level的東西了。

2、用全局特徵會帶來一個問題,那就是生成圖像會儘可能地展現風格圖的所有元素,但有些元素可能是內容圖內不存在的。

3、顏色是不是風格?我認為不能算,畫家可以任意使用顏色,現在這個方法會把顏色一併encode進去。

4、速度問題,這個演算法還是太慢了,大概需要5分鐘才能生成一張VGA圖片。

-----------------我是分割線---------------------
下面回答一下題主的問題:

1.此程序或演算法是否一種革命性的新成就,或者只是現有技術的複雜化?
答:不能算革命性的成就,「什麼是風格」的問題還是沒解決,而是用了一種很暴力的方式。

2.此技術的發展前景如何,程序是否有一天會發展到可以脫離模仿,自己創造畫風獨立創作?
答:我覺得是可以的,上文提到的特徵分布,其實沒必要來自於一幅現有的名作,裡面的內容是可以隨意修改的。不過,這麼做符不符合人類的審美觀,就沒法保證了。一個可行的辦法是大量地隨機,讓人們來對生成的圖像進行打分,然後從裡面學習出「什麼是美觀的風格」。

3.從美術角度看,畫的藝術價值如何?
答:我們程序員、科研人員這些死理性派,來評價藝術價值,顯然是不合適的。

4.這項技術今後的大規模發展,是否會導致一些畫家失業?(這裡指的不是頂尖的有自己風格的大師,而是水準相對平庸的畫匠。)
答:這個問題也不在我的回答能力範圍之內。

5.這程序有下載或在線版么?如果能找到的話求銜接。
答:我自己實現了一個:https://github.com/happynear/DeepVisualization/tree/master/NeuralArt
由於筆記本速度有限,我沒有仔細地調整參數,等能用到台式機的時候再好好調整下吧。
代碼實在混亂,有點拿不出手啊。。


來來來,題主要的福利來了,我們幾個小夥伴為了讓大家可以玩轉這個新演算法,專門開了一個公眾號,叫「畫風刷」,大家只要把圖片傳上去,就可以得到各種畫風的結果啦。

我們後台的演算法是基於這個Stanford的implementation, https://github.com/jcjohnson/neural-style/commits/master,然後對這個代碼進行了進一步的優化,目前計算時間在2分鐘以內(不過大家等待的時間可能會比這個長,因為伺服器處理能力有限,請求過多的時候可能會排隊)。

這裡是我們的宣傳動畫

視頻封面畫風刷—在線播放—優酷網,視頻高清在線觀看視頻

我們可是在AWS的GPU上燒著錢跑程序為大家謀福利哦,快去關注「畫風刷」開始玩吧!(指不定哪天因為資金不足就停了呢╥﹏╥)


在專欄里寫了個通俗版的科普,歡迎捧場:
神經網路:文藝女vs理工男 - Candela - 知乎專欄
當理工男教電腦仿梵谷:文藝女之逆襲 - Candela - 知乎專欄


從題主貼出來的幾幅圖來看,這篇論文的程序只是在保留原畫內容的前提下,讓細節看起來像另一幅畫。研究本身固然有意義,但我覺得把它描述為「模仿任何畫家的風格作畫」則有標題黨之嫌,因為一來程序沒有在「作」畫,只是在「改」畫;二來它只是模仿一幅畫,而不是畫家的風格。


好像需要反對一些答案……

爲什麼只有人類體驗到的自然和社會才能夠作爲生成畫風的經驗?而計算機體驗到的不算?
這個斷言是很不可思議的。

人類對腦的隱喻中,不管是「心靈即機器」,「心靈即計算機」抑或是「心靈即動力系統」,都假設了人腦是可以被解構的。我們甚至可以玩一把忒修斯之船,對一個人的腦部的每一個神經元測定完了之後知道一個同樣輸出的人工神經元換進去。理論上可以生成一個人腦當前的coredump。

這個coredump有沒有思想有沒有心境呢。

所以我覺得什麼心境啊共鳴啊,只要好好還原認知科學有足夠發展,都是可以模擬的。人類特質在創意行爲中的重要性,我相信都是可以還原的(只是我還不知道)。

至於需要的情緒,計算機雖然不知道是什麼,但是我們可以標註啊。也算是經驗了。


1.siggraph我不懂。技術上cnn不算新技術了……在我看來這篇文章對AI/CC(computational creativity)領域的貢獻來自於將「風格/筆觸」這種聽起來無法捉摸的東西使用特徵表示出來並且可以應用在各種場合中。

2.自己創造畫風,不就是將提取出來的各種畫風向量遺傳演算法組一組就好了……按照MBoden的觀點,computational creativity的難點從來不是創造出新的東西,因爲排列組合,或者說是猴子打字機,是計算機的強項。難點在於如何篩選出比較好的東西呈現出來。
如何獨立創作是一個比較大的問題,現階段的話照片的轉寫是比較現實的,更難的……如果你想出來了請告訴我,我們合作一篇好不好?

3.藝術價值,我覺得可能更多的取決於受衆。我老闆提過一個placebo effect的問題,如果人類評測者事先被告知了這個句子來自於一個正常的作者的話,它的聯想能力會根據外界信息做出調整,更容易接受一條推是隱微的而不是詞語的胡亂組合(word salad)。
以及我很懷疑圖靈測試在其中發揮的用處。

背景:一點NLP,一點點點分哲。CC初學者。不懂藝術理論。


不要被文章題目忽悠了
這篇文章用的CNN,是一個訓練好的模型,所以說這個文章提出得演算法僅僅用來提特徵而已。文章演算法亮點是作者之前發的文章的texture提取方法……
就是文中的gram矩陣……CNN感覺只是個幌子……


2015/9/5修改: @渡鴉千謠 大概認知到其原發言有所不妥,亦已向我評論,其原發言亦可能已修改。下面截取其原文的三點誤區,進行討論分析。保留僅是因為這些觀點常見典型。
0.順便答 渡鴉千謠,我對其原回答的反駁不限於他弄錯了/不知道一個事實(ps和研究工作的先後關係)。而是,不知道這個事實,這件事反映了很多問題。另外,原回答還有兩個論述有問題(見2,3)。

1.「這種東西ps中早就有了」。不好意思,絕對沒有。ps中的東西就是三年、五年、十幾年前中的論文研究出來的,而現在這篇論文的結果,只有三五年後才會出現在ps中。這意味不知道ps軟體的來源,背後的技術的來源。而圖形學中相當大一部分課題,都是用來提高電影特效、遊戲特效、圖形圖像視頻編輯、模型設計的技術的。這項成果就是圖形學這種課題的一部分。如果這些基本事實不清楚,其實沒有太大必要答這題。

2.「這只是複雜化的技術」。藝術家和設計師們,比如 @渡鴉千謠 。ps軟體,數位板,顯示器,各種後期編輯軟體,建模型軟體,是怎麼來的呢?是不是拉一夥大專出來的程序員編程就能編出來了?可以說,正是那些開發出 @渡鴉千謠 所認為的開發出「只是複雜化的技術」的科學家們,在過去用他們的智慧造就了設計師和藝術家如今的創作環境。

3.「沒有藝術價值」。現在覺得技術夠用了,是否就可以否定科學家現在探索的價值呢?科學本就是沙中淘金。還是畏懼藝術家有一天會被機器取代?所以原回答中在刻意彰顯藝術家、創造力、藝術價值。事實上,科學家只對如何輔助藝術家更高效地創作感興趣,他們研究未來藝術家的創作工具。所以,現在痛斥你未來的畫筆、顏料、色彩板、畫布,「沒有藝術價值」,是為了什麼?

3.1. 事實上,上述第3條我論述有問題,我混淆了作品和工具。題主問的是作品有無藝術價值,我討論的是工具有無藝術價值。事實上,如果這一問題的回答是「(作品)沒有藝術價值」,而不作任何討論的話,將會非常危險
這將會直接否定掉:
3.1.1 平常人/非科班/非藝術工作者的藝術作品的價值
或者否定掉:
3.1.2 當代攝影作品的藝術價值
3.1.3 當代/未來設計師的作品的藝術價值
邏輯是:(不加前提的)作品沒有藝術價值 =&> (否定3.1.1 或者 ( 否定3.1.2 和 否定3.1.3 ) )
不是很直觀,有興趣的人可以自行分析一下,分析過程我以後再寫。

4.我相信 @渡鴉千謠 並不了解這些技術,他或許是個掌握工具的好的藝術家,但他並不知道工具的來源。那麼請這樣的人保持沉默,不要評論不知道的事情,這是基本的為人的責任感。因為你和你一樣的人會誤導其它一些人。

結論:這個工作很好,但是沒那麼劃時代,只是你們平時不了解而已。搜搜siggraph,裡面各種這樣的高端「ps」演算法。要是把每年siggraph的論文一篇篇地發到微博上,估計你們先是驚嘆,然後就會麻木了。

其實這種工作一直都有人在做。就這個課題的創意本身,我在本科畢業設計那段時間獨立想到過,然後發了條微博記錄了一下。沒想到被人先實現了。

這個創意也不厲害,很多人都能想到,以前就有類似的:
1.模仿特定風格的字體,仿照他人的字體;
2.將照片變成水彩畫,油畫,素描畫;
3.將兩張圖片融合;
4.將一張圖片的著色方案應用到另外一張圖片上;
5.將照片變成藝術家風格的。

我就是看了第一條的論文,然後想到了這個創意,從文字到圖片,很普通的遷移。甚至上面的第二條,感覺很多濾鏡可能都有類似的功能。而第3-4條甚至在某種程度上達到第5條的效果。

0.如何評價這個工作,具體還是要看它發表在哪個會議上,畢竟類似的工作不少。

1.這個工作很好,但不算革命性的,它應用的深度神經網路可以算是革命性的。然而deep learning沒這個直觀,只有圈內和吹比的人懂,大家都不會太關注。

2.藝術價值?不討論。反正即便為零,也不會降低這個演算法的價值。這可以節約模仿畫家的成本,提高生產力。畫家要學習作畫以及相應的風格,還要作畫時間。

3.模仿到創作。創造,創作這些詞好難界定。反正一旦將抄襲定量描述,那計算機科學家們應該能弄出能生產出不屬於抄襲的作品的演算法。不過這種生產,還是基於演算法輸入了什麼,學習了什麼。當然,如果演算法學了很多風格,它可能可以生產出模仿痕迹很少的作品。比如說,計算機隨便拍一張照片,然後把它轉換成油畫風格的,然後再加點雜訊,或者轉換過程中放點隨機的因子進去。然後和普通的油畫放在一起,估計普通人也分不出哪些是模仿,哪些是原創,哪些是計算機生成的,哪些是人畫的。

4.最後,我看了一下結果圖,覺得這個工作應該還有能改進或者完善的地方,不過不告訴你們。


你所看的並不是畫,而是畫里壓縮的世界。

------
1.此程序或演算法是否一種革命性的新成就,或者只是現有技術的複雜化?
A:
---謝謝@Twisted Python 的指正,Ps的濾鏡遠遠不及此演算法的技術高度---

2.此技術的發展前景如何,程序是否有一天會發展到可以脫離模仿,自己創造畫風獨立創作?
A:不可能。人類的藝術,是基於人這個物種之上的,人類對所處空間及時間的抽象反應。不基於人腦,人類社會,人類所處的自然所誕生的「畫風」,不能被人類理解,所以不能稱之為「畫風」,也不能把這些作品叫做「畫」。

(再說一句,動物園裡的大象,猩猩表演作畫,只能稱之為「動物的肌肉反應通過筆與顏料作用於畫紙之上所產生的圖案」)

3.從美術角度看,畫的藝術價值如何?
A:沒有任何藝術價值,只有技術價值。↑甚至不能稱之為「畫」。一幅有價值的畫,首先要能反應畫畫的人的思想,能表達畫畫人的心境,並能使觀眾產生情緒共鳴。大家看這些所謂計算機創造的畫作,情緒上有共鳴嗎?沒有,因為在創作時沒有目的,沒有感情。

再退一萬步,如果真的能引起共鳴,也是因為篩選上傳圖片的人,挑選圖片時會帶有感情與情緒。

4.這項技術今後的大規模發展,是否會導致一些畫家失業?(這裡指的不是頂尖的有自己風格的大師,而是水準相對平庸的畫匠。)
A:------請先說明所謂的「水準」的含義是什麼。「平庸"的含義又是什麼。
並不會。因為沒有藝術價值。如果從商業價值角度出發,能否滿足客戶需求,能否在設計上自動生成最完美方案,同時又有裝飾等效果,取決於座位消費者的人類所制定的要求。也就是得從最基本上滿足一般人類的審美。再次說一句,藝術品是為人類服務的。
不過在可見的未來,除非這項技術被整合進高智商,擁有完整人格的AI,才能有一些用武之地,但也就是用來模仿罷了。同時,一個有著完整人格的AI,與人類同空間生活,其創造的藝術作品與人類親手創造的藝術作品無異,其AI本身與人類也無異。

5.這程序有下載或在線版么?如果能找到的話求銜接。
布吉島

PS,在打字時,我有一個想法。
商業與藝術的隔閡越來越小,藝術的受眾面也越來越廣大,尤其是攝影攝像技術的出現。許多以前需要畫家一筆一畫畫出來的場景,現在只需要相機+PS便能輕鬆搞定,作品與作品之間的差異便是藝術家與普通人的審美和設計水平差異了。諸君可以了解一下影視中的mattepainting技術。
所以我想的是,為什麼不從最基本開始,由程序攝影攝像,從題材,構圖,光線,空間,色彩出發,捨棄所謂「藝術家的筆觸」呢?用機器自己拍出來的攝影作品,和人類攝影師的作品對比,再來一場新的「圖靈測試」,會將問題中出現的所謂「作品」的違和感降低許多。
------

↑引用 @Twisted Python 的圖,這張不能稱為藝術品,只能算是攝影作品的再創作,削弱了原圖的臨場感與細節,色彩雜亂與主題沒有聯。人物表情與情緒削弱。

↑魏藝原創,來源BD,侵刪。 一目了然。
------
總結:藝術,是人類(或被定義為人類的事物)拆解-重構-反映真實世界的數據資料的一個手段。不通過人類本身拆解-重構-反映的數據資料,不能引起人類心理層面的共鳴,不能稱之為藝術品。
存在於自然中,能引起人類心理層面共鳴的數據資料,如美景,花朵,晶體結構等,因為先於人類存在,吸引了人類觀察,促生了人類藝術的誕生及發展,不能稱之為藝術品。


高票答案說的我全尼瑪看不懂,我回答一下非技術方面的

2.此技術的發展前景如何,程序是否有一天會發展到可以脫離模仿,自己創造畫風獨立創作?

這個技術,是單純的演算法吧,我認為脫離模仿,單靠演算法,不太現實吧?這個技術的發展,應該是演算法更簡便,運算速度更快耗費更低,模擬度的範圍更寬(可以十分精細或十分概略),但如果遙脫離模仿,那是本質上的不同。比如簡單的來說,現在他可以「畫」梵高、「畫」畢加索,那梵高+畢加索呢?是不是又摻雜了人工智慧的成分了?相當與開多一塊,是個新的命題的吧。(大概是我想在這個微波爐里加個小型核子反應堆這種感覺?比喻好像不太恰當。)

就現有技術來說,有一定可能性在這條路上越走越遠的,脫離模仿的,大概是人工智慧吧。不過現有階段的人工只能,還停留在複雜的認知階段的研究吧,就是說,要讓AI認出這是梵高風格的畫??已經是一個耗時耗資不菲的項目了吧,何況讓他創作出屬於自己風格的作品。

認不出來怎麼能創作出來呢?也許能,但我暫時想不到辦法繞過這一步。

同時,人類的創作也是來源於一切經歷經驗的,把一些體驗,一些感知、感受、知識轉換然後體現在繪畫上,變成一種自我的風格??恕我愚鈍我根本不知道這個過程是如何發生又該如何描述啊!!以及我也很好奇可能的話AI會有什麼樣的感受和感知啊!!!這仍舊是個世紀難題吧??


3.從美術角度看,畫的藝術價值如何?

藝術價值,是和時代有關的,具體一點就是政治經濟文化咯,不同地域都會有所分異,哪怕是全球化的現在。放在國外,很大的可能,這些畫是沒有什麼卵藝術價值的。那些很小的可能,是指某些例外的個體差異,但是這不現實,老話說物以稀為貴。

那麼是不是這個軟體打破了這個藝術價值的定義?很明顯跟這軟體並沒有什麼卵關係,哪怕你今天,好吧,一年前,找到一個很會畫梵高風格的人,他的作品也沒有什麼卵藝術價值。齊白石說過:學我者生,像我者死。

發現一個有意思的悖論,一件有藝術價值的作品被創作出來以後他就失去了其藝術價值(別管我,跳過這句。)

再其次,國外的架上繪畫,是比較灰主流的藝術形式,說人話的話,就是繪畫,已經不是藝術的主要表現形式了,甚至成為了比較次要的部分。

這個話題先打住吧,有興趣的評論慢慢聊。

順帶一說:其實「研究出這個程序」這件事,就很有藝術價值啊!!

4.這項技術今後的大規模發展,是否會導致一些畫家失業?(這裡指的不是頂尖的有自己風格的大師,而是水準相對平庸的畫匠。)

這個問題,也是一下說不清。

首先,在技術方面:大規模發展:

第一:大規模。能夠大規模,能夠推廣,能夠普及,其難度是不言而喻的,歷史埋沒了多少好東西,也有多少好東西看起來贊贊然而並沒有什麼卵用。所以我傾向認為這個程序大規模應用還是一個相對小概率的事件。第二:發展。明顯大家可以見到,這個程序創作出來的一些視覺素材,用來娛樂是夠夠的。但是要商用,那是差得遠遠的。這個程序要製作出達到商用程度的視覺素材,還是??但是!!!拿來做提案稿,作示意稿真的是超贊啊!!!解放多少雙手!!!這還是我突然想到的,我得趕緊琢磨下這玩意怎麼用。那個用動畫渲染照片的兄台,哪怕你找一張高品N倍的照片,渲染完畢以後,在去跟原動畫對比一下,尤其是動起來以後,你就知道,儘管大效果看著唬人,但是離直接用,還是差了一點。(重點是這一點就差很遠,很遠,很遠,邊際效應。)

探討完該程序大規模發展的可能性後,再來梳理一下所謂「水準相對平庸的畫匠」。題主的定義是:『區別於有自己風格的大師』

我想,這種簡稱『庸匠』的人,基本上,是屬於失業邊緣的人群,即使是在現在。前提是,這個水準平庸的畫工是他唯一的謀生手段。

什麼意思呢,首先,大多『庸匠』,不是靠這一手謀生的,手繪對他們來說只是個有用但不是主要體現自己價值的能力,他們可能潛伏在各行各業:廣告、設計、電影、漫畫??(漫畫行業不單只有負責畫畫的。)對於他們來說,如果有工具能夠代替,說不定他們還鬆了口氣呢:『老總又讓我畫東西了,麻辣個蛋蛋誰讓組裡只有我會畫呢可是我畫得真的很渣啊!』

而,想要單靠畫畫這一手,就站住腳,那麼實際上題主所說的『有自己風格』,並不是一個非常高的要求,我想大多數的「畫師」?(不知道該怎麼稱呼)。有自己風格是個相對的概念。靠這一手吃飯的,多數會有自己的風格(比如你繪畫帶有莫奈的風格,那也是有自己風格(畢竟莫奈他老人家掛了),當然也許會和莫奈有些許不同,否則就沒那麼有意義了)。

而大家都有自己風格,難道都是頂尖大師了?當然不啊,區別在於,某些牛人更有風格嘛。他們風格比較屌,比較潮,比較新,並且在自己的風格上也走得比較遠(更成熟、更有張力、更有細節等等)

所以,那些『庸匠』的比例,對於整個美術行業來說,其實並不高。不過我沒有具體數據,同時我對動畫原畫行業的了解也不太深入。根據我主觀臆測,我所謂的『失業邊緣』,是指這幫人,是根本沒有任何核心競爭力的,這一種失業,和題主說的外部衝擊帶來的不可抗的失業,大概是不太一樣的。

這些『庸匠』的競爭力一般都是年限和資歷,但人是會成長的,他們不可能一直停留在這個階段。而不怎麼成長的,多數是不願意成長,大部分的原因,也許是不愛這個工作吧,那麼,被一個程序代替,迫使他們另謀出路,對他們何嘗不是一種解脫?再說了,這種所謂『庸匠』還是要留下一大部分的,校對、修補、調整、檢查??等等。程序替代人類真的不是就說說這麼簡單的事情。

(我把題主所說的『畫家』定義成以繪畫為職業的各路工作者,比如插畫師原畫師等,雖然題主所說所說的『畫家』更容易被理解成藝術家,但畢竟藝術家是不會失業的)

那麼綜上所述這個程序要讓美術行業為之天翻地覆,我想這是一個極小概率事件。


但是這個程序超級有意思啊,技術上應該蠻屌的。

能集成到APP里那也是極好的。


kaishengtai/neuralart · GitHub
源碼在此 有誰知道這個怎麼用么 不懂程序淚哭廁所啊


科技發展的目的就是讓所有人失業... ... 然後... ... 又發現新的職業給人... ...
人類就是自個玩兒自個... ...


話說……吵來吵去,這不就是波普藝術嘛……


大概相當於,overture或者西貝柳斯這種軟體,升級到能模仿演奏家的水平,你要說它的藝術水平,大概也就是讓外行聽個樂而已,這個也一樣,就其「藝術性」而言,讓外行看個樂而已,表面形式。

又好比電影里經常出現黑板上寫下很多公式,前面站個教授在講物理,外行一看哇好高深,其實裡面就是和內容無關的方程而已。

當然我想說的只是這玩意和藝術沒什麼關係,別的方面我也不懂,但一定是有意義的,我想。


我來回答234。


2.此技術的發展前景如何,程序是否有一天會發展到可以脫離模仿,自己創造畫風獨立創作?

先不管發展前景,單說創造風格和獨立創作。很多作品的風格一旦脫離了其歷史背景和邏輯就是瞎塗,創造一種新的繪畫方式並不是一件多麼困難的事情,誰都可以做到,問題是別人會不會認同。如果不考慮別人是否會認同的問題的話那麼按照現在的技術就能開發出接近無窮的畫法,比如給照片添加一些噪點算一種畫法、添加更多噪點算另一種畫法、添加非常多噪點又算一種、全是噪點還算一種,處理方法太多了,但是別人會不會認為這是一種繪畫風格呢?如果需要其他人認同的話首先需要確定作者的身份,作者是誰?程序的開發者?使用者?還是程序本身?作者需要對自己創造出來的畫法給出一個合理的解釋。只有這種解釋被其他人普遍接受之後相應的畫法才會成為畫風。

因此想要讓程序自己做到創造畫風的話,還需要給程序增加用人類的語言與人溝通的能力,起碼是能用語言描述自己動機的能力,為什麼用這種畫法表現這種畫面/對象。這怎麼也得是AI了吧?

3.從美術角度看,畫的藝術價值如何?

如果要談藝術價值的話,那麼就要考慮到對藝術史的拓展,那麼還是要牽扯到誰是作者的問題。假設咱們改變今天的藝術規則,把作者的概念從人類身上擴展到人工智慧上,那麼程序是可以成為作者的。

作者在這方面需要做什麼?需要創作出藝術史上從未曾出現過的新的藝術表現手段(不管藉助的是理論、觀念、技術、材料或者是什麼),那麼程序首先需要掌握藝術史,然後能夠理解藝術的發展邏輯,在新的藝術理論影響下(現代藝術階段是多人可以共用一個理論,不過現在不行了,一人一個理論,拿別人的理論用了算抄襲)創作出新的藝術作品。

這已經不是簡單的AI了吧?

4.這項技術今後的大規模發展,是否會導致一些畫家失業?(這裡指的不是頂尖的有自己風格的大師,而是水準相對平庸的畫匠。)

會導致非常多的畫家失業,除了走在藝術史發展最前沿的那一部分人以外絕大多數都會失業。不過這一部分人可以去干別的賺錢。


[1705.04058] Neural Style Transfer: A Review 這裡有一篇總結從Gatys等人提出的第一個風格化遷移演算法之後的一系列跟進工作的綜述文章,對應的Github項目鏈接為ycjing/Neural-Style-Transfer-Papers,對現有的風格化遷移演算法以及相關代碼資料做了一個匯總,並且在文章中對圖像風格化遷移可能的工業界應用以及未來可能的發展方向進行了討論,大家如果感興趣可以參考一下,希望能夠幫助大家快速了解這個領域的進展情況~


1.此程序或演算法是否一種革命性的新成就,或者只是現有技術的複雜化?

根據論文說明,用的神經網路分類,所以是現有技術。
首先說下這個論文牛逼牛: 發在CVPR上,頂級會議,很牛。
但是傾向於工程解決方法,非理論。


2.此技術的發展前景如何,程序是否有一天會發展到可以脫離模仿,自己創造畫風獨立創作?

商業前景廣闊; 程序是監督學習,所以不可以脫離模仿。


3.從美術角度看,畫的藝術價值如何?

有美術裝飾價值,無藝術價值。


4.這項技術今後的大規模發展,是否會導致一些畫家失業?(這裡指的不是頂尖的有自己風格的大師,而是水準相對平庸的畫匠。)

現在並沒有「畫匠」這一職業,你以為是文藝復興么。


5.這程序有下載或在線版么?如果能找到的話求銜接。
王峰 答案已po

============================================

這個論文既不是人工智慧,也跟藝術沒關係。
知乎上對AI的誤解大概跟量子力學、黑洞差不多了。

這篇論文核心價值是把部分artistic style用neural network 方法pattern化了。

仔細看圖也可以知道,主要是把紋理和顏色進行了模式化。
好就好在出圖效果非常棒,實用化程度很高。

============================================
非機器學習的人
討論藝術或者人工智慧的答案很多,我認為對大眾正確理解機器學習是一種損害。
一、
artistic style 在藝術里,是對作家作品的一種概括、總結。
style並不是藝術要達成目標,所以即使程序對artistic style 模式化了,也跟藝術沒什麼關係。

二、
機器學習討論artistic style的時候,意思僅僅在於「看上去像」。
機器學習的學者根本不在乎「artistic style是否能模式化,模式化的artistic style是否有藝術價值」這種問題。

外行可能不太理解,實際機器學習的圖像識別領域一直是「表現主義」的,比如做漢字識別的時候,
沒有人考慮筆畫筆順,即不會考慮「邏輯上的漢字」如何建模。
而只是考慮這幅圖「看起來像」哪個漢字即可。

包括人工智慧一樣,學界幾乎不在乎思想、靈魂到底如何建模、如何數學描述、如何實現這種問題,而只考慮如何讓程序輸出」看上去像」個正常結果罷了。


這個軟體如果能普及,那一眾「轉手繪」大師就面臨失業了,哈哈哈~感覺這在搞美術的人眼裡完全是大快人心啊。不過,真正用手畫畫還不能被代替。程序上我不懂,但是看上面那幾張圖,油畫因為風格太強看不出,本來也是比較抽象派印象派的。素描轉的完全是一塌糊塗,貓下巴上那條黑色的斑紋他給畫的跟多了道顴骨一樣,因為程序只會照貓畫虎,他不會分析幾大調子黑白灰明暗交界線,只是照著畫而已。你拿古典油畫那種特別細膩的畫法轉著試試看,賭五毛他也得懵逼。


樓上給的demo都是用torch寫的。
安裝方法Google搜索torch7即可。

自己對二次元的效果還是蠻感興趣的,今天用自己的相片和新海誠的照片試了試,得到的結果還挺好玩的。

大家笑笑即可。:)


推薦閱讀:

NIPS 2015有什麼值得關注的亮點?
有人說機器學習近些年的發展只是依賴於「大數據」和「高計算」,在演算法上並沒有突破,這是在影射深度學習么?
CNN(卷積神經網路)是什麼?有入門簡介或文章嗎?
Yoshua Bengio為什麼能跟Hinton、LeCun相提並論??
寒武紀神經網路處理器效能如何 ?

TAG:人工智慧 | 計算機 | 美術 | 神經網路 | 科學 |