微軟小冰Diss虛擬歌姬,惡意營銷背後的科技藝術之爭

作者:Pharisees@白鵝紀

這幾天想必不少讀者都聽說了微博上的一場紛爭:口無遮攔的微軟小冰挑釁V家粉絲,導致即將上線的唱歌功能被宣布自行中止。

眾所周知,小冰是微軟亞洲研究院推出的一個人工智慧虛擬形象,而Vocaloid則是YAMAHA公司開發的一款基於語音合成技術的電子音樂製作軟體,幾乎是八竿子打不著的兩個圈子,怎麼就能吵到一塊兒去呢?有人認為這場爭論緣起「微軟運營不尊重V家粉絲」,也有人視為是「V家粉絲抱殘守缺攻擊新生科技」,到底哪一方更有理?今天筆者就為大家梳理一下事件的來龍去脈,以及背後的理念之爭。

小冰人設:愛惹麻煩的處女座少女

禍從口出的處女座小冰

今年8月,微軟小冰發布了第五代版本,陸續解鎖了更多功能,而此次引發風波的,是其於9月底上線的人工智慧歌手深度學習模型以及用於訓練、調教其唱歌功能的示唱人平台,可以說是正式進軍虛擬歌手領域。

而在其微博宣傳的文案中,小冰也把矛頭直接指向了「前輩」,虛擬歌姬洛天依、言和等:「這次解鎖,我衝擊的不是人類,而是傳統的虛擬歌手。人類們,忘了漫長辛苦的手工調教吧。你只需清唱一遍,我就能學會你的情感和演唱風格,在五分鐘內,完成由你訓練的歌曲。」

而小冰在隨後的微博發言中,也多次表達了對傳統調教方式的不屑:

需要指出的是,本次事件中引發爭議的微博內容都是由小冰背後的運營團隊模仿其語氣創作、發布的

「過時」、「唱的不行」,包括在網易雲音樂相關單曲下評論「隔壁家老洛(洛天依),你的嗓子修好了嗎」,小冰偏激的發言和強烈的攻擊性自然引發了部分V家愛好者的不滿,引發了大量爭吵,甚至有Bilibili UP主製作了《微軟小冰,請滾出中國市場!》這樣過激的視頻表達抵制情緒。

目前視頻已被刪除

在一片爭議聲中,小冰背後的技術團隊,微軟亞洲互聯網工程院決定「息事寧人」,調整管理許可權,暫停向公眾開放示唱人平台,事件至此似乎告一段落……了嗎?

當然沒有。道歉發布後,小冰頗不情願的態度,和擺出的「被迫害」形象更進一步激發了V家部分粉絲的怒火:明明是你出言不遜挑釁我家虛擬歌姬在先,現在又擺出一副受害者形象?於是指責聲反而更烈;

另一方面,對於部分群眾來說,事件的面貌變成了,一個落後技術的愛好者團體打壓將要取代他們的新生技術,於是紛紛站在小冰一邊,大聲嘲笑起「抱殘守缺」的「二刺猿」。實際上,硝煙並未散去,而考慮到小冰背後的團隊並未完全放棄唱歌功能,小冰的音源和模型還會「不斷進化」,可以預見的是,未來的「戰爭」或許還會更加激烈。

然而現在回顧這些爭吵,不難發現一些弔詭之處:明明是針對小冰「Diss運營」的抗議,怎麼就扯到技術層面上去了?而在爭論中,不僅是小冰一方,甚至連部分V家粉絲以及大部分圍觀群眾也都默認了,小冰的唱歌水平確實要比Vocaloid要高,轉而談起「重要的不是技術是情懷」之類的言論——先不論情懷,單論唱歌水平,真的是小冰更高一籌嗎?

並非如此領先的小冰

大眾之所以會認同小冰「技術更厲害」,多半是從小冰放出的那幾首歌曲的對比中聽到的:小冰的聲音比起洛天依「更像人聲」,「唱歌水平更高」,從而得出了現在的結論——但是實際上這點並不正確。

請思考這樣一個問題,當我們聽虛擬歌姬們唱歌時,我們是在聽什麼? 而各位P主們選擇Vocaloid這個軟體進行創作時,他們的目的又是什麼?當然了,這是一個無解的問題:每個人都有各自的答案,有人希望聽到用電子創作出接近人聲的神調教,有人追求電子感,也有人追求超出人類極限的歌唱效果……只是喜歡旋律,相比之下寧願聽到真人演唱的也大有人在。

實際上,這也是以Vocaloid為核心的創作群體,也就是我們俗稱的V家的最大優勢:不同的P主帶來的不同風格,以及衍生而出的唱見等群體,讓不同種類音樂的愛好者都能獲得滿足——而非單單只是在「接近人聲」這一個向度上;而這種作品多樣性上的差距在小冰的宣傳中顯然被掩蓋了過去。

目前小冰公布的幾首作品都偏向「口水歌」,風格、聲線都顯得有些單調

而這種差距多半是兩者所採用的合成技術的不同所導致的:Vocaloid採用的是「拼接合成」技術,創作者需要像拼圖一樣將單個音節拼合在一起來完成最後的作品,一方面作者可以對自己的作品實現最精確的控制,但另一方面語音的流暢程度也很看作者調整各項參數的功力;而小冰目前看來為了追求自然和流暢度並沒有採取這種處理方式,因此在調教的自由度上遠遠不及Vocaloid。

Vocaloid的創作界面,每個發音都需要單獨調整

此外,即使是在引以為傲的「人聲」上,小冰的表現實際上也難稱頂級:2013年,CeVIO公司就公布了旗下基於HMM合成技術的聲音創作軟體CeVIO Creative Studio,和其虛擬形象「佐藤莎莎拉」,而名古屋工業大學開發的Sinsy系統更是早在2009年就已發布,2015年還追加了中文聲音。而這兩者呈現出的人聲合成效果,在聲音的擬真度上可以說都不遜於今天的小冰。

HMM合成通過提取人聲中的特徵量建模,可以最大程度保留人聲的特徵。

總的來說,單就小冰目前的表現,無論是人聲合成質量還是創作的多樣性上都還沒有戰勝V家,反而是通過不斷的偷換概念——先是將「唱得更像人類」等同於「技術更先進」,然後將小冰以一個虛擬形象的身份向虛擬歌姬進行挑釁的競爭行為,等同於了先進技術對落後技術的取代,最後將「V家粉絲抵制惡意營銷」等同於「要情懷不要科技」,將自己的道歉描述成「技術暫時敗給了情懷」——來營造出自己技術領先的假象,這種營銷手段著實稱不上正當。

實際上,就在在微軟亞洲互聯網工程院的聲明中,他們自己也承認了現階段並沒有勝過虛擬歌手的質量,反而又一次拿「未來的全面超越」偷換之前的「豪言壯語」。

當然,這並非在說小冰的唱歌功能一無是處:示唱人平台沒有門檻,調教難度低的優勢切實擊中了Vocaloid作為一個創作工具調教繁瑣、門檻較高的痛點,因此在上線初期也吸引了不少著名P主的目光。也正是這兩點,體現了小冰的唱歌功能的最終目標,和她與Vocaloid之間的本質區別

當人工智慧遇見藝術

在這次的衝突中,另一個常見的誤解是,小冰和Vocaloid一樣,只是一種「電子樂器」罷了——對於小冰來說,這絕不是她的最終形態。作為一個人工智慧,小冰的最終目標是介入「人的領域」:自主內容創作。

小冰創作的詩歌

在詩歌創作領域,小冰已經完成了從模仿到自主創作的進化。由於弱人工智慧的技術所限,小冰創作出的詩歌還是「得其形而不得其神」,小冰也明白自身的不足,宣布開放詩歌創作平台,致力於「輔助人類創作詩歌」,換言之,其實是以一種曲線救國的方式進入內容創作領域。

而在某種意義上,小冰的唱歌功能和Vocaloid的一樣,都是利用技術降低了創作的門檻,但根本性的不同在於對這一問題的回答:科技在藝術創作中應該扮演什麼樣的角色?

儘管當下小冰多數時候只是扮演著「翻唱」的角色,但「日本版小冰」凜菜已經在東京電玩展上發布了由自己作詞和演唱的首支單曲;顯而易見的是,小冰的唱歌功能,正沿著詩歌創作的足跡一步步進化:通過深度學習優秀作品的經驗,再以反哺的姿態鼓勵大眾的創作。小冰所代表的無疑是一個激進的科技派:利用科技的發展降低、乃至消除藝術創作的門檻,讓技術引導人類的進步。

而Vocaloid方面,儘管YAMAHA公司也一直在不斷探索前沿的語音合成技術,在音樂創作上採取的卻是最為傳統的姿態:提供一個樂器,但將創作的自由完全歸還給創作者。這種態度最大程度上回歸了藝術的本源:人的自我表達,但另一方面,也在客觀上保留了創作的門檻。在Vocaloid的圈子裡,真正創造價值的仍然是創作者本身,在這裡,技術讓位於了人類。

當然,以小冰的人工智慧水平,這裡並不需要討論「人工智慧威脅論」之類的東西,但現實的問題確實擺在眼前,在藝術創作領域,「大眾」、「簡便」的工業化生產似乎已經近在咫尺,而這種流水線生產真的就能完全取代專業而精密的調教了嗎?

對於創作者而言,「藝術創作」究竟是怎樣一種行為,而對於觀眾們來說,他們欣賞藝術作品時,希望接收到的又是什麼呢?也許這些,才是這次小冰和V家的口水大戰之中,更加有意思的部分。

更多精彩內容,歡迎關注【白鵝紀】微信公眾號!

推薦閱讀:

宅人故事丨音樂人阿良良木健和大家的洛天依
開天闢地的電子音,永不熄滅的創作魂——VOCALOID十年談
以不專業的角度淺談Vocaloid那些曲子——前言

TAG:VOCALOID | 微软小冰 | 人工智能 |