將來的番劇是否有電腦模擬聲音取代聲優(CV)配音的可能?

人物角色的外貌完全可以利用電腦來繪製,而人物聲音目前多以現實中的人物來配音(至於有哪些番劇是模擬合成的聲音我就不清楚了)。
此處的模擬聲音,可以是借原有聲優的聲音自由組合(如藤田咲的聲音用於初音未來),也可以是完全不依賴任何聲優而模擬的聲音。


不請自來。一個蠻有意思的問題,不當之處還請大家指正。

先糾正一個問題中的小誤區:CV並不是直接指聲優這個職業。
讓我們看一下ニコニコ大百科的解釋:

CharacterVoice - 主にアニメ?ゲームなどの登場人物を演じる聲優のこと。和製英語。ラポート社の雑誌?アニメック?で作られた造語で、休刊後に一部のスタッフが移って創刊した角川書店の雑誌「月刊ニュータイプ」によって普及した。英語圏では主にVA (VoiceActor)。

再看一下日文維基的解釋:

  • キャラクターボイス (character voice) - 聲優名の前にCVと付けキャラクター擔當を表す。

也就是說準確的應該指的是本作品中的出演角色聲音的各個擔當人。不過最近大家都基本上混著用了我也順其自然好了。語言就是這樣。。╮( ̄▽ ̄)╭

進入正題,虛擬聲源究竟有沒有可能替代真人聲優呢?
在現在的環境下,有需求就有生產。我的答案是:不太可能。
首先我們暫且不看聲優行業,照現在的趨勢來看,V,U,C三家有沒有威脅到J-pop歌手的地位?答案是明顯沒有。雖然都是音樂領域,但是受眾有著根本區別。從VOCALOID誕生的那天起虛擬聲源就已經將自己定位為二次元主打的產品。同樣是三次母音樂,死亡金屬哥特搖滾逐漸流行,但是威脅到歐美流行音樂的份額了嗎?我在我的另一個答案VOCALOID CHINA的音樂圈子過於局限,原因出自何處? - 幽子的回答中提到過:

但是在我們安利給別人的時候有一個常常被人忽略的問題:看不上VOCALOID的人和喜歡上的人有一個很重要的區別,就是前者的重點是歌聲,後者的重點是歌姬。舉個例子:MEIKO的聲線好聽嗎?不好聽。至少個人認為除了仕事してP的《黃泉桜》之外聲音讓人感覺不是一般的違和。但是喜歡的人多嗎?多。年長組的同人一大把。同樣,你在聽《ココロ》的時候跟你母上聽的時候絕對感受的重點是不一樣的。我們在聽的時候腦子裡無意識的認為這是一個萌出血的萌妹子在唱歌,而母上的重點絕對是「這女的聲音咋那麼尖啊啥玩意兒這是blabla」(Rin醬我還是愛你的(つД`)ノ)。可以說在V家中人設與音源是有同樣的地位,GUMI在開始的時候因為人設的原因得不到認可,但是反過來看MAYU雖然音源不夠上等,但是人設及其病嬌屬性使得前期獲得的很高的關注。(給你們講個笑話:緣兔的MC解說)同樣,你們也不會覺得MIKU是因為聲音火遍全球的吧。

正好前些天索尼又搞了個大廣告:「VOICES」 tilt-six Remix feat. Miku Hatsune_VOCALOID·UTAU_音樂_bilibili_嗶哩嗶哩彈幕視頻網
暢遊在秋葉原的蔥姬,特效爆炸,內容也很契合,良調教不算神。那麼問題來了:索尼是因為看上了初音的什麼才有了這個廣告的企劃?就算是現在,調教圈絕大多數的翻唱調教依舊以仿造真人歌聲編輯參數,甚至眾多狗啃黨照著真人歌聲的波形一點一點摳,虛擬音源到現在為止一直都是以還原人聲為最高標準。而且只是音源好還不行,這是個看臉的世界。
那麼當時V家的初衷是什麼呢?作為一個有力的工具,把人聲變成一個可以編輯的樂器,讓那些沒有機會沒有能力請業餘歌手或專業歌手的作曲家可以為自己的作品中加入人聲,降低音樂製作門檻。作為正面結果之一,相較三次母音樂的聽眾,V家音樂的聽眾會將注意力移向作曲者本身,更加註重音樂本身而非歌手。作為另一個較有爭議的結果,各個虛擬歌姬也出現了偶像性。
那麼我們就從虛擬音源的兩個特性——工具性和偶像性來分析一下究竟適不適合代替聲優這一職業人群。
我們現在公認的一點是:語調教比普通調教歌聲的難度高出不止一個檔次;並且以現在的技術進行操作非常耗時。比較常見的一個例子就是初音的演唱會,語調教出來的音節長度很短,而且有些句子還略顯生硬。語調教需要極好的音感和節奏感,沒有數位板參數畫起來一般都能把人逼瘋。。就算是拆音黨調教一般難度的曲子每天晚上都能抽幾個小時,為了達到良調教的程度兩周出去都是再正常不過的。根據現在日本動畫的放送周期多數聲優用一天時間配一集,這顯然是跟不上業界要求的。而且在配音過程中例如親吻、抽泣這樣的特殊效果音,以現在的音源非常難完成。
那麼你們會質疑了,技術是會進步的,就算是現在也有CeVIO和VOICEROID這樣的存在,為什麼我還是持否定態度。
還是先來看一下音樂這方面,虛擬歌姬的原創曲在調教的時候是不會有真人歌手的聲音作為參考的,很多地方的唱法只能調教師自己揣摩,而且並不是人人都是M神神無月這樣的大佬,八爺這種比較特殊但是基本上也沒有什麼翻唱能超越。然而我們身邊聽V家歌只聽翻唱不聽本家的人難道很少嗎?唱的正確和唱的好聽,這是兩個層面的問題。順便說一下,C家的鼻音略重,ONE和さらら都有這樣的特點,而且ONE說話的時候明顯偏幼,需要改良的地方較多;VOICEROID真正打出來的也就只有結月ゆかり,當旁白沒問題,但是用作對白的話不仔細調整語調還是偏平。
音樂尚且如此,配音中的重音,斷句,氣息節奏,聲音力度,情感運用等等相當主觀的各個要素又怎能是調教師個人就能獨斷的呢?不得不說配音中藝術性的比重很高。聽聲優廣播節目比較多的聲豚們應該都對配音現場的那些軼事很有了解,音響監督經常會讓聲優嘗試不同的聲調、力度去重複同一句台詞,最終取其最好的一個版本,而且監督、音響師和聲優三方都能充分交流。再甚者,一個聲優配不好的地方可以直接換旁邊其他人頂替,這也不是沒有的事情。但是如果你把這個工作交給調音師調幾個不同的版本出來,首先相比聲優時間成本就成倍增加,調出來之後還不一定是監督想要的效果。就算把工作分給十幾個調音師去完成,我們用相同人數的聲優錄製一集動畫用一天就能完成錄音,基本工資一集一萬五日元,最貴的四萬五,這個時間成本和金錢成本是僱傭調教師能代替甚至減少的嗎?一集二十分鐘的對白數可能就已經讓調教師昏厥了。而且聲優單靠配音的錢是吃不飽飯的,兼職打工的人比比皆是,那調教師這種技術人員也跟著兼職?似乎行不通吧。
最後說一下偶像性。如我上面引用所言,虛擬歌姬的受眾中會將人設看的較重,也就是說人們在聽歌的時候心中會有一個潛在的形象,無意識或有意識的認為這個二次元形象的歌聲在傳達給自己,一個女神/男神在這兒唱歌。N站的V家曲中非常多的初音曲其實並不適合初音的聲線,或者有比初音更合適的歌姬,但是P主們依舊會用蔥姬來唱,原因就是能有效增加播放量。我關注的有幾個冷門P主比如プリュ這個鏡音廚、人生P這種巡音廚雖然都實力不凡,但是播放量一直都是那麼慘淡,「過氣歌姬」呵呵呵。也有一種說法就是N站的冷門良曲鏡音是最多的。稍微扯遠了點,總之虛擬音源偶像性里包含著非常強烈的身份認同,音源本身的形象就是存在意義之一。然而配音是什麼?配音是以聲音為媒介塑造一個新形象。作為一個虛構人物,TA的獻聲者如果是一個真實存在的人的話並沒有什麼關係,但是TA的背後也是一個塑造出來的虛構人物的話就會出現「表面形象」和「背後形象」的衝突,一部分觀眾甚至有巨大的違和感。如果拿GUMI去配枝葉柚希,多多少少都會產生角色模糊,甚至無法區分究竟是誰存在在那裡。當然你可以開發新音源不要人設,動畫公司開心了,面向普通用戶的銷量又是問題。而且還是上面的問題,這個聲源開發成什麼地步才能幫助動畫公司節約成本或達到超越真人聲優的效果;在這個聲優偶像化的時代,這樣的音源又怎樣才能代替真人聲優對作品的宣傳功能和其他娛樂效果。這些都是市場看中的問題。

單純的機械人聲這部分不太了解,希望其他答主能補充。以上。


有是有可能啦,最近看的很多mmd作品都是用電子音配的。叫什麼來著…
但是目前技術還不達標,就算是業界黑科技cevio也遠不能做到如人類般的豐富感情。倒是已經有很棒的vocaloid調音作品(http://www.bilibili.com/video/av6095797),我不清楚其中的成本,不過要調上整整20分鐘的語音,有點吃力不討好吧。

板繪也是人畫的,不要搞錯了…


這個是不可能的。


你這個問題問的跟「將來的音樂行業是否會被人工智慧AI從作曲/演奏/演唱方面取代」一樣沒什麼實際意義......


推薦閱讀:

為什麼下完雪的世界特別安靜?
昨天晚上睡覺,聽到「啪,啪,啪」3 聲巨響,這是什麼?時間大概是3、4點左右,聲音巨大。
如何使電影的聲音既讓人心裡覺得「響」,但耳朵又不覺得「響」?
聲音是可以疊加的嗎?

TAG:聲音 | 日本動漫 | 配音演員 | 洛天依 | 日本聲優 |