cevio、voiceroid和Megpoid Talk有何比較?


@西行寺幽幽子 的答案其實跑題了。這個題目問的是三個Talk(語音合成)機能的軟體的對比。

目前經常被對比的就是C和V(註:在只提Talk時,此處的V指Voiceroid而非Vocaloid)。

簡單地說:其實沒有太大的區別,最關鍵的區別只是聲庫製作時質量夠不夠(採樣數、參數調節等)。

因為Voiceroid和CeVIO同屬HTS引擎,都是名工大某實驗室(leader:德田惠一教授)搞的那一套。最早的應該是Open JTalk。後來Vocaloid火了之後,AHS就用源於(開源的)HTS的AITalk語音合成引擎做了Voiceroid,所以事實上Voiceroid和Vocaloid從技術角度講關係不大,和CeVIO反而是近親。而後來這實驗室自己把HTS又魔改了一下,搞出了一個Song(歌唱合成)引擎SVSS(也就是Sinsy),連同HTS一起與某公司合作進行商業化,就有了CeVIO。所以說CeVIO是親兒子,在引擎方面應該會有某些Voiceroid、JTalk、CrazyTalk等等不具備的優化(通過分析C聲源並與OpenJTalk聲源對比,已經驗證了這一點)。不過AITalk也對HTS進行了一些魔改,與C的效果的細微差別請各位自行評判。

順便一提,2017年發行的同樣是為Vocaloid角色設計的朗讀軟體「音街ウナTalkEx」只看界面就知道是Voiceroid的近親了,再仔細看下狀態欄,詞典後綴名也與Voiceroid完全相同,想必是Internet社委託AHS搞的。

【Update】Megpoid Talk不是HTS。這個才像是V家陣營的產物。(「關於」窗口中有寫語音合成技術來自ANIMO)

與HTS系相比,其缺點較為明顯:調整能力非常有限。一方面是感情基本上不能調整(除非另外配置聲源),另一方面是音長、音高等參數的調節範圍明顯更小。不過優點是可以導出工程到Vocaloid,意思是讓其他只會唱歌的小夥伴們也能試著說一下話(雖然效果沒法保證……)。另外一個有趣的功能是插入效果音,事先錄製好的GUMI咳嗽、嘆氣、打哈欠之類的聲音,可以在文本中間插入,效果還是挺萌的,建議C陣營學習一個。


CeVIO:通過發聲規律和少量波形合成,自帶神調教,加呼吸音,因此作品的水平線也不會有太大差距(或者說對調教師的需求不是很大)。

對演算法依賴性較大。默認參數都很強勁(與v相比)

在歌曲合成同時也支持語音合成。

佔用空間較小。

VOCALOID:通過錄好的cv發音進行合成。

更依賴於調教師一點,對於各項參數的調整比較吃力,成型作品水平很大程度上依賴於調教水平,但是因此也更多樣化,更能打出鮮明的個人色彩旗幟(比如IA就有jin的掐脖子,kemu的御姐等等)

佔用空間相對較大。

Megpoid Talk:我並不認為megpoid可以單獨列出來討論,首先megpoid本就是gumi的另一稱呼 作為i社開發的vocaloid人物,而且talk也只是衍生的朗讀聲庫,為了彌補vocaloid只能合成歌聲的不足(當然神調除外)

關於VOCALOID和CeVIO:兩家應該算某種程度上的協作關係(大概?)比如IA在保留v家歌唱聲庫的前提下開發c家朗讀聲庫(IA小天使saiko!) 還有IA妹妹ONE醬也是c家的


推薦閱讀:

微軟小冰Diss虛擬歌姬,惡意營銷背後的科技藝術之爭
宅人故事丨音樂人阿良良木健和大家的洛天依
開天闢地的電子音,永不熄滅的創作魂——VOCALOID十年談
以不專業的角度淺談Vocaloid那些曲子——前言

TAG:VOCALOID | 語音合成 |