顫抖吧人類!AI 正佔領中日播音主持人行業
「和歌山市今天將會有高溫天氣,中暑的風險很高。」在 7 月 31 日 日本 NHK 電視台的新聞當中 ,出現了一位看不見形體的虛擬主持人。名叫「奈奈子」的虛擬主播,在日本和歌山市的一家社區廣播電台當中就職,她會在整點時隨著音樂的節奏,為大家報告當地新聞以及天氣信息。
不僅是「照本宣科」,AI 擔綱的主持人還可以自己生成內容。前幾天發布的第五代微軟小冰,和日本廣播電台 J-WAVE 與 IBM 合作開發的 AI 助理主持人 Tommy,都陸續在今年 8 月亮相。看來,一些重大的變化正在廣播電視業界發生。
「奈奈子」:由電台業餘程序員開發而成
我們先來認識一下和歌山「エフエム和歌山」(FM 和歌山)廣播電台的播音員「奈奈子」。「她」使用亞馬遜出品的語音合成技術,發出的日語語音讓一般的日本人聽來,根本不會有奇怪的感覺。在人手缺乏的深夜、凌晨和災害時期,都不會有人值守, 此時可以由「奈奈子」代為廣播已經安排好的稿件 。
當地報紙《和歌山經濟新聞》採訪了電台 ,在拍攝於該電台播音室的截圖當中可以一窺「奈奈子」的真身。「她」實際上是用非常簡單的一個 HTML 網頁,調用了亞馬遜語音技術的 API 代碼。在網頁當中有一個文本框,輸入一些提前編輯好的信息,點擊定時,就可以讓「奈奈子」在時間到來的時候自動讀出。
FM 和歌山是一家低成本的社區電台,為社區居民提供應急信息和生活服務。該局的策劃負責人山口誠二是「奈奈子」的「父親」,他是該市土生土長,目前 35 歲。2004 年去美國留學兩年後回來,他成為一名軟體開發者,在父親作為理事長的社區電台下工作。
因為 FM 和歌山的頻率是 87.7MHz,根據諧音有一個昵稱叫「香蕉 FM」(Banana),山口給這個虛擬主播起名也是音近的「奈奈子」(Nanako)。他採用的是亞馬遜 AWS 提供的簡單的代碼和伺服器資源,所以其實開發難度只是中等。
亞馬遜日本的負責人將「奈奈子」認為是 AWS 和其他人工智慧服務的一個優秀案例,作為「個人開發者」,山口和 FM 和歌山證明了簡單的使用就可以讓看似普通的技術發揮巨大和意想不到的功效。
NHK 同時報道稱,在日本國內實現語音合成技術的不止一家,但在所有市面上的同類系統當中,亞馬遜合成的聲音更加自然。無疑,這會讓讀者有一種「一家美國公司對日語的理解居然強過日本人」的感嘆。
小冰和 Tommy:與人類對話,智能程度和複雜度更高
「奈奈子」這位機器播音員還僅僅是念了人類提供給它的稿子,而在兩天前剛剛宣布推向市場的第五代微軟小冰,則能夠由人工智慧自動生成上下文的語句,並且由合成的語音播報出來。
在上上周日北京青年廣播晚 9 點到 10 點的節目《青春聯盟星光版》當中,我們可以在最開始的「更值錢」環節,聽到一位名叫珊珊(音)的主持人和小冰一同為大家主持節目。
「最近我聽到很多人都在吐槽辭職理由,什麼天氣太熱了要辭職,心情不好了要辭職,老闆不是我喜歡的類型也要辭職……各種各樣吐槽的辭職理由。珊珊姐姐,看大家在職場中這麼煩悶,我也想在『更值錢』欄目里吐槽一下了呢!」
小冰的聲音聽起來還是非常稚嫩,但是話語本身則都是由系統自動生成,人類僅僅承擔了編輯和審核的責任。
小冰去年就開始在東方衛視《看東方》節目中客串天氣預報員和解說員,當時有人懷疑上了節目的文字都是人類給寫好的。然後過了不久,小冰就在微信公眾號版本中提供了與用戶上下文對話的「新聞評論」功能,讓大家提起最近一段新聞事件,就可以「耳聽為實」。
第 5 代小冰在大量人類語料訓練的基礎上,終於具備了可以不限制話題的評論能力,這是為解決 AI 語音助手「皇冠上的明珠」——上下文對話理解問題所邁出的關鍵一步。官方表示,「用戶可以與之進行語音交互,從而改變節目。而在節目內容方面,小冰基於多重來源,可以面向任何主題,自動實時創造永不間斷的電台節目。」
如 報道過的 一樣,我親自去聽了 FM98.2 北京青年廣播 每周日晚 9 點檔的《青春聯盟星光版》、FM89.3 湖南電台音樂之聲 的全天多檔節目。這些節目都可以輕易找到官網回聽。至於 FM88.7 的 HitFM,正在籌備的是一檔國際音樂娛樂資訊類節目,相信小冰將更進一步「反客為主」,承擔更多的評論解說工作。
最後,日本本土也有一位可以不拘泥於念稿的 AI 主持人,他被定位為「史上首位 DJ 助理」。這是由設立在東京的 J-WAVE 廣播電台與 IBM 合作開發的 AI 助理 Tommy。他的節目《INNOVATION WORLD》將從 8 月 25 日起每周五 22:00-23:00 播出。該節目主持人為技術開發者川田十夢,專門圍繞 AR/VR、AI、物聯網等科技主題,邀請專家訪談。
Tommy 會在網上挑選近期流行的新聞資訊,進行未來流行趨勢預測。他還可以念出流利的英語,「主演」在節目間播放的宣傳小短片。J-WAVE 表示,今後會讓 Tommy 學習更多的音樂,讓它能夠配合當日天氣、新聞、社群等資訊,選出最適當的歌曲播出。
據媒體報道 ,Tommy 要將「十八般武藝」在這個平台發揮到淋漓盡致,例如化身心理分析師,搜集來賓過去的文章、作品等資料進行分析,便能診斷出來賓性格。8 月 25 日登場的首位來賓是音樂家佐野元春,Tommy 會分析他的代表曲目,從創作的歌詞中了解佐野的性格。
航通社 http://lishuhang.me
微博 @lishuhang微信 lifeissohappy小密圈 「書房」
推薦閱讀:
※朗誦北島的《回答》用那首配樂比較好呢?
※怎麼從事影視配音這方面的工作?
※即將踏上播音主持專業的藝考之路,參加過藝考的前輩有什麼經驗可以傳授嗎?
※【討論】外專業怎麼學播音?
※學播音主持考學有多難?