川普和希拉里的辯論不是直播嗎?為啥會有字幕?

問題:Youtube直播川普希拉里辯論時,幾乎同步的字幕是怎麼做出來的?

Revolucion 回答

油管是有自動字幕功能的。但是自動字幕當然是不能保證準確的……哪怕有google語音識別技術支持也不行,誰用誰知道。

關鍵場合, 還是得靠人 。

同步直播字幕實際上是一項很老的技術了,看過美帝電視直播的人應該基本都見過。原理很簡單: 由一個速記員一邊聽一邊速記,然後由計算機把速記符號立刻翻譯成單詞,直接顯示在屏幕上 ——這種玩法是BBC和Ceefax在70年代創立的。起初Ceefax曾經很天真地設計了一套「所見即所得」的設備,然後發現沒有人的打字速度抵得上說話速度。後來他們接待了一個議員,發現他雖然聾了但還是可以「聽」懂議會辯論——因為他學會了讀速記記錄,盯著速記員那裡就行了。受此啟發,他們開發出了第一個直接翻譯速記記錄的機器程序。

(速記符號沒啥特殊的啦,就是拉丁字母而已,用很少的鍵來實現……比如stenotype的鍵盤是這樣的:

得到的紀錄是這樣的:

這樣的字幕往往會比真實的話延遲幾秒鐘,這很正常,畢竟人需要反應時間……所以這次直播, 油管的字幕也就延遲了幾秒 。

現在直接語音識別也有了很大進步,但得到很高精度的語音識別需要針對一個人訓練。所以BBC後來想了一個辦法:找一個人,把識別軟體訓練好,然後直播的時候別人說什麼,他照著讀一遍。這樣的識別率就會很好,而不受口音啦背景啦之類的干擾了。

不過看起來油管還是用的老辦法人工敲。證據見下:

這是辯論進行到大概50分鐘的時候的字幕。這裡柯林頓想說的詞是reputation,但是字幕卻先變成Re再變成Re;b。這種錯誤肯定是以字母為單位出現的, 對語音的識別不會識別出這樣的玩意兒 ……

果殼網ID:Guokr42整天不知道在科普些啥玩意兒的果殼我覺得你應該關注一下 本文來自果殼網,謝絕轉載 如有需要請聯繫sns@guokr.com


推薦閱讀:

希拉里促安理會出兵敘利亞獲附議 稱俄中將付出代價
希拉里還有機會競選總統嗎?
希拉里拿什麼對抗特朗普
希拉里現狀如何?
希拉里的「廚藝」越來越爛

TAG:辯論 | 字幕 | 直播 | 希拉里 |