川普和希拉里的辯論不是直播嗎?為啥會有字幕?
問題:Youtube直播川普希拉里辯論時,幾乎同步的字幕是怎麼做出來的?
Revolucion 回答
油管是有自動字幕功能的。但是自動字幕當然是不能保證準確的……哪怕有google語音識別技術支持也不行,誰用誰知道。
關鍵場合, 還是得靠人 。
同步直播字幕實際上是一項很老的技術了,看過美帝電視直播的人應該基本都見過。原理很簡單: 由一個速記員一邊聽一邊速記,然後由計算機把速記符號立刻翻譯成單詞,直接顯示在屏幕上 ——這種玩法是BBC和Ceefax在70年代創立的。起初Ceefax曾經很天真地設計了一套「所見即所得」的設備,然後發現沒有人的打字速度抵得上說話速度。後來他們接待了一個議員,發現他雖然聾了但還是可以「聽」懂議會辯論——因為他學會了讀速記記錄,盯著速記員那裡就行了。受此啟發,他們開發出了第一個直接翻譯速記記錄的機器程序。
(速記符號沒啥特殊的啦,就是拉丁字母而已,用很少的鍵來實現……比如stenotype的鍵盤是這樣的:
得到的紀錄是這樣的:
這樣的字幕往往會比真實的話延遲幾秒鐘,這很正常,畢竟人需要反應時間……所以這次直播, 油管的字幕也就延遲了幾秒 。
現在直接語音識別也有了很大進步,但得到很高精度的語音識別需要針對一個人訓練。所以BBC後來想了一個辦法:找一個人,把識別軟體訓練好,然後直播的時候別人說什麼,他照著讀一遍。這樣的識別率就會很好,而不受口音啦背景啦之類的干擾了。
不過看起來油管還是用的老辦法人工敲。證據見下:
這是辯論進行到大概50分鐘的時候的字幕。這裡柯林頓想說的詞是reputation,但是字幕卻先變成Re再變成Re;b。這種錯誤肯定是以字母為單位出現的, 對語音的識別不會識別出這樣的玩意兒 ……
果殼網ID:Guokr42整天不知道在科普些啥玩意兒的果殼我覺得你應該關注一下 本文來自果殼網,謝絕轉載 如有需要請聯繫sns@guokr.com
推薦閱讀:
※希拉里促安理會出兵敘利亞獲附議 稱俄中將付出代價
※希拉里還有機會競選總統嗎?
※希拉里拿什麼對抗特朗普
※希拉里現狀如何?
※希拉里的「廚藝」越來越爛