youtube字幕怎麼形成的?

基於什麼原理呢?讀取音頻信息嗎?準度還不錯。為什麼國內的視頻網站沒有類似功能呢?成本還是技術呢?


字幕有錯誤的是自動識別的,沒錯誤的是人工的,準度還不錯我不認同,機器人不是人,無法根據語境,感情準確理解含義,很多在人看來很簡單的詞機器不能分辨,這就是為什麼有programming language 而不用人類語言,因為人類語言是模凌兩可的,肯定是技術原因,但是首先中文基本不需要字幕,除了一個部分地方的方言聽不懂,普通話和大部分方言都能聽懂,漢語的自動識別字幕肯定比英語錯誤率還高,因為隨便說個人名,不可能百分之百寫對,基本上要問是哪幾個字,漢字同音不同字太多,還有語音識別是高端領域,google公司技術NB,微軟亞洲研究院搞過英語演講實時翻譯成漢語,youtube字幕能翻譯成幾十種語言,國內視頻網站沒有google那麼強大的技術儲備,就算有技術,可以研發,沒意義,研究個中文的自動字幕錯誤連篇,還不如沒有,研究英文的更沒意義了,中國哪來那麼多英文視頻資源,基本上都是從youtube上弄來的,youtube不加水印,國內視頻網站個個都加。youtube自動字幕有錯誤,有需要給視頻加字幕的自己都加了,還有第三方誌願者給youtube添加字幕。


如果是問自動識別的那種字幕,那個是採用的語音識別技術,確實是通過讀取音頻信息。

至於國內的網站為什麼沒有,我覺得兩方面,一方面受眾不同:youtube這種是面向的全世界,各種語言的用戶和視頻都有,需要實現一種交流分享的功能,且一定的錯誤率可以被接受;而國內視頻網站的受眾都是國內用戶,標準語言只有一種,沒有翻譯的必要性。另一方面是語言的特殊性:英語系的語言,如果出現一個新的概念,一個新的語彙,它會新造一個字來表達;而漢字不造字而造詞,加上漢語的多音字詞、同音字詞等情況,語音識別的複雜性要比其他語言大得多,這也導致識別準確率的問題。對一個中文視頻網站來說,上一個自動轉字幕的功能,其錯誤率比空耳聽還大,就沒什麼實際意義。成本和技術反而不是關鍵。其實youtube用的也是谷歌的技術。

國內自動加字幕的網站沒有,軟體倒是知道一個,識別字幕也不完美,自動對齊字幕還不錯,叫字幕大師。

說實話,對中文而言,解決不了上下文的問題,要做識別很麻煩


自動字幕支持英語、荷蘭語、法語、德語、義大利語、日語、韓語、葡萄牙語、俄語和西班牙語。

字幕是確保觀看者能看懂您的內容的一種有效途徑。YouTube 可以使用語音識別技術自動為您的視頻生成字幕。這些自動字幕是通過機器學習演算法自動生成的,因此不同視頻的字幕的準確程度可能會參差不齊。


那天我看了一集斯坦福的宇宙學,自動字幕超級准啊!跪。。。


語音識別,人工智慧,大數據的功勞。


基於谷歌的技術。

英語識別非常准。翻譯一般般。


字幕是使用語音識別技術實現的。


推薦閱讀:

YouTube開始限制LGBTQ內容了,這種作法是否正確?
為什麼 PewDiePie 的 Youtube 視頻人氣超過鳥叔,他的節目有何特別?
Youtube 上有哪些質量不錯的英文教學視頻和英文視頻?
如何看待油管博主hello catie被指控為台獨?
為什麼youtube不支持彈幕?

TAG:YouTube | 視頻字幕 |