國內首創AI聽翻雙語字幕,「網易見外」視頻翻譯功能全新上線

人工智慧將替代許多基礎勞動已是不爭的事實,人工翻譯就被認為是一個會被AI影響的行業。實際上,人工智慧在神經網路機器翻譯領域早就有了諸多應用。例如,網易「有道翻譯官」app中的語音對講翻譯和拍照翻譯功能,就解決了語音和圖像識別領域的翻譯場景需求。

同為網易旗下產品,網易人工智慧事業部近期推出的「網易見外」更進一步,把翻譯應用場景拓展到了視頻即時翻譯領域。而在目前,網易是國內率先實現該技術並進行商業化探索的公司。

視頻即時翻譯能做什麼?比方說,你肯定有犯愁找不到外國電影或者視頻字幕的時候,特別是中文。但在「網易見外」網站(sight.netease.com),機器能對視頻進行語音識別並自動翻譯,生成雙語字幕,大大增強了用戶的觀看體驗。

所以,用「網易見外」能做什麼?

結合了視頻聽翻技術的「網易見外」,可以說既是一個聚合海外短視頻的資訊平台,也可以作為一款智能視頻字幕製作的輕量工具來使用。

在「網易見外」的視頻模塊,你能夠自由瀏覽和下載抓取自Youtube和Facebook熱門頻道的短視頻,機器聽寫英文,同步翻譯成中文,並自動切分好相應的時間軸,使視頻自動帶上雙語翻譯字幕,你再也不會因為英文不好而放棄去看國外有意思的短視頻。

網易見外人工智慧技術為視頻配上的雙語字幕

除了「網易見外」平台已有的視頻素材,你也可以自己上傳短視頻進行翻譯。一般等上三四分鐘,機器就能把一段20分鐘左右時長的視頻翻譯完成。

在網易見外上傳短視頻進行翻譯

如果你還想把視頻下載到本地另作他用,也可以在見外平台上將機器翻譯的版本上進行一些人工校對。無論如何,也比傳統人工視頻翻譯的效率高多了。

網易見外的視頻字幕校對頁面

目前,網易見外的視頻翻譯主打的還是英譯中功能,後續也即將推出中譯英視頻翻譯。據悉,中譯英的語音識別與翻譯的準確性將會變得更高。

「網易見外」視頻翻譯背後的三大技術

為了實現這個「almost黑科技」的視頻聽翻功能,網易見外集成了三大國際前沿人工智慧技術:1、NMT神經網路機器翻譯 2、智能語音識別轉寫文字 3、自動解析語音並即時切分時間軸。

在這三大技術加持下,網易見外最終實現了視頻的高精度語音識別和即時翻譯功能,能夠一鍵生成雙語字幕,並自動壓制在視頻中。

「神經網路機器翻譯」,相比於短句翻譯,NMT可以利用雲語言與目標語言所有信息,使整個翻譯決策過程連續化全局化,使得譯文更流暢和可讀。

「語音識別轉文字」, 見外可根據後台的海量語料和場景模型,智能識別解析用戶語音,具備強大糾錯能力和智能推理能力。

「自動語音切軸」,通過判斷講話者語氣來斷句,智能切分時間軸,為字幕組聽翻人員等需要製作輸出字幕的用戶群體極大地提高工作效率。

早在年初,網易見外的NMT技術就已在有道詞典、有道翻譯官等全線產品上線,成功地經過了超過6億用戶的每日驗證。

據悉,網易見外的視頻聽翻中譯英識別準確性已高於95%、翻譯準確率高於85%;英譯中識別準確率已高於80%、翻譯準確率高於70%。隨著人工智慧的不斷學習,其翻譯準確率還將不斷提升。

並非取代人工,更為提高效率和體驗

採用這些人工智慧技術的「網易見外」,並非為了取代人工翻譯而生。

以傳統字幕製作的流程而言,需要經過人工聽寫英文字幕、翻譯、切分時間軸、校對、特效製作以及壓制等一系列步驟。「網易見外」能完成其中語音聽寫、翻譯、切分時間軸等相對固定的工作流程,字幕製作者只需要專註於進行後期校對和特效製作便可。

作為網易人工智慧旗下產品,「網易見外」的願景,首先是通過技術降低內容翻譯的成本,提高翻譯行業的生產效率。

更進一步,「網易見外」還志在打破跨文化交流邊界,使國內外優質資源傳播不再受語言不通的限制。把國外優質文化內容引進來,讓中國優秀文化產品和最新的發展變化走出去,打造一個中國看世界、世界看中國的雙向交流窗口。

隨著AI技術落地的推進,網易人工智慧還將提供更多好用的產品,催生創新商業模式,應用到更多行業場景,更關注內容和體驗服務。

歡迎關注網易人工智慧其他產品:


推薦閱讀:

7個視頻下載網站,你知道幾個?
h5視頻活動踩坑
一篇文章誕生之曲折(知乎視頻工具發布篇)
【視頻測評】2018年,我種草的第一款旅行拍攝神器
明景視頻勘察工具箱

TAG:字幕翻譯 | 視頻 | 網易 |