微軟宣布在機器中英雙語翻譯領域取得突破性進展
本周三,微軟的研究團隊宣布發明了第一個機器翻譯系統,可以自動將中文文章翻譯成英文,翻譯精度能和人類水平相當。研究團隊抽取並測試了在線新聞中近2000個中文句子的中譯英,這份樣本被稱為newstest2017,再和人工翻譯進行結果對比,還聘請了雙語專家來驗證機器翻譯的準確性。
從目前的結果來看,機器翻譯的進步非常顯著,過去幾十年一直未解決的機器翻譯味消失了,微軟甚至表示,機器翻譯將勝過人工翻譯。微軟負責自然語言和機器翻譯的技術主管黃學東表示,雖然一直相信機器翻譯終究會勝過人類,但是沒想到接過來的這麼快。
讓機器理解自然語言並翻譯遠比語音識別困難。現在人工智慧的發展已經幫助語音識別在日常生活中得到了實際應用,例如智能手機和智能傢具設備中的語音識別智能助手,已經能識別人類的語音命令完成相應任務。但對於機器翻譯來說,機器無法理解文章的大意,只能逐字逐句翻譯字面含義,無法理解文章中更深的含義。即使翻譯出了字面意思,最後還需要人類進行加工潤色,而每個人對同一句話的理解和翻譯也不盡相同。
微軟亞洲研究院研究員、自然語言計算組主任周明表示,由於人類使用不同辭彙表達同一種含義,但無法判斷哪種表達方式是最好的。因此機器翻譯遠比語音識別要複雜。現在深度神經網路可以用來訓練人工智慧系統不斷進行自主學習,研究人員可以通過創建更流利的自然語言翻譯文本讓機器開始學習翻譯的模式,這種方式被稱為統計機器翻譯。
微軟的研究人員還給自己的翻譯系統添加了額外的翻譯訓練方式,增強了系統翻譯的精確度,類似人類為了保證工作完成的準確對整個流程進行檢查,例如對於客觀事實的翻譯使用了對偶學習、推敲網路等方法進行加工和潤色,一些新技術像是聯合訓練、一致性規範技術,可以使機器在翻譯文字時,無論閱讀順序是從左到右還是從右到左,都能增強了中譯英和英譯中的準確性。
周明認為,在機器翻譯領域可以使用所有人工智慧的技術來達到機器翻譯的終極目標,超越人類。不過目前,微軟的這套機器翻譯尚未經過實時新聞翻譯的檢驗,而且還不適合進行商業推廣。
感興趣的用戶可以打開以下網址體驗:https://translator.microsoft.com/neural。系統會將英語用2種方法翻譯成一句簡體中文的句子,右邊顯示的是更加精確的中文翻譯,還能看到對翻譯的修改之處。
其他的科技巨頭像是谷歌也有自己的機器翻譯系統,而且一些已經投入了商用,例如谷歌翻譯,已經有獨立的應用程序並在谷歌搜索中內置。
WTT資訊-最新科技資訊,實時網安信息歡迎關注我們:
@W-Pwn
推薦閱讀:
TAG:微軟Microsoft | 機器學習 | 翻譯 |