AI干起了實時翻譯，我們離跨越語言的鴻溝還有多遠？

01-30

文 | 草原騎士

來源 | 智能相對論（aixdlun）

1954年，美國成功研製出了世界首個機器翻譯系統，實現了俄英兩種語言之間的簡單轉化。但由於人類語言本身的複雜性和多樣性，半個多世紀以來，計算機系統對於人類語言的理解一直處於相對較低的階段，投入實際應用的研究成果寥寥無幾。

直到近10年，以「深度學習」為代表的人工智慧技術在語音識別、自然語言處理等基礎應用領域與產業結合的業務中取得了較大突破，能夠識別語音的機器翻譯逐漸從實驗室走向普羅大眾。

在AI機器翻譯這條賽道上，互聯網巨頭都在虎視眈眈

自去年烏鎮互聯網大會上，百度、搜狗相繼亮相人工智慧同聲傳譯技術之後，又一次引發機器翻譯是否會取代同聲傳譯的激烈爭論。

儘管專業人工翻譯公司依然看衰AI對翻譯產業的顛覆性，但包括Google、Facebook、微軟、百度、騰訊、搜狗在內的各大技術巨頭卻在不遺餘力地推進深度學習在機器翻譯領域的研發和應用。

2016年9月，Google發布穀歌神經機器翻譯（GNMT: Google Neural Machine Translation）系統，聲稱該系統利用神經網路技術，模仿人腦的神經思考模式，產出媲美人工翻譯的高質量譯文，並將誤差降低了55%-85%。谷歌公司己經將該技術應用於網頁翻譯與手機應用，譯文質量明顯提升。

騰訊、百度、阿里巴巴等國內互聯網公司將深度學習理念應用到機器翻譯，在智能翻譯領域持續發力，推出多款基於神經網路技術的在線翻譯和手機應用。甚至在手機瀏覽器的升級戰爭中，智能翻譯也被當作重要功能革新，搜狗手機瀏覽器推出「智能翻譯」，集合了語音對話翻譯、AR實時翻譯、拍照翻譯等常用功能。

智能翻譯架起了不同語種間人們便利溝通的橋樑，已經成為日常交流、出國旅遊、外文學習等方面不可或缺的助手。筆者就簡要梳理一下AI實現文字和口語翻譯的基本原理、結合實例介紹智能口語翻譯難點以及智能翻譯有哪些需要解決的問題。

各種花哨的技術概念，核心仍然是AI處理人類語言的三種方法

實現讓計算機處理人類自然語言是人工智慧領域的一個重要課題，與句法分析、語義理解和自然語言生成等計算語言學核心理論密切相關。目前，AI主要有三種方法翻譯人類自然語言。

1、基於規則的機器翻譯方法。早期機器翻譯的主流方法。基於規則的機器翻譯系統依靠人工編纂的雙語詞典和專家總結的各種形式的翻譯轉化規則，但在通用領域中的應用性不強，往往被限制在了專有應用上，逐漸被新的方法取代。

2、基於實例的機器翻譯方法。從已有的翻譯經驗知識出發，將源語言句子切分為翻譯知識中見過的短語片段，通過對已有翻譯資源進行自動總結，得出雙語對照的實例庫，並設計規則處理雙語對照實例庫中的歧義性等問題，實現對新的源語言句子進行翻譯。

3、基於統計的翻譯方法。統計機器翻譯方法將任何目標語言句子都看成源語言句子的可能翻譯候選，從語料自動學習翻譯模型，然後基於此翻譯模型，對輸入源語言句子尋找一個評價分數最高的目標語言句子作為翻譯結果。目前谷歌、搜狗等基本採用的是這種。

深度學習能夠自動學習抽象特徵表示、建立源語言與目標語言之間複雜的映射關係，給統計機器翻譯的實現提供新途徑，目前已經在詞對齊、語言模型訓練、解碼等模塊的優化應用方面取得較多成果。例如，2006年谷歌發布基於短語的機器學習（PBMT）系統，該系統將句子分解成詞和短句，進行逐個翻譯。它的弱點在於忽略了上下文，因此譯文質量不佳。2016年谷歌發布的神經機器翻譯GNMT，將句子視為基本單元，不再對詞和短句逐個翻譯，明顯改善了譯文質量。

作為智能翻譯的「制高點」，AI口語翻譯難在哪？

與普通文字翻譯相比，AI口語翻譯難度更大，原因有二：

一、想要「譯的准」，首先要能「聽得清」。AI要準確判斷出指令發出者的語音、停頓，並在極短時間內進行「語音斷句」，在涉及一些模糊音時能夠根據「上下文」進行及時調整，這需要有深度學習的模型自動更換為一個語義通順、更符合作者指令的句子，然後才能進行文字翻譯處理。

二、想要「譯的准」，還要包容口語的「4個任性」

基於神經網路技術的智能翻譯系統越來越多，翻譯質量確有較大提高，但是能不能很好地包容口語的各種任性，我們來做幾項測試，檢驗一下人工智慧翻譯的水平。為便於說明，選取了具有代表性的谷歌翻譯和搜狗手機瀏覽器自帶的智能翻譯進行比對。

1、日常口語具有不連貫的特性。在口語交談中，經常會出現一些不連貫的成分，如：重複、次序顛倒、冗餘和語句殘缺。下文是一個典型的兼有語句殘缺和發音重複的句子。

原文：那六樓呢？咱們……咱們，下午談一談吧？

谷歌翻譯：The sixth floor?Lets talk about us in the afternoon?

搜狗手機瀏覽器智能翻譯：What about the sixth floor? Let』s… Let』s talk this afternoon.

谷歌翻譯在重複的處理上未真實體現原文，搜狗手機瀏覽器智能翻譯如實還原。但是，兩個翻譯結果在表達上都不同程度地存在錯誤。

2、語法約束相對較弱。口語中很少會有嚴格符合語法約束的結構完整、正確的句子，而大量存在的是語法規則難以處理的現象。一方面是由於系統的語法知識對語言現象的覆蓋程度不足；而更主要的則是口語本身的特性所決定的，例如口語中存在大量的代詞，人類口語比較容易理解，但是AI不能結合上下文，缺乏背景知識，難以區分指代對象，導致翻譯結果偏離原意。

原文：Look, man, you don』t got to do anything. This one means a lot to me.

谷歌翻譯：看，男人，你什麼都不做。這對我來說意義重大。

搜狗手機瀏覽器智能翻譯：聽著，夥計，你什麼都不用做，這對我意義重大。

翻譯的關鍵在於兩個詞：look和man。谷歌的翻譯也對，而看起來，搜狗手機瀏覽器的翻譯結果更符合生活實際。

3、沒有明確的句子邊界。口語中沒有標點符號來標誌句子，也基本沒有傳統意義上的句子，缺少了必要的聲調和停頓，很容易造成句子的歧義。

例如：「這蘋果不大好吃」。那麼該句有兩種不同的理解結果：這蘋果不大/好吃（蘋果不大，但是味道好），這蘋果/不大好吃（蘋果味道不好）。兩家AI都未能分清句子結構發音上的差別，都默認翻譯為「蘋果味道不好」。

4、非正式語體材料多。中英口語中都存在較多隨意性的口語或網路用語，生活化氣息濃厚，多為非正式的語體材料，智能翻譯需要龐大的基礎辭彙庫支撐。

原文：近期我們注意到國際上有一種看法，認為中國已經成為世界上最大的經濟體，一方面挑戰了美國的領導地位，另一方面在很多國際事務上中國仍在搭便車。請問您怎麼看待這樣的看法？（總理記者會上中國日報記者的現場提問）

谷歌翻譯：We have recently noticed that there is a view that China has become the worlds largest economy， on the one hand challenges the leadership of the United States， on the other hand in many international affairs， China is still free. What do you think of this view?

搜狗手機瀏覽器智能翻譯：Recently we have noticed an international view that China has become the worlds largest economy. On the one hand, it challenges the leadership of the United States. On the other hand, the Chinese are hitchhiking in many international affairs. I would like to ask what you think of this view.

專家譯文：Recently we have noticed that there is a view in the international community that China has become the world』s largest economy， on the one hand challenges the leadership of the United States，on the other hand in many international affairs in China is still a free ride， how do you think of this view?

可以說，兩家AI對這段話的翻譯，雖然都有些許瑕疵，但是總體都還是比較到位的，搜狗手機瀏覽器對於「搭便車」這個典型口語化辭彙翻譯相對更準確。

中國古詩英譯一直是文化翻譯的一個難題，甚至被認為是可譯性最小的文學形式。我們來試驗一下兩家AI對王維《九月九日憶山東兄弟》的理解和翻譯能力。

獨在異鄉為異客，每逢佳節倍思親。遙知兄弟登高處，遍插茱萸少一人。

谷歌翻譯：Alone in a foreign land for the stranger，every festive times.

Distinguished brother ascended the throne，who was full of cornelia.

搜狗手機瀏覽器智能翻譯：Alone in a foreign land, I miss my relatives more than anything else during the holidays. I know my brother has climbed up to the top and planted dogwood everywhere, but one person is missing.

參考譯文：Alone，a lonely stranger in a foreign land，I doubly pine for my kinsfolk on holiday. I know my brothers would, with dogwood spray in hand, Climbing up the mountain and miss me so far away.

翻譯古詩詞，確實非常難為兩家AI。不過，翻譯的結果很有趣，搜狗手機瀏覽器對前兩句翻譯尚可，後兩句翻譯成了我的兄弟在高處到處種植茱萸，谷歌對最後兩句完全是進行了想像性的拓展。

要跨越語言不通的鴻溝，智能翻譯還需往哪加油

智能翻譯確實取得了令人驚喜的進展，拿著手機和老外進行日常交流已經基本沒有問題。但是智能翻譯還存在「短板」，會有「詞不達意」的時候，AI要想更進一步發展，和有著數十年積澱的高水平翻譯員進行競爭，可能還需要從以下幾個方面進行努力。

1、大量補充口語化語料

智能翻譯對於口語化文本處理能力還不強，一是由於翻譯語料庫口語化語料不足，二是針對口語辭彙與口語表達多採取直譯方式，因此出現較多誤譯。該問題的解決應該從擴大對應部分語料庫入手，增加口語類文本語料庫，包括常見口語化辭彙、表達與生活用語。

2、提高語境理解能力

智能翻譯對於中文複雜含義句式中的時態辨別能力還不夠，往往需要充分理解整句話的意思才能準確把握時態。智能翻譯並非基於理解，而是基於統計學與語料庫，只能做到將這句話意思大致翻譯準確，在識別感情色彩方面，還有欠缺。

將神經網路學習的抽象表示和傳統符號語義方法結合，建立新的基於語義的機器翻譯系統，或許可以大幅提高AI對組合語義、複雜的遞歸語言結構的處理能力。

但，我們依然滿懷期待AI讓我們擺脫語言鴻溝的那一天。

智能相對論（微信id:aixdlun）：2個前人工智慧行業管理諮詢老鳥+1個老媒體人組成的三人幫，深挖人工智慧這口井，評出鹹淡，講出黑白，道出深淺。