機器翻譯技術的進展已經或將要對人工翻譯市場帶來什麼樣的影響?

本題已收錄至知乎圓桌:機器之能 X 語言之美,更多「人工智慧」相關話題歡迎關注討論。

原題:谷歌推出神經機器翻譯系統將對人力翻譯市場帶來什麼樣的影響? 在未來機器翻譯是否會取代人工翻譯的一些部分?


昨晚被G家新機器翻譯刷屏,就寫了個FAQ。

說實話,作為一個搞機器翻譯的程序員,看到大家爭先恐後地用可能一些中國人自己都要想一想的句子調戲機器翻譯系統的時候,我的心裡吶喊的是:你們為什麼要這樣對我們家女兒啊~(誤)

言歸正傳,不談技術,我就回答幾個最常聽見的問題。

問:機器翻譯翻得這麼差,十句里有九句半是錯的,有什麼用?

答:比沒有強。假設你人在法國,一個字的法語也不懂,你是選擇試著用帶拍照翻譯功能的APP翻一下,得到一個雖然有些錯誤但大體還能猜出意思的結果呢,還是直接放棄呢?(來源:Chris Dyer 的觀點)

問:但還是難受啊,反正我不到實在沒辦法了不會去用它。

答:你不是一個人。在數年前,自動語音識別(聽寫人說話的內容)最高只有90%左右的準確率。想像一下,每幾次就會聽錯一次,你當時會去使用百度的語音搜索嗎?假設你的觸屏手機正確率是90%,每點10次就有一次點不到位置或是點錯,你會去買智能手機嗎?而到今年許多語音識別的正確率已經達到99%以上,數據說明使用的人大大增多了。(來源:Andrew Ng 的觀點)就我個人而言,因為我的英語有口音,兩三年前谷歌語音識別的正確率在60-70%,還是在我非常努力模仿美國人口音的情況下,而現在就算我不努力模仿,正確率也超過99%。所以,當機器翻譯發展到正確率超過99%的時候,你就會使用了。

&<9.29:對這一問做了大修。&>

問:人工翻譯在需要的時候會意譯,會考慮目標語言的語法和文化習慣,精準地表達意思,任何機器永遠也不可能做到這點。

答1:關於前半部分:人工翻譯並不總是高質量的。其實,絕大部分工業界文檔的英翻中結果是這樣的:

原文:XXX allows you to take advantage of a variety of features such as scheduling, dependency tracking, and error handling. You can use activities and preconditions that xxx provides and/or write your own custom ones. This means that you can configure an XXX to take actions

譯文:XXX允許您利用各種功能,如計劃時間表、相關性跟蹤和錯誤處理。您可以使用 XXX 提供的活動和前提條件或自己編寫。這意味著,您可以配置 XXX 來進行以下操作。

當你看到這段中文的時候無論如何也不會覺得它是直接用中文寫成的吧——肯定是從英文翻譯的,讀來拗口(中文應該不會說「這意味著」吧),部分詞雖然翻得準確,在中文語境中卻很難看出意思(比如「 activities活動」和「 preconditions前提條件」,它們其實是一些功能的名字)。

機器翻譯是還不行,但其實規模化、產業化的人工翻譯遠沒有你想像的那麼完美

上面這段話雖然不自然,但其實翻譯得非常準確。而這種語料在工業界遍地皆是。所以在工業界搭建一個針對很小領域(domain)的機器翻譯系統,以提高人工翻譯效率為目標,達到接近上面這種不自然的人工翻譯的質量,其實比在學術界面對數量有限的難度大得多的新聞語料,要翻成職業人工翻譯的那種水準要可行得多。(來源:Alon Lavie 的觀點)

答2:關於後半部分:機器翻譯正在並將繼續發展、成長。這幾年,如果不是在參與開發的人,一般都不能想到下一個手機功能:15年前,應該很少有人能想到現在大多數城市人都能隨時用手機上網、打視頻電話;幾個世紀之前,人們也不能想到計算器(更別說計算機了)算術會比人類快千百倍。就我個人而言,作為學機器翻譯的學生,我想我做機器翻譯的目標是建造翻譯能力超過人類的系統,並且也認為這個在我死之前是能實現的。事實上,目前也存在機器能夠翻好,而人工翻不好的句子(比方說當人工翻譯者碰巧不認識某個詞而機器碰巧認識的時候)。我們的目標就是讓這種機器翻譯能夠超過人工的情況更多一些。

問:機器翻譯現在這麼強,以後人工翻譯該失業了。(樓主的問題)

答:也對,也不對。對的論據很多也很明顯,這裡就不展開了,主要談談這種說法為什麼不對的論據。現在的本地化產業中,機器翻譯到底是用來幹什麼的呢?新聞媒體是不會直接用機器翻譯來翻譯社論的,製造商也不會用機器翻譯來翻譯產品說明書。目前就我所知道的純機器翻譯直接使用的最大的市場,是翻譯電商或者其他網站的搜索詞(search queries)或是用戶評論。這個情景的特點是:因為要求翻譯得非常快,或者量非常大,人工翻譯根本不可能。要不就用機器翻譯,要不就沒有翻譯,這又回到第一條的觀點,機器翻譯雖不完美,但比沒有強。實際上,因為有些廠商會僱傭人工來校對或修改機器翻譯的這些評論,或是對搜索詞翻譯進行事後評價,我曾聽到過有人認為機器翻譯實際上為人工翻譯提供了更多的工作機會。

問:我是翻譯,現在客戶用機器翻譯的結果來讓我修改校對,要修改那些破破爛爛的句子實在太難受了,還不如我自己從頭翻,偏偏客戶又想只付校對的價格,坑死了。

答:大部分翻譯都是這樣想的。一般認為,現有的機器輔助翻譯或是機器翻譯事後修改(post-editing)系統,確實能夠提高人工翻譯的效率,但是會大大降低翻譯的工作體驗。機器翻譯界也在積極嘗試解決這個問題(來源:Michael Denkowski 的觀點)。具體的產品,這裡為防廣告嫌疑就不說了。

我認識一個翻譯,ta對機器翻譯事後修改的收費和直接翻譯是完全一樣的,理由是,ta會寫代碼,自己平時就是搭著一個機器翻譯系統輔助翻譯的,質量比客戶買的機器翻譯還好。當然,我認識ta的時候,人家已經是某科技公司機器翻譯部門的程序員了。


人們常常會用「人機大戰」來設想人與機器的關係,要想把這種思維定勢轉變為「人機合作」並不那麼容易,也不會在一夜之間發生。但它確實勢在必行,因為人類目前所處的時代中,技術越來越不受物理設備的禁錮,並且越來越普及,成為我們生活中不可缺少的一部分。

「人工智慧就像一個守護天使,它時刻關照著你。」 當下,機器翻譯已經能減少部分情況下的人工翻譯。微軟將這種無處不在而又似乎「無處可尋」的技術理念稱為「隱形革命」。隨著機器學習等人工智慧技術的發展,獲得與使用數據的增多,機器將越來越善於從事某些工作。人工智慧的最終目的是幫助人類擁有更好的生活,未來將是人類智能與人工智慧的共同組合。

————這裡是正式回答的分割線————

在機器翻譯方面,微軟正將這一技術服務到日常生活當中。

在去年12月1日的微軟技術大會上,微軟認知服務與花椒直播共同展示了展示了使用微軟人工智慧翻譯技術實現多語言直播的應用。人稱「哈利波特」的微軟亞洲研究院首席研究員 Thomas Moscibroda博士用他的母語——德語在直播期間回答了網友們用中文提出的各種好玩的問題。網紅主播Thomas說的話和網友的問題都實時顯示中德雙語字幕,這背後則是有微軟提供的Microsoft Translator的語音翻譯服務。

Microsoft Translator提供了豐富多樣的使用場景,解決了用戶在面對面時由於語言不通而導致交流不暢的痛點。例如幫助身處異國的旅行者更方便地與酒店前台、計程車司機和博物館導遊等進行交流。教師也可藉助該項技術與只會說其他語言的學生家長進行溝通。在紐約市的一個試點項目中,這項技術還被用於幫助非英語人群申請由州政府頒發的身份證。

積累了微軟20多年研究成果,Microsoft Translator的語音翻譯服務,現已全部由業界先進的深度神經網路技術驅動,以提供更準確自然的翻譯體驗。Microsoft Translator語音翻譯能實現包括中文在內的9種不同語言之間的實時語音翻譯。消費者可以通過實時語音翻譯Skype Translator以及Microsoft Translator的iOS和Android版的移動應用進行體驗。微軟翻譯還支持近60種語言的文本翻譯。而且這個數量還在不斷增加。目前全球已有數千間企業在使用微軟自動翻譯技術,提高業務效率和服務質量。

微軟研究院Microsoft Translator產品戰略總監Olivier Fontana說:「我們的終極目標是打破語言障礙。」這項技術適用於一對一交談(例如旅行者向酒店前台問詢)、一對多互動(例如一名導遊與一群遊客交談)以及多對多溝通(例如多語言的商務會議和學術討論)。只需要每個人在手機上打開Microsoft Translator移動端的App,掃描二維碼並進入聊天界面,就可以開始交流了。

個人通用翻譯器

這一功能以Microsoft Translator語音翻譯技術為基礎,該技術已先用於Skype Translator,後者讓使用不同語言的人群能在網上進行實時交流。

「Skype Translator能讓被地區和語言阻隔的人順暢交流,「但它不能滿足面對面交談的需求,」微軟人工智慧及微軟研究事業部機器翻譯組研究經理Arul Menezes說。他和他的同事們都認為, 面對面跨語種交流所要用到的技術,應該更接近於《星際迷航》和其他科幻作品中隨處可見的「通用翻譯器」。

對於「個人通用翻譯器」,團隊決定利用業已廣泛採用的移動設備,而不再開發專用的翻譯硬體。Microsoft Translator團隊項目經理Tanvi Surti說:「眼下,智能手機隨處可見,幾乎人手一隻。」Surti負責領導Microsoft Translator現場翻譯功能的開發。

該團隊開發了一項技術,讓現有的Microsoft Translator 手機應用與網站形成了一個整體。「我們花了很多時間思考用戶體驗設計,」Surti說。「比如我們倆說著兩種不同的語言,我們如何做到快速對接以便有更多的時間和注意力用於考慮交談內容?」

新功能使用起來非常簡單。首先,用戶通過手機端應用或網站登錄這項服務,選擇自己的語言並發起新會話。這一過程將生成一個代碼以及一個二維碼,其他參與者可以輸入這代碼或掃描二維碼加入,然後選擇自己的語言,談話就可以開始了。

交談一方在發言時要按下鍵盤空格鍵或屏幕上的虛擬按鈕,就像使用對講機一樣。幾秒鐘後,他們所說話語的翻譯文本就出現在其他對話參與者的設備屏幕上,當然是以其各自的母語呈現。對於部分語言,系統還提供有聲的語音翻譯。

與大多數尖端前沿技術類似,它目前還不夠完美。

「毫無疑問,目前該技術的應用在質量和設置上都有很多提升的空間。但毫無疑問的是,一旦你完成設置,就能在多人使用多種語言面對面交談的過程中獲得『通用翻譯器』體驗,」Fontana說。

深層神經網路

機器翻譯技術本身是由運行在雲中的演算法所驅動的,通過使用基於深層神經網路的翻譯技術,與先前所謂的「統計型機器翻譯」相比,它能夠提供更流暢、聽起來更有「人味」的翻譯。

兩種方法都涉及根據早前經專業人士翻譯的文檔文本數據對演算法進行訓練,以便讓系統了解一種語言中的單詞和短語如何用另一種語言來表達。然而,統計型方法局限在由一兩個鄰近詞語形成的上下文範圍內對某個單詞進行翻譯,這可能會導致翻譯出來的語句笨拙而迂迴。

「神經網路」受到了掌握多門語言的人類在翻譯過程中大腦中發生的模式識別過程的啟發,實現了更自然的語音翻譯。

例如,在非神經世界中,「一群貓」和「一隻貓」被視為不同的實體;而人類大腦以及神經網路則把這兩者視為密切相關的詞。神經網路也可以解析「住宿」和「星宿」兩個詞中「宿」字的含義區別。Menezes解釋說:「單詞已經不再被視為它所代表的事物,而是一個包含500個維度的向量,其本質是500組數字,而每一個數字都反映了這個單詞的某一個方面。」

神經網路在開始翻譯之前,首先用1000個維度的向量對每個單詞在整個句子語境下的含義進行建模,無論這句話有5個詞還是20個詞都是這樣處理的。這一包含1000個維度的模型(而非單詞)隨後被翻譯成另一種語言。

此外,Fontana表示,隨著該技術被使用的次數越多,翻譯的質量也會不斷提高。他希望看到Microsoft Translator能被包括旅行者、導遊、教師和社會工作者在內的廣泛的用戶群體所採用。

————這裡是回答結束的分割線————

以上回答摘選自微軟研究院AI頭條,Microsoft Translator:消除面對面交流的語言障礙。

感謝大家的閱讀。

本賬號為微軟亞洲研究院的官方知乎賬號。本賬號立足於計算機領域,特別是人工智慧相關的前沿研究,旨在為人工智慧的相關研究提供範例,從專業的角度促進公眾對人工智慧的理解,並為研究人員提供討論和參與的開放平台,從而共建計算機領域的未來。

微軟亞洲研究院的每一位專家都是我們的智囊團,你在這個賬號可以閱讀到來自計算機科學領域各個不同方向的專家們的見解。請大家不要吝惜手裡的「邀請」,讓我們在分享中共同進步。

也歡迎大家關注我們的微博和微信賬號,了解更多我們研究。


機器翻譯技術和其他所有機器XX技術(如紡紗,挖煤)對人工XX技術的影響我認為是一樣的。我們可以回憶一下當年政治課學習過的紡織工人砸蒸汽機廠的故事。為什麼他們要砸呢?因為蒸汽紡紗比起人工,雖然質量可能差一些,卻可以快速上規模,以極低的價格衝擊市場。而大多數人都只需要普通質量的便宜貨。機器翻譯也是一樣,它的發展已經到了可以以極低的價格提供「還過得去」的翻譯。那麼我們就可以類比翻譯市場以後的情況會是如何。

首先,翻譯市場並不會萎縮,就像紡織機器使得紡織市場擴大了一樣。一些只需要「差不多」翻譯的應用,例如一些電商網站的本地化,本來可能因為人工翻譯的成本過高而直接被放棄——畢竟商家不會做虧本的生意——在機器翻譯下可能就會上馬。而這些中又可能會使用人工翻譯審看翻譯結果,做質量控制。這就像紡織工人轉行做紡織廠的質檢一樣。對比一下:在只有人工翻譯的時候,這個生意並不存在,在機器翻譯下,反而有了一些人工翻譯的生意。不僅機器翻譯市場,人工翻譯市場也擴大了。

其次,高端的人工翻譯不會消亡。即使到了今天,一份手繡的雙面蜀綉仍然價格不菲。畢竟有些翻譯是一件創造性的勞動。 「本產品售價180元人民幣」這樣的翻譯,用機器翻譯自然毫無問題(我估計也不會有人想每天翻譯這種句子賺錢吧),而想把「過去就像攥在手中的一把干沙,自以為攥得很緊,其實早就從指縫中流光了。記憶是一條早已乾涸的河流,只在毫無生氣的河床中剩下零落的礫石。」這樣的句子翻譯好可就不是容易的事了。即使機器可以翻譯得準確,人類也不會滿意的。俗話說文無第一,人工翻譯當然還要保留人類的自豪——文人相輕嘛。

最後,技術提升往往帶來效率的提升,讓人可以更高效地完成工作。蒸汽機會帶來搬磚效率的提高,但是它仍然需要駕駛員;而駕駛員如果不用蒸汽機,一天也搬不了幾塊磚。人們常說有多少人工,就有多少智能,機器翻譯也不例外。技術的發展會帶來圍繞機器翻譯的各種職位,如譯後編輯,質量控制等等。事實上CAT(機器輔助翻譯)已經開始成了許多翻譯學校的必修課。如果能夠熟練掌握這些技術,會在市場佔有先機。擁有先進生產力的企業和個人會佔據先機。

人類的技術從來不會停下來等待,不斷用機器增強人類的能力,解放生產力是必然趨勢。人工翻譯市場擁抱和利用機器翻譯也是必然的。最後還是用我們熟悉的古文結束:登高而招,臂非加長也,而見者遠;順風而呼,聲非加疾也,而聞者彰。假輿馬者,非利足也,而致千里;假舟楫者,非能水也,而絕江河。君子性非異也,善假於物也。


涉外專利代理人一枚 有時候為了攢工作量拿獎金也做做專利翻譯 而且客戶給的翻譯價格還比較高(中英1字2元) 前年的時候試過谷歌 完全不行 今年聽說神馬利用神經網路以後谷歌翻譯質量突飛猛進 又試了一下 在根據經驗對原文進行一系列調整以後 谷歌翻譯正確率我感覺在80%以上 對於斷句、拆分句子結構都做的很好了 有些行業術語也翻得出來我們常用的詞而不是生硬的對應(比我所剛入行的小翻譯還強點)大概專利說明書是一個語言文字風格相對統一的領域 很多句式大家都是這麼用 積累了大量的數據吧

目前影響就是 干著校對的活 拿著翻譯的錢(前者的兩倍)感覺還是很爽的 還能騰出時間接點比較有難度的活

不過這種狀態肯定不會持久的 機器承擔的部分越多 所需要的人工就越少 這行業人力需求總體肯定是萎縮的 我又不靠這個吃飯 感覺還好 樓上某些自信不會被取代的人還是早點想想後路吧

原文:

If a normal driving command is
transmitted from the control device 50, then the motor 43 moves the locking
part 42 rearwardly by a predetermined movement amount L1 (hereinafter referred
to as 「normal movement length L1」) as depicted in FIG. 4A. The normal movement length L1 is set in
advance, for example, to a length equal to or a little greater than the length
of the second flat face portion 41b of the restricting part 41 in the forward
and rearward direction. The motor 43
maintains the state in which the locking part 42 is moved rearwardly by the
normal movement length L1 during a period within which the normal driving
command continues to be issued from the control device 50.

谷歌翻的:

如果從控制裝置50發送正常的驅動指令,則電動機43使鎖定部42向後移動預定移動量L1(以下稱為「正常移動長度L1」),如圖5所示(這裡是不知道哪冒出來的,扣分)。 圖4A。 正常移動長度L1預先設定為例如等於或略大於限制部41的第二平面部41b在前後方向上的長度的長度(這句雖然拗口,但是完全沒錯,專利翻譯不出錯是第一位的,文辭優美有時候就顧不上了)。 在從控制裝置50繼續發出正常驅動命令的時段期間,電動機43保持鎖定部42向後移動正常移動長度L1的狀態(這句從文字對應角度也沒錯,至於那個during可能有歧義,需要上下文確定,然而一個不看技術方案的普通翻譯也一樣沒法確定的)

而且所有的附圖標記都跟在他們所要表示的術語後面沒有亂,這個在谷歌翻譯前一階段也是做不到的。

顫抖吧人類!


不懂機器翻譯,但非常期待去學習。

機器翻譯在翻譯界和譯者之間早已不是新鮮事兒,但我更多接觸到的是CAT,即機器輔助翻譯。也就是說機器尚未發展到能替代譯者的作用。

未來的事情誰也說不準,要等待更加智能的電腦出現,可能才會真正成為譯者的「威脅」。

就我在其他知乎問題上看到的回答,懂技術的人說這是一個比較重要的突破,也有人發現google翻譯連簡單句子都翻不好(我想下班被翻成i want to work,不是很能讓人接受),但後來有人說這是個bug,已被修正,尚未求證。

機翻想取代人翻絕非易事,至少不像機器取代紡織工人那樣容易。紡織工人做的全是重複性工作,而翻譯往大了說,已經進入再創造的範疇。一篇好的譯文需要很多打磨,更有一些元素是跨文化的(比如中西文化對於「龍」的不同認知),所以想要機翻對人翻產生威脅,至少要讓機器有人的智商。

總之從一個學翻譯的人的角度,現在的發展還遠未讓真正的譯者感到威脅。


如果你看過電影《殺破狼2》,除了精彩的武打場景,對裡面那個能實時翻譯語音的App一定還有印象,正是這個「簡單的」App串聯了阿猜、血癌患者莎(阿猜女兒)和陳志傑(與莎同血型的骨髓捐獻者,不惜染上毒癮卧底的香港探員)間的溝通,貫穿全片文戲部分,舉足輕重。

而這個App背後的技術,就是本文討論的實時語音翻譯(或實時同傳)系統,它可以簡單看作由語音識別(Speech Recognition)和機器翻譯(Machine Translation)兩個子模塊協同實現。其中前者的發展已經進入平穩期,各大公司對外宣傳的識別率都在97%以上,並在真實應用場景中被廣泛使用,而機器翻譯雖發展已久,受制於演算法和軟硬體發展的約束,直到近期才有重大突破。

機器翻譯產品介紹

最早的機器翻譯要追溯至上世紀40年代,人們通過翻譯備忘錄的形式進行語言轉換,後來逐漸發展出基於規則的機器翻譯(1970年)、基於實例的機器翻譯(1984年)、統計機器翻譯系統(Statistical Machine Translation,SMT,1991年),後者作為當時非限定領域中性能較佳的一種方法,對機器翻譯的發展起到了顛覆性的推動作用,隨著摩爾定律的推進在近幾十年被發展得幾近極致,這也是科學家們第一次意識到採用大數據消除信息不確定性是解決智能問題的本質。再後來,高性能CPU、GPU和計算集群等的規模化,科學家們重新意識到神經網路方法(尤其是深度學習)的有效性,開始轉向對基於神經網路的機器翻譯研究。

1、微軟

MSRA(微軟亞洲研究院)於2012年10月底在天津舉辦的「21世紀的計算大會」上發布的語音機器翻譯實時演示系統,標誌著機器翻譯領域從基於統計的方法向基於神經網路的方法成功過渡,時任微軟首席研究官瑞克?拉希德(Rick Rashid)現場演示了實時同傳的效果,可以說在微軟研究院的優秀科學家的共同努力下,當時微軟在該方面技術是世界首屈一指的。

參考新聞:《微軟計算機「同聲傳譯」用本人聲音說中文》。

2、谷歌

谷歌自2006年發布第一代機器翻譯系統,歷經10年漫長發展,已經從最初僅支持幾種語言發展到今天的103種。今年9月,谷歌發布了最新的多語言神經機器翻譯系統,神經機器翻譯(Neural Machine Translation System,NMT)是一種端到端的機器翻譯方法,它能從大規模實例中快速學習獲得經驗,大幅度提升翻譯效果。11月14日,谷歌將成果集結成論文《谷歌的多語言神經機器翻譯系統:使Zero-Shot翻譯成為可能》,文章中提到NMT系統的關鍵在於Zero-Shot翻譯,它能在無需數據訓練的基礎上實現兩種語言間的翻譯轉化,即完成語言A到語言B的翻譯訓練之後,語言A到語言C的翻譯不需要再經過任何學習。11月23日,基於Zero-Shot的多語言NMT系統正式投入使用。

參考資料:《谷歌翻譯里程碑:基於單一模型的 Zero-Shot 系統正式上線》。

參考文獻:Johnson M, Schuster M, Le Q V, et al. Google"s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation[J]. arXiv preprint arXiv:1611.04558, 2016.

3、百度

百度的機器翻譯系統發展要晚於谷歌,大概是從2011年開始提供服務,後起之秀往往有站在前人肩膀上看世界的優勢。2014年開始,百度就在嘗試做基於循環神經網路(RNN)的端到端翻譯模型的相關研究,2015年5月早於谷歌、微軟一年時間便發布了互聯網NMT系統,這也是全球首個NMT系統,至此開啟NMT工業化進程。產品體系上既能維持原有的統計機器翻譯模型良好運轉,也能較早地佔領科研高地,實現新老技術的融合甚至交替。目前百度已經將翻譯平台的API對外開放,相關成果也已發表在2016年的ACL、IJCAI和AAAI等知名人工智慧頂級國際會議上。

註:百度和谷歌的NMT系統都是基於Yoshua Bengio組2014年的論文《Neural machine translation by jointly learning to align and translate》做的改進。

參考資料:《百度Q3財報:機器翻譯更新用戶體驗 人工智慧為百度賦能》。

參考文獻:Bahdanau, Dzmitry, Kyunghyun Cho, and Yoshua Bengio. "Neural machine translation by jointly learning to align and translate." arXiv preprint arXiv:1409.0473 (2014).

4、搜狗

11月18日,搜狗CEO王小川在第三屆世界互聯網大會上發表《人工智慧的未來之路》主題演講,並展示了搜狗基於神經網路的實時機器翻譯系統,引起在場外籍嘉賓注意,部分外賓甚至摘下同傳設備。王小川表示:「這是搜狗自研的機器同聲傳譯,融合了業界領先的端到端神經機器翻譯技術以及基於實例的翻譯技術,基於大數據和深度學習,涵蓋了搜狗自主研發的語音識別、機器翻譯兩項重要技術。利用注意力模型聚焦源端,使用循環神經網路生成翻譯結果,翻譯的結果比傳統機器翻譯更加流暢,效果更好。」據搜狗官方公布的後台數據顯示,現場搜狗語音識別準確率超過97%,機器翻譯準確率達90%,在各項測評中綜合得分為4.4分,但是目前尚處於demo階段,預計很快將走向實用化。

參考資料:《搜狗世界互聯網大會發實時機器翻譯技術 或讓同聲傳譯失業》。

NMT網路工作原理簡述

以將「互聯網對經濟發展的作用正在日益凸顯」翻譯成「The role of the Internet on economic development is becoming increasingly prominent」為例講述NMT網路大概的工作原理。

首先,該系統將中文長句的詞編碼成一個向量列表,其中每個向量都表示了到目前為止所有被讀取到的詞的含義(編碼器「Encoder」)。一旦讀取完整個長句,解碼器就開始工作——一次生成英語句子的一個詞(解碼器「Decoder」)。為了在每一步都生成翻譯正確的詞,解碼器重點注意了與生成英語詞最相關編碼的中文向量的權重分布(注意「Attention」;藍色連線上的數字表示解碼器對一個被編碼的詞的注意程度)。

基於attention機制的NMT模型框架(百度)

就目前的測試效果來看,統計機器翻譯系統針對短句翻譯的效果較佳,而NMT系統針對長句翻譯的效果則更好一些。

機器翻譯在生活中的應用

以中文環境為例,據統計,全球有大約80%的網頁為非中文網頁,而中國的網民規模已達到7.1億人,其中手機網民規模達6.56億,去年中國出境旅遊的人數超過1.2億,在top20的旅遊目的地共使用了12種非母語語言進行交流。

而另一個殘酷的現實表明,在中國網民的學歷結構(2015年版)分布中,大學本科及以上學歷佔比僅為11.2%,當然不能說學歷低的人外語掌握一定不好,但是從條件概率的角度來看,絕大多數網民的外語交流水平是欠流暢的。

中國網民學歷結構(2015版)

參考資料:《第37次CNNIC報告第六章:網民規模與結構》。

1、出境旅遊

隨著生活水平的提升,國人開始將消費市場瞄準國外,像東南亞、歐美、日韓鄰邦等都是首選出境游站點。而對於旅遊這種語言弱化活動,我們只需要能日常瀏覽、購物、出行和點餐等就行了。比如當你在街頭茫然迷路時,可以向《殺破狼2》里一樣,掏出手機通過實時同傳App請教路人。比如當你看不懂菜單 / 景區指示牌上的外文單詞時,可以掏出手機進行拍照上傳,由專門的App對圖文進行掃描識別,避免鬧出尷尬。

甚至當你的手機處於網路信號盲區時,一個強大的離線NMT系統也能救你於水深火熱,移動端NMT系統由於受到存儲資源和計算資源的限制,比雲端NMT系統研發難度更大,雲端NMT系統可以通過網路將目標句子回傳給後台系統,有龐大的計算集群進行精準翻譯,而離線NMT系統往往只能基於本地資源處理。犧牲部分翻譯準確率、簡化演算法和壓縮模型等(百度翻譯App的模型壓縮高達70倍,內存佔用僅30MB)都是比較常見的手段,在今年8月的ACL年會上,移動端離線NMT更是被列為未來重要研究方向。

2、實時語音翻譯

如前文所說,實時語音翻譯可以看作由語音識別和機器翻譯子系統協同實現。機器翻譯終將取代人工翻譯的觀點也許有些極端,畢竟像政府會議或學術會議等正式交流場合,對專業名詞翻譯持零錯誤容忍率態度,機器翻譯還無法完全勝任。但是對於日常交流場合,機器翻譯已經有取代人工翻譯的趨勢,比較大多數翻譯的目的不是要信雅達,只要意思忠於原文即可。不要總拿「I can can the can he can can」 (意思是:我可以打開他可以開的那個罐頭,而不是:我能不能他能不能)這樣連人腦都繞不過的翻譯示例去為難機器。

小度機器人在ACL-2015現場進行實時同傳

圖為ACL-2015終身成就獎頒獎典禮現場,百度翻譯擔任獲獎者與觀眾的『實時語音翻譯』。

當然,還有許許多多的應用,比如基於用戶表達進行吟詩作對、幼兒啟蒙教育等。隨著各個公司在機器翻譯上的技術投入,「機器會搶了同聲傳譯的飯碗,讓從事這一行業的人類失業」的論調一直處於熱議。其實,從樂觀的角度來看,機器翻譯甚至是人工智慧在很長一段時間裡的發展都不會徹底替代人類工作,更多的是輔助人類工作,減少重複和機械勞作。


如今,各大軟體都在研發和升級軟體的翻譯能力,而我們常用的微信也支持了翻譯功能,現在谷歌也推出了神經機器翻譯系統。不可否認,有些時候,翻譯軟體確實給我們日常學習幫助有作用及推動意義,但是個人認為,短時間內機器翻譯還是完全無法代替人工翻譯的,因為人有思維和情感,而機器不具備這兩個能力,現階段用來查單詞學習還是不錯的。 每當看到這些由軟體翻譯出來的句子,不是語句顛倒和就是語意完全不沾邊,不禁想笑。現階段用來查單詞學習還是不錯的。

你覺得,機器翻譯會代替人工翻譯嗎?

就目前而言,機器翻譯在平常生活中做普通用途可以,而對於專業領域來說,軟體翻譯還不夠能力,技術上也還達不到要求。

翻譯不是一個單純的語言轉換過程,它牽涉到不同的社會和文化內容,是一種跨語言(cross-linguistic)、跨文化(inter-culture)、跨社會(cross-social)的交際活動,是把「源語」SL(SourceLanguage)的語言、文化信息用「目的語」TL(Target Langue)的語言形式進行轉達的活動。

看了各種翻譯軟體,翻出來的句子邏輯和語序有很大的問題問題。這一點在文學作品中得到體現。除了專業領域,我也覺得覺得文學作品翻譯還是暫時不會被機器取代的。文學作品中包含的語境、語氣和感情,是很難靠機器語言來解決的。

人工翻譯,可以體現語言和理解多樣性。翻譯有時也是一件很有意思的是,雖然挺傷腦。同一句話會有不同的翻譯版本,最重要的是能從中體現自己獨到的見解與想法。 而機器翻譯還體現不了。


目前還無太大影響。機器翻譯技術目前還不夠成熟,還無法取代人工翻譯。


但它時刻督促著人工翻譯從業者不斷優化、藝術化自己的專業技能。


因為隨著科技的不斷發展進步,相應技術成熟也只是時間問題。


現在互聯網上90%的信息都是英文信息,很多企業已經看準了翻譯領域的這塊市場。搜狗搜索的[海外搜索],目前已經可以讓中國人直接輸入中文,就能搜到國外網站的相關信息,且直接把信息翻譯成中文呈現。


技術在不斷進步,不止是人工翻譯市場,更行各業都會被影響。



未來的趨勢一直是用計算機輔助翻譯,人工是無法完全被替代的。

筆譯市場也許會有部分會被影響,例如科技類等特殊翻譯,但是對文學翻譯等的影響不會太大。

口譯市場方面,高級會議依然會用人工的同傳交傳,陪同更不必說。

在我看來,工具永遠是工具。


我個人預測會滅掉大多數翻譯公司,尤其是中國國內的翻譯公司。

我就說說了解的筆譯領域。有一次我校對譯稿時感覺不太對勁,有些句子翻譯的很好,但有些句子出現一些非常低級的錯誤。

我第一個想到的是Google Translate,一查果然是機器翻譯。原則上翻譯公司都是禁止使用機器翻譯的。但是不得不承認,Google Translate的一些句子翻譯得非常好,甚至在有些領域比我見過的大多數譯稿都要好。

那麼對翻譯市場會造成什麼影響?我在國內翻譯公司工作過,也給他們做過兼職,我了解他們的德性,他們基本上視質量為草芥,對譯員也是極盡壓榨之能事。我也了解國內有無數多的自由翻譯,每天都在到處找低價稿子翻。

所以你想想這樣的翻譯公司,這樣的翻譯,怎能不被越來越強的機器翻譯取代?現在很多人需要翻譯第一個想到的就是機器翻譯,將來這樣的人會越來越多。

但是對於更加高端的翻譯市場的影響,尤其是對創意類的(比如廣告),以及和其他專業領域(比如和SEO——順便提一下我的強項)相結合的翻譯項目,還有待觀察,至少在可預測的短期內不會造成什麼影響。


機器翻譯在未來的翻譯市場上絕對會帶來翻天覆地的變化。比如谷歌現在就採用神經網路演算法,翻譯得越來越準確。而且近年來人工智慧的不短髮展,機器學習水平不斷提高。這是一個大趨勢。

但是就現階段來說,完全沒有取代人工翻譯的可能性。畢竟翻譯並不是一個跟圍棋一樣結構化規則化的活動。


如果中翻英成熟了,估計中文的一些文化作品可以輸出了,比如大量網文,想想起點美國分站一天三更就帶感。


回答: 會讓人工翻譯市場人員更強, 更有價值.


機器會更善於口譯吧?人類口譯錯誤率高,同傳的話,能譯對百分之九十,就是不錯的同傳了。而筆譯的話,就得譯對99%以上?

等機器筆譯正確率達到95%,基本上就意味著機器口譯達到95%的高水平。除省部級以上的高端場合翻譯,基本上就超過人類翻譯了


個人認為,短期內仍然需要各個領域的尖端人員的人工翻譯,其本質相當於專業層面的校對工作。而低端市場將會受到很大衝擊。

然而現在已經存在許多大、小公司,不尊重專業背景,壓榨廉價勞動力校對機翻,人工翻譯要毀也不是因為機翻領域的發展,而是這些唯利是圖的人類本身。


語言的意境,AI是不懂得。首先AI行業的從業人員就靈性極低。

比如

身是菩提樹,心如明鏡台,

時時勤拂拭,莫使有塵埃。

菩提本無樹,明鏡亦非台,

本來無一物,何處惹塵埃。

AI行業的從業人員有幾人可解答。

吾心似秋月,碧潭清皎潔。

列物堪比倫,教我如何說。

南台靜坐一爐香,終日凝然萬慮忘。

不是息心去妄想,都緣無事可商量。

獨坐清談久亦勞,碧松燃火暖衾袍。

夜深童子喚不起,猛虎一聲山月高。

碧澗泉水清,寒山月華白。

默知神自明,觀空境逾寂。

這些詩歌,AI行業的從業人員有幾人懂得!

還指望AI機器翻譯出來!真是大笑話!


其實機器翻譯可以提高人工翻譯的效率,以前一天只能翻譯2千字,用了機翻翻譯出個大概後再做修改反而能達到上萬字,共同協作比完全取代好多了。因為職業的關係,最近用小牛翻譯系統翻譯了不少少數民族的新聞,覺得還挺好使維吾爾語和藏語都還可以,最起碼一眼看過去知道大概的意思了。


機器翻譯有的還可以,但是還是不能用。如果翻譯真的那麼簡單的話,很多時候就不用那麼燒腦了。


沒太大影響,反而幫了人工翻譯一個大忙

難不成你讓老闆一個人去跟別的老闆談判,用機器翻譯,然後簽合同???這老闆面子都沒了


我覺得機器翻譯取代人類翻譯是早晚的事,既然有那麼多專家相信超級人工智慧的出現,那麼作為人工智慧的基石 語言 和 視覺 ,肯定是首先發展這兩項技術啊,你想想嘛,人工智慧看一句話都看不懂,那還叫什麼人工智慧。


機器翻譯如果想取代人工翻譯,有兩個途徑,一就是改變人類的語言規則讓符合機器的邏輯,相當於創造一門新的語言,即便如此機器可能還是很難體會各種語氣和情感。二就是機器有了情感有了自己的智慧和創造力,那就是人類要被顛覆!


高端翻譯市場,無影響。低端的有影響。翻譯價格貴的,身心也比較投入,自然價格也比較高。


推薦閱讀:

怎麼樣快速又高質量地翻譯一篇英文(尤其是科技類的)文章?
「准」字怎麼翻譯成英文?
未經授權的情況下,翻譯外文小說並發布在互聯網上是否侵權?
Trick or treat 應該怎麼翻譯?
翻譯作品中經常會出現一些中文諧音的幽默,翻譯者是怎麼翻譯出這樣的內容的?

TAG:人工智慧 | 谷歌Google | 翻譯 | 機器翻譯 |