訊飛翻譯超英語六級挑戰專業八級,胡郁:做翻譯承載文化交流使命

今天,科大訊飛翻譯機2.0版本全網開售。新版本增加了攝像頭和屏幕,能夠對中文與33種國外語言進行即時互譯,目前支持國內四川話、廣東話、東北話、河南話4種方言,功能強大。胡郁說,訊飛做翻譯不是要做一個產品、一項技術或者是一個服務,它是在建立在我們在技術創新,能夠改變人類世界堅定信念下的一個長期事業。

下一步,超越專八。

4月20日,科大訊飛執行總裁胡郁在「科大訊飛翻譯戰略暨新品上市發布會」上宣布,訊飛翻譯已經超越中國大學英語6級(CET6)水平。

CET六級翻譯題滿分15分,科大訊飛機器得分12分,超過大多數人類考生。胡郁說,下一步是超越英語專八。

集訊飛翻譯技術大成的翻譯機也在當天推出第二代產品,新品於今天正式全網開售。第二代產品的一個重大更新是增加了攝像頭和屏幕,不僅可以實現拍照翻譯,還能夠讓AI助理在更多的場景中發揮作用。

規則翻譯是傻子,統計翻譯是瘋子,只有運用人工神經網路才是突破口

胡郁首先回顧了機器翻譯技術的演進歷史:

  • 80年代前後基於規則機器翻譯佔據主流;
  • 90年代統計機器翻譯技術;
  • 2011年開始神經網路技術快速發展。

規則翻譯是個傻子,而統計機器翻譯是個瘋子,為什麼這麼說?因為規則性的機器翻譯,如果你不告訴它規則,它就什麼都翻不出來,所以有時候顯得很傻。

統計機器翻譯,因為它是採用統計的方法,所以對於任意的機器翻譯的句子輸入以後,它都能把它翻譯成另外一種語言,但是因為統計的語料覆蓋,很多情況可能機器沒看過,他就會經常的自言自語,說瘋話,所以很多翻譯出來的東西讓你啼笑皆非。

得益於神經網路的崛起,讓翻譯在「傻子」「瘋子」之外,開闢了一條新路。

胡郁說,科大訊飛與谷歌是最早將深度神經網路用在語音識別、語音合成上,創新性地在先期的統計模式識別的語音翻譯中間用上了基於深度神經網路的語言模型,最早做出了當時中英文翻譯最好的系統。

全雙工語音翻譯系統加持,超越英語六級挑戰專八

在翻譯中最難解決的幾個難題,除了語音識別、合成等相關的部分外,還面臨辭彙的複雜性和句式的複雜性

訊飛把attention based neural network(基於注意力的神經網路)模型用在翻譯上,取得了非常好的效果,它能自動地獲取字的匹配和詞的匹配,以及句子中順序的匹配。對於字,採用CLASS語言解耦合方案解決實體詞稀疏性難題;對於句,採用重構的訓練目標準則緩解複雜句式漏翻問題。

2017年,科大訊飛在業界首次推出全雙工語音翻譯系統,全雙工是通過語義和場景的理解,來進行無間隔持續翻譯工作。這個系統被納入到訊飛翻譯的AIUI中,讓訊飛翻譯整體技能增強,包括全雙工、交互、多輪對話、自動語種識別多語言的語種合成等各個方面。

目前,訊飛翻譯已經超越中國大學英語6級(CET6)水平。CET六級翻譯題滿分15分,科大訊飛機器得分12分,超過大多數人類考生。胡郁說,下一步,訊飛翻譯的目標是超越專八。

此外,訊飛已還憑藉這些技術獲得了了多個國際比賽大獎。

  • 第四屆國際多通道語音分離和識別大賽(CHiME-4)全部三個項目第一;
  • 國際語音合成大賽12年連續國際第一;
  • 2016國際知識圖譜構建大賽(NIST TAC Knowledge Base Population)核心任務冠亞軍;
  • SQuAD機器閱讀理解大賽三次刷新國際記錄。

定義旗艦翻譯4大標準,加量不加價

在發布會上胡郁還公布了訊飛翻譯機一代2017年的成績單:20萬台銷量,覆蓋137個國家,服務2000萬次數人群,用戶好評98%。而作為開拓者,一代翻譯機還定義了A.I.旗艦翻譯四大標準:聽得清、聽得懂、譯得准,發音美。

在翻譯機這樣一個高度垂直的市場里,能賣出20萬台設備實屬不易。胡郁說,未來,訊飛翻譯將根據場景細分,打造翻譯全場景產品體系,面向行業的是「聽見」,「聽見」的使用場景為會議記錄、視頻直播、大會上屏。面向消費者的就是翻譯機。

訊飛翻譯機產品經理翟吉博說,翻譯機二代產品的更新,也體現了這一理念。

首先是增加屏幕和攝像頭

現在,僅靠語音互譯已經滿足不了人們的需求,翻譯機二代產品增加拍照翻譯功能,能夠對菜單、路牌、說明書等內容進行拍照翻譯。並對各種印刷體、英文手寫體也能很好識別,支持11種語言。

其次是方言翻譯,目前能夠支持的方言包括粵語、四川話、河南話、東北話4種主流方言,後續還將繼續升級;其對帶口音的普通話整體識別率達到95%。

第三是離線翻譯。首創多語種NMT離線翻譯引擎,離線在線無縫切換;目前支持中英離線翻譯,目標是在2018年世界盃之前,中俄互譯在線離線功能上線。

第四是中文與全球33種語言即時互譯。訊飛認為,這33種語言能夠解決95%的中國出境游用戶場景需求。

第五是提供移動流量解決方案。支持WIFI、4G、免SIM卡上網、一鍵開啟熱點等功能。

此外,AI助手也能在翻譯機中體現,針對景區、交通站點等特定場景提供服務,並支持設備系統在線升級。

更新後的翻譯機2.0版本有星辰黑、香檳金、櫻花粉三色可選,售價與一代一樣,都是2999元人民幣。

做翻譯機的大邏輯:不是做產品、技術或服務,是承載文化交流的使命

運算智能、感知智能、運動智能、認知智能是科大訊飛認為的人工智慧發展的幾個階段,胡郁說,語言和語言之間的翻譯是促進人類融合成一個大的智能體的必要過程,是認知智能的一個重大突破。

「科大訊飛做翻譯,不是要做一個產品、一項技術或者是一個服務,它是在建立在我們在技術創新,能夠改變人類世界堅定信念下的一個長期事業。」胡郁說。

訊飛目前正在實施人類語言大互通計劃,語言翻譯將成為中國國際化、全球化中間一個非常重要的支撐。訊飛還與國際電信聯盟、上海外國語大學、東北大學等合作,共同推動翻譯事業的發展。

而訊飛當初翻譯機出於何種目的?

胡郁說,最開始是援疆援藏過程中產生的語言互譯需求,2016年11月發布翻譯機1.0產品,此後便一發不可收拾,成為人們出國旅行、交流的利器。在今年的博鰲亞洲論壇上,訊飛翻譯機成為官方指定翻譯機,被作為「國禮」贈送給荷蘭首相。

另一方面,跟手機上的翻譯軟體相比,翻譯機的優勢有:抗噪拾音,還原真實場景;隨時隨地一鍵開啟翻譯;獨立硬體,拉近彼此距離。因此在一定程度上是用戶剛需。

最後,談到AI翻譯能否取代人類的問題,胡郁認為,翻譯目前還難以突破文化、生活、知識等限制,無法取代人類,而最終也將成為人類的助手。

去年10月,訊飛與上海外國語大學建立聯合實驗室,高翻人員使用訊飛聽見,對翻譯活動有很大幫助。上海外國語大學高翻學院副院長吳剛也來到了發布會現場,吳剛說,面對新技術的時候不要恐懼或反對,做一個實驗者,在AI新時代,翻譯者要調整心態,找到新的定位,探索人機耦合,把翻譯事業推向高峰。

(本文首發於新智元微信公眾號:AI_era,歡迎關注!)


推薦閱讀:

直播實錄 | 非自回歸神經機器翻譯 + ICLR 2018 論文解讀
現在的Google翻譯能取代人嗎?
基於構建對偶任務的半監督學習調研-1-《Dual Learning for Machine Translation》
從冷戰到深度學習:一篇圖文並茂的機器翻譯史

TAG:科大訊飛 | 翻譯 | 機器翻譯 |