TAUS翻譯行業報告解讀

2017年12月13日,翻譯自動化用戶協會(Translation Automation User Society,簡稱TAUS)發布了一份題為《Nuncest Tempus:Redesign Your Translation Business,Now!》的最新翻譯行業報告,分析了大數據和全球化背景下,翻譯行業今後的發展趨勢和前景。該報告分為「找準時機」、「翻譯行業六大驅動力」、「現代翻譯管道」和「翻譯行業掌門人經驗」四個章節。小編通讀報告後,為大家提煉出值得關注的翻譯行業的現狀和發展趨勢供大家參閱:

第一章中,報告提出了一個叫做S曲線的概念,指出一種科技的發展,都會經歷公司內部研發,該公司內部所有,再演變成一種服務和工具,最終集成到更新的技術平台中的小功能的過程。

那麼應用到翻譯領域呢?

80年代,一些公司隨著自身的向外拓張,出現翻譯需求,在公司內部成立翻譯部門;90年代翻譯行業出現外包服務商,承接翻譯服務;2000年早期Trados,memoQ等的翻譯記憶庫工具誕生,幫助譯者提高翻譯質量和效率;2000年後期垂直領域工具和統計機器翻譯(SMT)逐漸興起;現如今,神經機器翻譯(NMT)的大火。很顯然,就我們經常使用的谷歌、百度和有道翻譯等機器翻譯軟體來看,翻譯產業已經到達了S曲線的頂峰。

以往的翻譯行業是勞動力驅動的行業,以低報價獲得客戶訂單,翻譯質量偏低。在大數據時代,一些高質量的語言資產得以保留下來複用,並導入翻譯機器中進行訓練,出現了機器翻譯比人工翻譯質量更好的例子。漸漸地,人們發現數據的重要性,在某些通用場景下,機器翻譯做的反而比人工翻譯好,並且成本更低,於是業內開啟了一場爭奪數據的戰爭。誰能獲取優質的數據資源,就能提供更好的翻譯服務。

TAUS預測,2020年,全球半數的智能手機用戶都將使用語音科技。常常勾搭Siri的同學對此應該不陌生。隨著語音技術正在飛速發展,語音識別、音頻轉文字等技術的出現,大大方便了我們的生活,也拓寬了語音翻譯的使用場景。

TAUS報告中提出了現代翻譯管道,Modern Translation Pipeline(MTP)的概念,是一種圍繞機器翻譯架構起來的系統,架構如下:

(1)管道的三大特點

管道的運行是由數據驅動;具有自發性、自驅動力,自動化程度高;對多數人來說翻譯是無形的一種服務。

(2)管道分層

管道分為兩層架構:第一層是大公司或超強技術公司,他們負責研發和維護支持翻譯產業的技術架構,如谷歌研發出神經翻譯網路;而第二層是其他技術公司,他們利用上一層的標準架構,開發專門的增值業務,如開發接入神經機器翻譯的介面。

(3)管道要素

管道的架構搭好後,裡面的要素主要有四個:

量子跳盒子:代表最佳的翻譯技術:機器翻譯(MT),翻譯記憶庫(TM),眾包和社區翻譯。

演算法管理盒子:隨著機器學習的進步,一些翻譯系統可以自動選擇譯者和審校,分析文本、質量控制,實現一個系統就能達到一個翻譯公司的效果。

數據化盒子:

內容數據:指TM,原文、譯文等的語言數據,是定製MT引擎的關鍵。

元數據:指語言對、流程、產業和個人信息等元數據,是訓練機器學習和演算法管理的關鍵。

儀錶盤。所有盒子都在這一管道中後,需要一個儀錶盤來追蹤數據,從翻譯完之後的數據中獲取更多洞見。

a. 工程師:幫助搭建管道。

b. 數據分析師:分析儀錶盤反映出的數據,獲取更多洞見。

c. 語言人士開始從譯者的角色,轉變為從事審校、創譯和譯後編輯工作。

希望本文能幫助大家更好地掌握翻譯行業的趨勢。


推薦閱讀:

TAG:計算機輔助翻譯 | 英語翻譯 | 翻譯 |