計算機輔助翻譯技術簡介
計算機輔助翻譯(Computer-Aided Translation, CAT)是一個人們通過軟體獲取更高精度和效率的翻譯流程。
計算機輔助翻譯技術包含以下幾個模塊:
翻譯記憶庫(Translation Memory,TM)
翻譯記憶庫是一個存儲了源語言文欄位和它的翻譯的資料庫,目的是為了再新的項目中進行重複利用。
翻譯單元(Translation Unit, TU)
一條翻譯記憶庫中的數據被稱為翻譯單元。
分段(Segmentation)
分段是一個將語言文字按照邏輯的,可復用的拆分流程。分段,可以按照文欄位落來分,也可以按照句子段落來拆開。(Sentence-Based或者Paragraph-Based)
翻譯匹配(Translation Matching)
翻譯單元對齊 (Translation Unit Alignment)翻譯單元對齊是一個針對源語言句段和目標語言句段的翻譯匹配流程。
這個流程的目的是創建一個翻譯記憶庫。
目前工具支持半自動化的對齊,但是會有錯誤,比如分段不正確,對齊匹配錯誤,這些需要翻譯人員介入進行修改。
翻譯編輯器(Translation Editor)
翻譯編輯器是一個翻譯工作的環境,為翻譯提供便捷的獲取源語言和目標語言的翻譯單元。
翻譯編輯器基本上都會包含拼寫檢查,或者可以給翻譯或校審提供添加評論和狀態指示。
術語提取(Term Extraction)
術語提取是提取單語言或者雙語詞語列表的流程。
術語提取分為語言術語提取(Linguistic Term Extraction)和統計學術語提取(Statistical Term Extraction)。
語言學術語提取是根據語法信息去確定術語詞語和相應的翻譯。
統計學術語提取示根據詞語的重複度來進行提取的。
推薦閱讀:
※OS X Lion 的簡體中文界面有哪些翻譯 bug?
※撇號的兩種寫法
※Airbnb的本地化營銷:從00後到中老年群體
※如果 十二兵團由胡璉當司令官 那 么徐蚌會戰 會贏嘛 最起碼是個平手?
※如何提升遊戲本地化時的翻譯技巧?