如何提升翻譯記憶庫的質量?如何去tag?如何去一句多譯?如何去重?
無論是翻譯公司還是個人譯員在翻譯任務中都會積攢一定規模的翻譯記憶庫。這些記憶庫在提高翻譯效率,保證翻譯質量方面起著顯著的作用。但隨著翻譯記憶庫的不斷增多,必然會存在大量重複句對、一句多譯、無用標記等問題,這就需要我們對記憶庫進行清洗和優化,以提升記憶庫質量。我從記憶庫合併與分割、標記去除、句對去重和TMX條目內容編輯四個方面,為大家介紹如何實現記憶庫質量的提升。
我們可以用兩種工具實現以上質量提升。其一:Tmxmall。其二:TMXEditor
首先我們來說Tmxmall。
Tmxmall近幾年發展迅猛,目前已發展成為國內最大的翻譯記憶庫檢索與交換平台,其語料對齊,雲記憶庫,語料商城,TMROBOT等功能極大的提高了譯者的工作效率。
具體操作:
1. 記憶庫合併與分割
記憶庫合併:每次使用CAT工具完成翻譯任務後,都會生成一個翻譯記憶庫TMX文件,這些零散的記憶庫文件不便於管理和利用,因此我們可以按照不同領域將其進行合併。
Step 1在Tmxmall私有雲或TMROBOT客戶端新建記憶庫;
Step 2將若干需要合併的翻譯記憶庫tmx文件導入;
記憶庫分割:當一個TMX文件含有千萬句對時,由於計算機配置原因,往往無法正常查詢使用,需要我們將其分割成小一些的文件來使用。
通過TM ROBOT客戶端的文件分割功能可以輕鬆實現對大型TMX文件的分割。只需將待分割的文件導入,選擇存放路徑和分割條目即可。
2. 記憶庫標記去除
在翻譯文件時,由於文本特殊樣式等原因,往往會出現一些與翻譯內容無關的字元,我們稱之為標記(tag),這些標記在翻譯記憶庫中沒有任何意義,久而久之還會影響查詢記憶庫速度,因此需
要將其去除。
方法一:將TMX文件導入Tmxmall私有雲或TM ROBOT客戶端記憶庫中,導出後即可自動去除所有標記。
方法二,將TMX文件導入Tmxmall在線對齊,導出後即可自動去除所有標記。
3. 記憶庫去重
記憶庫的去重可分為以下幾種情況:(1) 去除完全重複的句對 (2)去重一句多譯的句對 (3)去除原文與譯文相同的句對
去除完全重複句對
Step 1:進入Tmxmall在線對齊,選擇單文檔對齊,將TMX文件導入;
Step
2:點擊高級功能,選擇「一鍵去重」,系統會去除文件中多條完全重複的句對,只保留一條句對(註:該操作無法撤銷,請謹慎操作)。4. 去除一句多譯句段
Step 1 進入Tmxmall在線對齊,選擇單文檔對齊,將TMX文件導入;
Step
2 點擊高級功能,選擇「一句多譯」,可以根據需要選擇性刪除多譯(原文相同,譯文不同)句段,或隨機保留句段,實現記憶庫翻譯句段的一致性;5. 去除原文與譯文完全相同句段
Step 1 進入Tmxmall在線對齊,選擇單文檔對齊,將TMX文件導入;
Step 2 點擊高級功能,選擇「原文=譯文」,系統會自動篩選出原文與譯文完全相同的句段;
Step
3選中這些句段,點擊「刪除」,即可刪除所有原文=譯文句段。6. 記憶庫條目內容編輯
對於需要更新和修改的翻譯記憶庫,可利用Tmxmall私有雲、TM ROBOT客戶端或在線對齊進行編輯。
方法一,在Tmxmall私有雲或TM ROBOT客戶端中新建記憶庫,將TMX文件導入記憶庫,在「查看」中的「預覽」界面進行編輯即可;
方法二, 進入Tmxmall在線對齊,選擇單文檔對齊,將TMX文件導入也可實現對TMX文件內容的編輯與刪除,編輯完成導出即可。
高級功能」中的「查找&替換」還可以實現記憶庫內容的一鍵替換與修改(此操作不可撤回,請謹慎操作)。
這就是提升翻譯記憶庫質量的工具之一,至於如何用TMXEditor實現記憶庫質量提升,請看下回分解。謝謝~
推薦閱讀: