雙語平行語料庫人工對齊工具說明│Tmxmall Aligner

隨著信息技術在語言服務行業的不斷發展,無論是個人譯員、翻譯公司還是各類企事業單位,都逐漸認識到了語言資產,尤其是翻譯記憶庫在節約成本、提高翻譯速度和翻譯質量方面的重要性。因為通過CAT工具對以往翻譯資料的再利用,不僅可以使重複翻譯的工作量降為零,而且還能幫助譯員在翻譯過程中實現對以往翻譯內容的檢索。這就如同將個人、翻譯公司及企業自身獨有的高價值、針對性強的雙語句對做成了電子詞典一般。而且通過CAT工具來利用積累的翻譯語料,比做成電子詞典更有效,因為在CAT工具中檢索更加便捷、省時。

要實現對翻譯內容的再利用,首先要做的就是語料對齊工作,現在自由譯者、翻譯公司、高校、出版社和行業客戶都有極大的對齊需求,因為積累的翻譯資料一般是原文和譯文分別存儲在單獨的文件中,而要將這些內容存儲在CAT工具中,就需要通過對齊工具做成句句對照的tmx文件。

目前,絕大多數CAT軟體都提供有對齊工具。在使用這些對齊工具進行對齊操作時,用戶需要花費大量的時間對句子進行人工拆分或合併。這是因為積累的翻譯文本中的句子並非是句句對照的,也就是說,譯者在翻譯時,出於對上下文的考慮,有時將原文中的單個句子翻譯成了多個句子或是將原文中的多個句子翻譯成了單個句子。而在對齊工作中,絕大多數對齊工具不能識別這種單個原文句子對應多個譯文句子,或多個原文句子對應單個譯文句子的情況(也就是語料對齊中所謂的難點「一對多,多對一」),從而需要大量的人工拆分或合併,而這也就成了語料對齊中花費時間最多的工作。

針對語料對齊的這一難點,上海一者信息科技有限公司推出了Tmxmall在線對齊,與其他對齊工具相比,Tmxmall在線對齊提供了非常人性化的交互界面,方便用戶快捷地調整對齊結果,極大程度上提高文檔對齊效率和用戶對齊體驗。更重要的是,Tmxmall自主研發的智能對齊演算法可以自動對齊原文及譯文語料中「一對多或多對一」的句子,使得原本需要人工介入的連線調整工作完全被自動化程序替代,從而大幅降低人工干預的工作量,使對齊工作真正變得高效。

操作步驟:

1、進入Tmxmall在線對齊頁面,註冊賬號。

2、選擇語言對,導入原文和譯文對應的雙文檔/單文檔,效果顯示如下。

3、段落對齊後,點擊頁面左上角的「對齊」,機器將自動進行句級調整,效果如下:

4、運用頁面上方的工具欄按照句級對齊的原則進行調整,最後導出文檔為tmx或其他格式,即可。


推薦閱讀:

譯員們的必讀書單
雙語精讀|美元匯率恐引發貿易戰
樂府《春江花月夜》的譯文和注釋是什麼?
【翻碩乾貨】:狀語從句
翻譯質檢書:葉渭渠譯《雪國》(144)

TAG:語料庫 | 計算機輔助翻譯 | 翻譯 |