如何看待谷歌最新推出的翻譯技術?


個人認為Google的這個研究方向是對的,但是尚待成熟。

翻譯有純人工翻譯,還有藉助電腦的機器輔助翻譯(CAT,Computer assisted translation),還有傳統的機器翻譯(MT,Machine translation)。

傳統的機器翻譯據說源於上世紀五六十年代的美國,為了破解蘇聯的大量俄語文件而研製。它的原理是辭彙間的一一對應,可以想見,產出的譯文肯定是不通的,或許只能大體看出原文在探討的主題。這樣的翻譯模式或者思路,在翻譯天氣預報這種語彙固定的文本上有一定用處。據說加拿大魁北克地區曾用這種方式播報雙語天氣預報。

機器輔助翻譯是指利用Trados或者wordfast這種工具,它的核心原理在於translation memory,即翻譯記憶語料庫。軟體工具把之前翻譯過的或者集中導入的雙語語料儲存起來,遇到相似程度高的原文時,自動調出之前的譯文,譯者在其基礎上修改,完成最終的譯文。其翻譯單位為句子。

以上介紹的基於語彙一一對應的機器翻譯基於翻譯記憶資料庫的CAT其實代表了實現人工智慧的兩個思路。我自己只是搞翻譯的,對於人工智慧不太懂,但機器/電腦翻譯屬於人工智慧的範疇。人工智慧的關鍵在於教會機器你想讓它認知的東西,對於如何教,有兩個思路。

舉一個我在TED演講中聽過的一個例子(以後我找到這個視頻再補充截圖)。

演講者從事的是圖像識別軟體的開發。一開始採取的套路是通過描述畫面來教會機器識別事物。比如給「貓」設置「圓臉、尖耳朵、長尾巴」等參數,但是效果很差,機器識別了站立著的貓,就識別不了坐著的貓。

後來研發者換了一個思路,模擬人類孩童是如何認識貓的——見的多了,就知道這樣的是貓了(孩子並不會去分析原來圓臉、尖耳朵、長尾巴的才是貓)。於是將大量貓咪的圖片存入機器,並告訴它這是「貓」,後來機器遇到類似的圖片,就能識別出是貓。已有資料庫越大,機器識別得就越準確。

個人認為質量較高的機器/電腦翻譯的實現,也要採取這後一種思路,即基於大量雙語語料的記憶和學習——讓機器記住什麼樣的話是什麼意思,而不是將語句分解為辭彙再去找它們在另一個語言中的對應。

根源還是語言的複雜性,無論是哪兩種語言之間,都不像二進位和十進位之間那樣可以實現一一對應,所以第一種思路的發展前途已經很局限。而第二個思路或許就是以後的方向,互聯網實現的大量語料共享也為它的發展提供了可能。

瞎說一通了。

------------------------------------

補充一點,雖然我自己是個翻譯匠,而且厭惡把線上翻譯隨便改改交差的譯員,但是對機器/電腦/線上翻譯本身心存親切——它畢竟不是人,不要笑話它。

它對於譯者也有用處,對於某些辭彙(不是整句整段),它給的譯文由於基於大量現有語料,往往確實是業內人士用的比較多的說法。

所以大家不要看到機器翻譯產生可笑譯文就拿來調侃,該被調侃的是那些敢用這些譯文的人哪。


謝邀

還沒有太仔細研究,但從商業角度來講,我個人覺得對低端翻譯市場衝擊較大,對商業翻譯和高端翻譯的衝擊並不是很大。

因為有個內容保密的問題,把重要的資料上傳到雲上還是比較危險的一件事兒。特別是google的雲上。所以我相信在中國這個東西只會在中低端翻譯市場,或者小說、雜誌之類的文章的翻譯上得到利用。

看來得先去考個CATTI 1級備著了


您好謝邀。

個人覺得技術還是為人服務。

就當我扯淡好了。



推薦閱讀:

微軟推出同步翻譯有何重大意義?
在哪下載Trados和怎樣利用它?
朋友請你幫TA翻譯應該如何拒絕?
神秘博士中的river song這個名字要怎麼翻譯才好?
HERMES 不是愛馬仕的意思嗎?

TAG:谷歌Google | 翻譯 | Google翻譯 | 漢譯英 |