如何評價「搜狗世界互聯網大會發實時機器翻譯技術或讓同聲傳譯失業」?

搜狗CEO王小川微博:

據說同聲傳譯的薪水是每小時7000~10000元,就是這個工作極度燒腦,翻譯15分鐘就得換人。現在該機器人登場了。烏鎮世界互聯網大會,搜狗首秀實時翻譯技術。以後孩子別再報考這專業了。

相關視頻:同聲傳譯或成歷史!搜狗自研機器同傳亮相世界互聯網大會 - 騰訊視頻

相關新聞:搜狗世界互聯網大會發實時機器翻譯技術 或讓同聲傳譯失業


我不是科技工作者,但是作為一個偽Geek,對科技界的大新聞還是很關注的。

打上半年開始就在立這個flag了,從Google的神經網路翻譯系統到搜狗的殺死同傳。今兒看到這些個新聞標題,我王尼瑪就特么很不樂意了。

同聲傳譯或成歷史!搜狗自研機器同傳亮相世界互聯網大會

搜狗世界互聯網大會發實時機器翻譯技術,或讓同聲傳譯失業

如果將來翻譯上出現偏差,你們是要負責任的。

嘴炮打的震天響,實際視頻的翻譯效果高中英語水平就看得出還差得遠得遠,這已經很能說明問題了。視頻里的譯文錯誤和傳達上的偏差,且不論在正式的工作場合,就是本科生的課堂上這麼搞估計都會被老師勸回家種地。你狗取代同傳之前,先超越谷歌翻譯吼不吼啊?

這是谷歌發布大新聞當天我的朋友圈測試截圖。

上面那些中學生都不會犯的錯誤,哪一個不是極其低級也極其嚴重的翻譯事故?

我認為這恰恰反映了機器最大的局限。語言是活的,譯員在接到消息後本身也在不斷地判斷,一些個人習慣之類的無意義言辭也不會幫他再說一遍,有時甚至還需要實時糾正發言人的口誤。不舉栗子了,一舉例就被敏感詞。所以我認為機器一朝過不了圖靈這一關,就一日不能像圍棋一樣單靠一個先進的演算法,模仿的足夠好便可以打敗人類譯員。我不否認語料庫的積累和科技的發展,但是我覺得鄙人再學個新專業可能比AI發展到這程度,能稍微快點兒。

很多人就是看不到信息無損(至少從表意層面上)轉換和傳播的難度和價值,甚至覺得機翻中的機器味兒還挺萌的。但是你就看看這谷歌大法的翻譯質量,還有搜狗居然好意思腆著臉演示出來要取代同傳的那個質量,外事無小事啊,真到了外交層面上你敢託付這樣的機器對外傳達一國之策?你再看看這濃濃的逐字逐譯的重新定義英語的神特么機器翻譯腔,你確定別人能理解?那我們幹嘛還逼著自己看各種參考書,用腦力來經年累月地同自己的中式英語誓死鬥爭?行文流暢尚不可達,就更不要提文學翻譯這種智力密集型的再創作在忠實原著的基礎上給跨語言跨文化讀者帶來的審美享受了。現在的大環境是學英語的技術盲,搞技術的對英語行文最基本的審美和評判能力都沒有。那下次再取代同傳之前,你們起碼先自己處理好機式英語的問題吼不吼啊?

且不談實際翻譯過程中尋找理論和經驗依託不斷決策和解決問題的過程。

就簡單說說單是翻譯的準備就是機器和演算法目前所不能勝任的智力勞動。

1.翻譯的前提是理解。

以翻譯為目的的閱讀是一個追求真相的過程。這種真相體現在五個層面。一是事實真相,即保證譯文起碼要符合原文意在反映的客觀事實。二是邏輯真相,即文本的因果,聯繫乃至謀篇布局的合理性。三是寓意真相,即文學翻譯中典故、寓言乃至想像與表達意圖的一致。四是美學真相,即傳達文學作品中的形式美和韻律美,乃至準確反映非文學作品行文的流暢得體和言語力度。五是語言真相,即一種語言的成語有時可以用來彌補另一種語言表達上的不足和缺失。

2.理解的前提是批判性閱讀。

所謂批判性閱讀,是指認真、積極、深入的分析性閱讀,是在特定文本中發現信息的思想和技巧。人類的思維使我們能夠根據已有的知識、常識或邏輯深入思考閱讀的內容是否正確,邏輯是否連貫,並對特定文本信息進行評價甚至根據譯入語邏輯表達的習慣重新謀篇布局。我們需要據此理解、查證文字背後的客觀事實;分析作者的寫作意圖;發現和澄清歧義;保證譯文語氣連貫行文流暢甚至發現原文中的問題。一篇文本,當我開始翻譯的時候,才發現很多時候有些在閱讀中一掃而過以為理解了的東西實際上並沒有真正讀懂。這種批判性閱讀和對理解深度的要求,受過良好訓練的人類尚且需要付出極大精力,遑論圖靈測試都沒可能活過幾輪的機器,也別再吹還需要雙語對應翻譯的機翻了,而這種翻譯方法本就是譯者大忌。

雖然我非常支持人工智慧的發展,但就這麼說吧,真到了人工智慧發展到能夠理解自然語言的強人工智慧階段,同傳還能不能混飯都是小得不能再小的小事兒。這種程度的人工智慧幾乎有能力涵蓋人類社會生活的方方面面,其為社會和產業結構帶來的震蕩遠非工業革命的大規模下崗潮所能比擬。現階段的弱人工智慧主要是三件事情,一個是幫助譯員提高標準化文本的翻譯效率,第二可以服務於精度要求不高的日常翻譯(我有些法語文本都是用谷歌翻譯過來快速瀏覽個大概),還有就是為魚龍混雜的市場淘汰一批低端二把刀譯員。我當然支持人工智慧的發展,這是高新技術,是歷史的行程,我怎麼能不支持,這對譯員來說也是很大的。有朝一日倘若真被取代了大不了轉行,我祝福人工智慧取得重大突破,發展一個。

但是這個姿勢就跳出來雷人,強行作古職業同傳。

還真是叫人忍俊不禁呢。:-)


大家都說的很好了,我提供一個不同的視角吧。

同傳現在已經是一個相對比較成熟(但還有待規範)的行業了,需求隨著國內外交流的加劇,也在不斷增大。很多之前不需要翻譯、同傳的場合,慢慢的也有同傳的滲透,比如公司內部討論、知乎Live等等新的場景。客戶越來越多,不知道大家有沒有想過,客戶對於翻譯的需求是什麼?僅僅是語言轉換嗎?

從功能上說,我覺得搜狗的翻譯某一天,會有技術能力實現無縫的轉換,只是時間問題。畢竟對於技術的發展,尤其是本土的創新,從大的趨勢上看,我們應該支持、擁抱和保持樂觀,而不是用個例去否定技術的進步性,打壓創新和探索的積極性。

但是很多場景下,你會發現,翻譯的存在意義是很多元的,不僅僅是為了翻譯而翻譯。

翻譯的最終目的,是溝通。

而溝通本身,就是一種微妙的藝術,而不是純科學。也有知友提到了,翻譯是一個再創造的過程,而再創造的程度、標準,是非常主觀的,沒有標準答案。比如上面有個例子中提到UN同傳——我們可能認為這句話點到為止就可以了,但是代表們卻認為一定要把比喻中的本體說出來,但是對聽眾來說,也許知道了這個本體也並沒有什麼意義。作為翻譯,在從聽到說那麼短的時間內,要做出判斷、取捨和選詞,是很有挑戰的一件事。一場會下來精疲力竭,往往累的不是語言,而是語言背後對權力的權衡、形勢的判斷以及風險的預判。

因此很多場合下,譯員並不是作為一個語言轉換機器而存在的,他們是一個調解者。曾經有客戶說過,我們需要翻譯去為我們爭取思考的時間;我們需要翻譯去替我們化解激烈的矛盾;有一個第三方在場,我們有時還可以「不厚道」地歸咎於翻譯沒翻到位從而爭取自身利益的保障。很感激客戶的坦誠,從我個人來說,作為一個純技術派出身的翻譯,剛出道的時候,在被客戶投訴時,往往會非常自責陷入自我懷疑的情緒,認為是自己功力不足。但是後來經歷的項目多了,也就看清楚一件事背後複雜性,慢慢地可以放下包袱,問心無愧地享受這個過程了。

不知道我表達清楚了嗎。也許有一天搜狗、或者谷歌、或者百度,以及各位程序員,可以從機器的角度非常精確的做到字對字的翻譯,功能上是可以替代的。但是情感上,或者情境上,人與人之間的互動能夠達到的效果,是機器翻譯沒有辦法替代的部分。所以在做翻譯大概五年的時間裡,我並不會擔心機器會讓我們失業,但是我會擔心那些擁有語言技能和商業技能的專業人士,能夠比翻譯這個第三方更完美和順暢地促進溝通,為企業更有效率地創造價值。

不過從這個角度看,一名好的翻譯不應該僅僅關注語言轉換的部分,而是一個綜合素質都很厲害的專業人士——快速學習能力、溝通能力、談判能力、臨場應變、抗壓能力,以及從業時必須要具備的時間管理、自我品牌管理、客戶關係維護、問題解決能力等等外延技能。這樣的能力在手,不管在哪一行,恐怕都不會擔心失業,也不會擔心搜狗會取代這個職業。因為任何所謂「成功」,從來考察的都是多個要素的綜合體,而不是純粹的技術本身。

希望這個答案,給很多提出這個問題的學生朋友,提供一些指導和信心。自律、堅持、磨練、進步、明智、反思,我們的目標是通過一份工作去挖掘、培養這些良好的品質,自我成長,而不是追求某一個具體的職位。「同傳」這個身份不會給你帶來任何光環,除非你知道你擁有的比「同傳」多得多。


我女兒在家說中文,在幼兒園說英文。現在她們兩歲半。

最近她們總是跟我說:媽媽我要那個餅乾在桌子上。

我說好。於是就把餅乾放在桌子上。

然後她們就開始大哭。

幾次之後我終於明白怎麼回事。

這是典型由翻譯不暢引起的溝通危機。

------------------------------------

有必要陳述一下我的觀點,引用一句話:

Interpreters will never be replaced by technology, they will be replaced by interpreters who use technology.

----Bill Woods


不斷看到有新的回答,其中有許多人工智慧從業者,認為自然語言理解與輸出不是一個非p問題,肯定是可以在一定期限內解決的。我必須補充一下在這方面的一些看法。

首先,翻譯並不是機械的語言轉換。它是具有創造性的活動。翻譯理論也強調在口譯中最重要的是「達意」,要「脫離語言外殼」。高端譯員和入門譯員的差異並不只在於處理語料的速度較快、可以瞬間應用的字片語合較多。翻譯歸根結底是交流,其中人的因素是極其重要的。好的譯員(也是同聲傳譯譯員的及格線)不應該是鸚鵡學舌,而應該在理解後進行輸出。在工作時,必須在瞬間做出判斷以找出儘可能最好的表達方式,而這些判斷是基於對講者意圖的理解而做出的。這不僅僅是語言上的判斷,其中還有價值判斷。同樣一句話、同樣的字片語合,在不同語境下的表達目的是不一樣的。不同的講者在不同的場合即使表達的是同一個意思,也要根據情況不同而使用不同的詞句,譯者要做社會身份方面的判斷。這方面機器翻譯的判斷能力比較弱。

另外還有一個很現實的問題:講者大部分不是完美的。許多講者在說話時有非常多的重複、冗餘、矛盾、語言混亂。在不影響意圖的情況下,同傳譯員應該去蕪存菁,儘力簡潔地表達實際含義,甚至改變句式,選擇更好的邏輯結構。這和純粹的語言轉換不在一個層次上。即使講者的母語非常流暢,其中也有文化的因素必須考慮。許多表達,如果死扣住原文,字對字翻譯過去,異國聽眾會有嚴重的理解障礙。

我雖然不是人工智慧從業者,也知道這種程度的強智能對於現在的人工智慧領域來說仍然是可望不可即的。就像另一個答主所說,如果這種程度的強智能也已經可以實現,那問題就已經不僅僅限於同聲傳譯一行,人們所應該做出的應對也不僅僅是「不要學同聲傳譯」這麼簡單了。到那時,或許工作都失去了意義。

P.S.我覺得這個問題和機器人能不能超過書法家,Auto攝像模式能不能取代攝影師一樣,都問得有些歪。能夠評判出優劣的作品,並不等於能夠機械式量化評判標準。歸根結底,是人在做判斷,是人才有價值。

===

今天學校有UN資深譯員來做講座,分享了不少故事。中國代表團的要求很高,一些諺語翻出了準確意思,但沒有用原來的意象,就會投訴譯員(雖然翻譯質量很高)。受過這麼多年訓練,堪稱中英語對全球最高水平的UN漢語同傳箱,在做了多年程式化主題,並且在UN字對字、追求準確、不過度要求目標語地道優雅流暢的前提下,依然會有一些錯誤和妥協,你怎麼要求機器做得更好?能用到同傳的會議,級別都不低,一個錯誤就是致命的。面對漢語這種高情景語言,你放心交給機器?翻錯了怎麼辦?

另外請大家不要高估語音模擬技術。出來效果不夠自然的話,要讓市場接受也很難。看字幕的效果也不好。

筆譯的機器輔助翻譯姑且都需要大量語料積累,更別說更不定形的口語表達。語料庫可是很貴的,機器口譯的高頻次表達積累成本也可能會比較高,不值得用。

另外漢語是高情景語言,我認為要讓機器理解是比較難的,要保證低失誤率更難。看搜狗這次發布的效果就知道了,翻出來的英文沒法看。

歸根結底,效果不好,準確率沒有保證,用戶體驗不一定好,成本不一定低。

我覺得,要讓我們失業,恕我直言,還早呢。


我真的看不下去這個問題底下的有些回答。好像他們只能接受我們這些學同傳的,做同傳的看到搜狗的即時翻譯,馬上痛哭流涕,感嘆生不逢時,最後捲鋪蓋回家才好,看到有人指出這個東西現在還不太行,一下子就比搜狗內部參與開發的人還要激動,一味只是在那裡陰陽怪氣,儼然我們已經成為一群冥頑不化的人,不承認自己是時代巨輪下的螞蟻一般。

請你們別再自high了,這種需要造勢的新聞標題上,記者都不忘加一個「或」字,而且這個問題下有兩個搜狗業內團隊的人,自己都不敢說「同傳馬上就要下崗」。

誰也別扯什麼「未來一定會被取代」,100年後也叫未來,那時候跟你我還有關係嗎?

比同傳技術含量低的職業多了去了,怎麼沒見被取代,現在還好好的呢?

alphago把李世石打敗了,難道人就不下棋了嗎!

拜託你們,和同傳業內人士以及搜狗業內人士一樣,擺正心態,面對現實,我們客觀一點,好不好?

----------------------------------原答案分割線-----------------------------------

很喜歡 @陳偉 的回答,因為他作為一個業內人士,能夠客觀地看待機器翻譯與人力翻譯之間的不同特徵和差距。我完全不懂技術,只能從一個學同傳的學生角度談一下自己的看法。

作為一個學同傳的,未來很有可能要踏入同傳這個行業。但前有谷歌翻譯,現有搜狗翻譯,人們紛紛唱衰同傳這個行業。我每次都懷著忐忑的心情點開新聞,但每次都安心而歸。

我有兩個觀點和陳偉一致:

1.隨著技術的發展,目前的效果只是一個開始。

2.但現在的機器翻譯水平完全無法取代人工翻譯,同傳更是如此。而且現在機器翻譯的表現遠遠稱不上合格。我相信新聞里那些摘下同傳設備,轉而依賴搜狗即時翻譯的外國聽眾也會贊同我這一點。

不說虛的,咱們來看看視頻里的機器同聲傳譯到底表現如何:

王小川:「那麼在這裡面,我要開始暢想,未來的路在什麼地方?」

機器翻譯:So in this, I want to think about it. Where is the future of the future?

可以看出,目前機器翻譯的一大特徵就是機械性

這個特徵在「Where is the future of the future?」有所體現。由於機器無法體會上下文,所以出現了這麼一個語焉不詳的句子,但人工翻譯熟知講話的語境,所以如果是我,我就會翻成"what is the future of (the development) of search engine?"

另外,「那麼在這裡面」其實只是王小川的一句無甚意義的銜接句,一個「so」就足可以解決問題,如果說成so in this,老外就會不懂:in what?what does your "this" mean?

那麼更深入一步,機器將如何識別同樣文字在不同語境下的意義?比如:

1.那麼在這裡面,我要開始暢想,未來的路在什麼地方?

2.那麼在這裡面,其實是有一隻貓的。

從一個行外人的角度,我想這個技術問題想必要通過很長時間的發展才能被攻克。

王小川:「從我自己的一個描述(:)搜索的未來就是人工智慧時代的皇冠。為什麼這麼說呢?

機器翻譯:A description of my own. The future of search is the crown of Artificial Interlligence era. Why do you say that?

弊端仍舊是過於機械。我會處理為:"I would say that XXXX. Why would I say so?"

而且機器翻譯的結果暴露出機器仍舊需要學習如何斷句。比如:

王小川:我會認為搜索的未來(,)就是問答機器人。

機器翻譯:I will think the future of search. The QA Robot.

類似的問題在短短的1分50秒里出現很多,這也證明機器翻譯與人力翻譯仍有不小的距離。現在的機器同聲傳譯,其實也只有【機器即時機翻】的效果,離同傳還很遠。(加粗字為11月24日添加)

總之,從一個同傳學生的角度來看,目前還看不到威脅(未來的事情誰說得准?),相信比我一個學生水平更高的同傳業內人士,也會有相同的看法。

從我個人的私心,我當然希望這玩意兒幾十年內別發展起來(不然我拿什麼吃飯),但科技高速發展的洪流不是一兩個人可以阻擋的。


這種言論每天都有,最近最火的大概是訊飛了。玩了一個簡單的,截圖博大家一笑。要知道訊飛的語音識別技術已經是國內一流,但機器翻譯還是無法囊括人類思維的多變,以及人類講話的即興。

機器尚且get不到一些東西

看到了嗎,如果speaker說話的時候經過思考,有遲疑,有重複,機器還是無法鑒別和更正的。「大力推進」就會變成「大理石推進」。

最後,開心滴唱了兩首歌兒歌(第一首是《種太陽)。它暴走了


就這?同傳?


我看了王小川在烏鎮互聯網大會的演講以及當時屏幕下方的實時文字翻譯,可以這樣說:

1. 您若希望自己的演講被外國人真正理解,請花錢聘請最好的同聲傳譯員;

2. 在公開場合的正式演講中,哪怕有一個詞翻錯都可能釀成事故,只要有一次重大錯誤,後果恐怕誰也無法承擔;

3. 人的語言是活的,機器翻譯永遠也無法承擔有思想之人的同聲傳譯工作,優秀的同傳譯員永遠無法失業,價值會越來越高。

4. 越是有人呼籲不要報考翻譯專業,真正愛翻譯的人就越要好好學翻譯,因為水平不高的譯者/譯員都被機器翻譯替代了,能夠做高質量翻譯的人就越來越值錢了。

分割線---------

補充回答一下:

我沒有看過現場,只是在網上看到一個29s的視頻,看完之後我對搜狗聲稱的90%準確率是持懷疑態度的,請大家看下面的截圖:

不客氣的說,沒有一句話是翻譯對的。我很疑惑,為什麼沒有人指出這些錯誤。

我想再補充一下,我是支持機器翻譯發展的,在現有技術的推動下,機器翻譯會越來越好。但我自己是不怕被替代的,機器翻譯越好我越開心。


觀點一直不會改變:機器輔助翻譯一直都有,而且越來越精密,會幫助譯員提升工作效率,但機器是絕對取代不了人來進行翻譯工作的。

人的思想是通過語言交流的,裡面的情感、內涵只有人才能體會得到,如果機器連人的情感和文華內涵都能夠理解得一清二楚,那不是機器,那是特種人,這種人滅掉人類不是分分鐘?(腦洞真的很大。。。


1.程序員英語普遍不行,口譯員往往技術盲,這是造成信息不對等的主要原因

2.機器學習演算法只有在找到好的結果的時候,展示才有信心,當我們要吹牛逼的時候,總要找一些正好不錯的案例;當你把精度提上去的時候,機器學習就會懵逼。也就是如果你把這個放在日常使用中,接觸各種案例數據,然後你指望像演示那樣準確,你就等死吧

3.同聲傳譯對人的訓練苛嚴程度,目前機器學習達不到,在不遠的未來,也不會那樣樂觀。當然市場上有一些二把刀的同傳,用機器幹掉他們,可以說是眾望所歸

4.當然機器會代替一些人的工作,但是代替的其實是低端的工作;但是低端的人,在哪裡不都是底層呢,到哪裡不會收割呢?

6.機器學習幹掉同聲傳譯的難度,要比搜狗幹掉百度的難度大一些。嗓門大不管用。

7.學英語口譯的同學不要害怕,你要想想那些寫程序的同學,他們有時候連技術文檔里的單詞都發不出音,當然英專里的英語渣也很多。

8.我懂一點口譯,也懂一些計算機。我的意見是,如果你真的擔心,你去讀他們的論文好了。

9.別瞎操心,做好你自己的事情。走到頭部的才能活下來,在底層的,在哪都是一樣的。


沒聽說過米其林三星大廚擔心家庭煮fu搶自己飯碗的。就醬。


哎呀居然搜到這個問題。

利益相關,腐國MA in Conference Interpreting 在讀,同傳方向。

重新口譯第三屆互聯網大會是我一個同傳作業之一,首先我可以肯定,正式會議的所有內容都是人工的同傳。現場不確定因素很多,比如發言人打頓,即興說兩個笑話,現場噪音干擾等等,我並不認為目前的翻譯機器可以處理好。

第二,很多人有一個誤解,認為同聲傳譯只要做到"同步,逐句翻譯"就可以了,實際工作中不是這樣。我研究生第一學期的口譯課基本在做公眾演講(Public speaking )和演講概述(speech summary )的訓練。譯員在口譯中,不僅需要翻譯演講內容,還需要傳達演講人的態度,情緒和語氣。最簡單的例子,腐國人很喜歡用諷刺的語氣表達反對意見,有時候演講人的立場甚至需要從TA的表情,語調,甚至部分觀眾的反應中揣測,如果僅僅是字面意思的翻譯可能會曲解內容。

另外,有些演講人可能準備得不充分,或者天生不擅長演講,因此有時譯員也需要幫他們補充邏輯鏈接,把內容整合得更加精準。字面翻譯一句不省,觀眾可能會崩潰……借用我們老師的話,"A good interpreter should make sense out of nonsense."

所以我不認為同傳會被人工智慧取代。倒不如說人工智慧能幫助譯員承擔一部分工作吧。

最後上幾張圖。

有些媒體真的不要嘩眾取寵啊講真……這種翻譯軟體真的值得吹嘛╮(╯_╰)╭

手機打的,排版見諒~


翻譯是一個古老的職業,也是一個不會消失的職業。

使用不同語言的人際溝通時需要的翻譯,不僅涉及到辭彙的翻譯,還有現場的情景、兩種文化差異、發言人地位等等綜合因素的考量。這些是機器無法做到的。真的機器做到了這些,Matrix裡面的情節也就快變成真實的了。

避免長篇大論,舉一個簡單的例子:

一個國家的最高法院院長說:我希望此事得到嚴肅處理。

這個國家的某個公民說:我希望此事得到嚴肅處理。

前者幾乎就是命令。後者是牢騷。這種區別讓機器如何判斷?


謝邀,作為從前的程序猿,今天的口譯民工,只想說,呵呵。

1.誰知道演講稿是不是他們的同傳程序已經自己學習過一遍了。。。。語料庫里肯定也沒少放老大的演講吧。

2.我不否認在旅遊業等精度要求低的行業可以用,意思差不多到了就行,碰到商務談判你還真敢用機器啊,合同條款、數額錯了你找搜狗賠么?

3.國際會議啥的,還是不能輕易用機器吧,國家臉往哪兒擱?

4.我還在等機器學得會反諷、笑話、雙關,並且能聯繫上下文的那天。

5.機器拿到的語料那麼雜,至少得先學會分清,哪個是好的哪個是壞的,該跟誰學吧。

6.多數大型的會議都會涉及商業機密,口譯員都不一定能提前拿到資料,你還要搞個聯網的機器幫你實時把會議信息傳到伺服器上去么?會議同步直播出去了,還收得到門票錢么?併購合同信息先漏出去了,公司還幹麼?還有無數off the record的會議呢?

個人認為,低埠譯本來就是遲早被淘汰的,就像普通的電子錶價格從幾百塊降到三四塊簡直是歷史的必然。高端市場會受到一點衝擊,但影響還不至於那麼大,就像瑞士名表,依然會很貴,很貴。。。

也許機器最後會取代這個行業,但我想不是這幾年。

哦BTW, 有些公司都還沒有知己知彼,就敢說自己能幹掉一個行業么。


利益相關

口筆譯工作者

個人占機器一方,對同傳,特別是對水平一般的口筆譯工作者較悲觀

目前與一些AI業界人員有過交流,曾兩次確切聽到說10年內普通同傳會被替代

也聽到不確定消息說Google技術上已經沒問題但還未推出市場

再說一下自己的思考:

1.有同傳反駁被機器替代時給出一理由是機器無法識別口音,但是我相信只要給機器大量的各種英語方言input再加上對演講者過去講話的input,機器會比人準備得好得多。

2.同傳在會議前都是要進行話題準備以及對講者背景了解的,這一點機器也能做的更好。

3.一些說法是機器無法理解語言的感情,在一些話裡有話或者講者丟包袱,講笑話時無法像人一樣理解。這一點我是認可的,但從這一點推測以後的同傳可能是由機器翻,由譯員監管,在滯後時間範圍內對機器翻譯的少量問題進行改進,編輯。但這樣的話,對譯員在翻譯,腦力和短時記憶方面的要求就遠沒有以前高了。


同聲傳譯的維度太高了。我們從低一點的維度入手。

智能機器已經取代了不少人類的工作,這個必須承認,3C產品的電路板,各種車輛的白車身,精密的齒輪,複雜的鈑金,現在全部都是機器人在做。

目前普遍認為,這種重複性質的體力勞動會迅速被機器人取代,因為機器人不需要休息,不要你給它工資,不交社保,不用宿舍食堂,不用年休假,也不用退休工資。只需要一次性投入購買費用就能為你工作好幾年。

但是這僅限於體力勞動。

更智能的工作呢?

現在,機器人知道你去年在網購上花了多少錢,買了哪些東西,還會根據你的喜好推薦給你你可能想要買的東西。

優酷B站會自動給你推送你感興趣的主題里的內容。

SIRI和微軟小娜可以幫你預定工作時間,告訴你天氣情況,督促你穿衣,還能幫你找適合你口味的飯店,甚至你寂寞無聊的時候反過來調戲你。

tesla/google為代表的自動駕駛汽車,可以識別路牌、行人、紅綠燈、尋找停車場、規避擁堵路段。他們可以像一個人類司機一樣將你安全的運到目標點。你還不用擔心司機抽煙體味吹牛逼。

科大訊飛的語音系統已經能幾乎完美地識別國內帶著各種奇怪口音的普通話,他們的產品可以跟你兩歲的孩子對話,教他唱兒歌或者跟他一起背唐詩。

可以說,只要你給他們足夠高的許可權,SIRI/小娜/訊飛語音等產品完全可以像鋼鐵俠管家賈維斯一樣幫做一個很好的秘書(如果不行的話,至少離那個friday不遠了)。

同聲傳譯有多難呢?

一般情況下,同聲傳譯要延遲說話人三秒左右的時間。在這三秒內,翻譯官做了哪些工作?如果是短句子,就是普通的快速翻譯,如果是長句子,翻譯官需要1,知道你說了哪幾個單詞,2,根據這幾個單詞判斷你後面準備說哪幾個單詞,3選擇可能性最高最符合講話主題的句子,4,翻譯成對應語言,5,說出來。

1不難,很多語音軟體已經能輕鬆做到了。2和3在越來越龐大的資料庫支持下,電腦的效率只會比人更高。4很難,特別是面對漢語這樣的複雜語言的時候,但是我們依然能夠看到在最近幾年的科技發展中,機器翻譯的水平也在逐步提高,而根據IT產業的一般規律,這個速度是指數級增加的,用不了太久機器人就能夠翻譯出通順的句子了,而且別忘了SIRI等助手軟體都已經學會了「聯繫上下文翻譯句子」。5,這個簡單……

大部分人類失業是遲早的事情,那時候就真的是共產主義了。


川總在世界互聯網大會上演示的實時語音翻譯技術是我們團隊完成的,11月17日演示之後在網路上引起了很多人的討論——就是機器翻譯是不是能替代同傳,翻譯人才是不是要失業?

從技術的角度來看,機器翻譯現在完全取代人工翻譯是不現實的,機器翻譯的效果以及穩定性較人工而言仍存在差距,比如在重大國際會議、書面翻譯這種比較嚴謹的場合,機器翻譯受制於效果仍無法被使用。但是不可否認的是,目前機器翻譯的技術已經在顛覆整個翻譯的產業,無論是從輔助譯員提升翻譯效率來看,還是從輔助旅遊出行用戶降低跨語言交流難度來看,都說明今後機器翻譯顛覆甚至取代人工翻譯都是有可能的,但是會是一個漸進性的替代,替代的過程一定是從垂直領域的弱人工智慧到通用領域的強人工智慧,這個替代的周期長短取決於機器翻譯技術本身的發展和翻譯數據量的不斷擴充。從目前的情況來看,技術本身仍有很多難題要攻克,儘管NMT技術已經取得突破,但是仍有很多問題亟需解決,比如突發性的犯傻,另外就是用於機器翻譯的雙語平行語料的積累難度比較大,目前針對口語等場景的語料獲取和標註的成本會更高,而口語翻譯和公文合同等邏輯性較強的翻譯任務相比,語言的靈活性和變化會更多,對數據的需求也會更大。

結合我們本次實時語音翻譯技術來看,這次演示涵蓋了語音識別機器翻譯兩個技術方向,語音識別的部分今年7月份在極客公園·奇點大會上已經進行過演示,傳送門:王小川在奇點大會演示的實時上屏技術是如何實現的? - 互聯網 - 知乎 而本次將識別和機翻結合在一起則是業界首次基於神經網路的「實時機器翻譯」技術在大型活動上的展示,語音識別準確率97%的準確率和翻譯90%的準確率可以證明我們在這方面的能力。

在4年以前這兩個方向是完全不同的兩個專業領域,有著完全不同的pipeline,複雜並且嚴重依賴領域經驗,但是隨著人工智慧的興起,深度學習逐漸成為主流,整個機器學習的流程pipeline從複雜變得簡單,特別是端到端的技術讓整個建模過程更加簡單清晰,語音識別和機器翻譯會更多的被看做相同的seq2seq的方法,方法也逐漸趨同,技術間的交叉也比較明顯,比如attention我們在語音識別和機器翻譯都在使用,因此基於語音方面的積累,我們快速建立起了搜狗自有的機器翻譯NMT框架,同時數據方面,搜狗輸入法、搜索等產品積累的數據,可以更好地為複雜的神經網路模型提供支持,很好提升了模型的泛化能力,在口語、旅遊等多個領域較其他機翻產品取得較明顯的優勢。

但是在NMT框架下,仍然很清楚的認識到,目前機器翻譯的建模框架仍然在不斷演進和進步,state-of-art的方法仍沒有形成,目前系統翻譯效果突發性的犯傻一方面是模型層面需要進一步打磨,模型的結構上可以繼續做深,谷歌8層Encoder+Attention+8層Decoder的方式已經算是目前最瘋狂的做法,最終上線更多依賴工程化和運算力的優化,除此之外就是建模的細節,比如實體詞、集外詞的處理;另外一方面,數據量現在仍然遠遠不夠,深度神經網路具備很強的擬合和泛化能力,但是性能的不穩定很大程度在於數據量仍然遠遠不夠,模型的Variance仍然不小,因此機器翻譯效果的提升不是一日之功,但是隨著運算力+數據+技術的不斷累積,目前的效果只是一個開始。

因此從大的發展趨勢來,機器翻譯技術接近甚至超過大部分譯員的翻譯能力是有可能的,這也是為什麼我們覺得機器翻譯會在未來大大壓縮翻譯人才的就業空間的原因,未來專業翻譯人員的准入門檻和培訓成本會越來越高,工作機會也會變少,因此就像川總微博提到的擇業還需謹慎。

利益相關:搜狗語音翻譯團隊


哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈


第一輛火車跑的沒有馬車快,第一架飛機續航不到二十分鐘,儘管嘲笑吧,然而終有一天 —— 從現在看來這一天來的很快 —— 這些用生鏽的螺絲鐵皮甚至木板拼湊的簡陋的新事物的後代,將會輕易的突破400km/h甚至飛出大氣層。

儘管我的身份是一個相關行業從業者,但我首先是一個人類,可悲的事實是,我們的工作儘管可以被科學的方法和教育提升效率和水平,但相較於技術本身的進步,我們的能力幾乎被基因定死為一個常數,起點很高,但依然為常數。

我看到這個答案下面也許是傳譯這個領域優秀甚至頂尖的從業者們紛紛拿出了各種case嘲笑目前的機翻水平,不少都直戳當前自然語言處理領域內的軟肋,讚美人類本身處理複雜問題的高超能力與策略,但事實上,同樣的,在機器翻譯領域同樣是最頂尖的人類在試圖解決這些難題,如果這些問題不能被解決,說明的不是人類智能的高超,反而恰恰是人類自己的無能。

認為當前的機翻水平已經能夠替代頂尖的同傳,這是愚蠢的,與認為頂尖的同傳在可見的未來不可被替代一樣愚蠢。


說句不好聽的,翻譯就是個藍領工作,或者說技工而已。同傳在國內還是被有關單位神話了。利益鏈條挺大的,各大外語院校,高校,人社部,翻譯考證,等等。點到為止啦。


推薦閱讀:

翻譯哪個領域最缺人才?
翻譯這個行業,未來會不會被科技所取代?
怎麼樣才能當一名翻譯?
有哪些渠道可以成為俄語同聲傳譯?
請問作為一個即將步入大學的學生來說,應怎麼往翻譯,甚至是更高級別的同傳努力?

TAG:人工智慧 | 翻譯 | 同聲傳譯 | 翻譯行業 | 機器翻譯 |