機器翻譯(machine translation)技術有哪些商業模式?
機器翻譯類似於「語音識別」,獨立存在商業模式有限。一種方式是把這個技術融入到其他產品中去升級其他產品,讓其他產品更強大,比如搜狗今天發布的海外搜索,讓對英文不精通的人用中文來搜索和閱讀英文網頁,提升整體搜索的競爭力。參見http://overseas.sogou.com
首先我覺得要把機器翻譯和單詞翻譯區分開。現在很多網路詞典,僅僅是輸中文詞出英文詞這樣,或者反過來,題主你懂的……可這不是機器翻譯。機器翻譯是翻譯連貫完整的句子,翻譯單詞之後還需要按照語義和語境調整語序、插入感嘆詞等等,難度非常高。一個成熟的機器翻譯產品應該是核心演算法+界面。這個界面可以是讓用戶輸入句子的界面,就像有道詞典那樣;也可以是程序的介面,允許程序員輸入字元串。
說到機器翻譯的商業產品首先想到的就是被大家玩壞了的Google Translate……
早年Google Translate是免費的,允許你調用他的API,大約就是輸入一段中文進去,過了一會兒就返回一段英文過來。這個功能還算好用,而且是免費的,很受歡迎。我還拿這個API做過一個小網頁程序幫助翻譯文章。但是後來Google把這個API封起來了,要付費才能使用。我覺得這個商業模式應該算是題主想要的東西。其實就和一般的網路詞典一樣。除了網路詞典這樣的軟體的形式之外,也可以做設備。比如和語音識別結合起來,做一個盒子,有麥克風輸入,耳機輸出。對著麥克風說話,識別成句子,然後翻譯,接著用另一種語言讀出來,輸出到耳機。這樣的話很多場合下語言不通的人就可以面對面談笑風生了。
但是。。。。。。
機器翻譯的問題是,在現今時代,沒有哪個機器翻譯演算法或者程序敢拍著胸脯說自己屌炸天什麼都翻譯得出來,就連偉大的Google Translate都不行。所以人們沒有費心去挖掘它可行的商業模式。 現在的機器翻譯正確率太低,以至於人們普遍不對這項技術抱期望。沒需求,就沒動力,技術總是這樣的。
另外,人工智慧學家爭論不休的問題是,機器翻譯是否可以實現。因為翻譯這個事情有時候是件藝術,比如Adele的Someone like you,翻譯成中文可以很難聽也可以很美,完全取決與翻譯者的姿勢水平。一個訓練好多年的翻譯者都不一定能掌握這門藝術,何況機器呢?
題主再過200年問這個問題可能才會有明確的答案吧~商業模式不知道,但個人認為這是個必然的趨勢,而且是個不小的空缺。原因很簡單,互聯網這麼大,還有這麼多中文、英文之外的好的網站、文獻資料,乃至購物網站等等,就在那裡,基本無法access。其實換個方向,中文的網路世界也是有越來越多的好東西啊,比如萬能的淘寶等,但世界上才有多少人懂中文。
前陣子谷歌發布了最新的成果,將神經元網路融入機器翻譯,引起了不少人的關注。我們且不談目前該技術的具體效果如何,但對於「自然語言翻譯」而言,這項技術相比傳統的「單詞翻譯」而言,絕對是意義非凡的。
這意味著一種新的可能,讓人們能夠徹底打破語言的障礙。在技術不斷革新的今天,我們不應該放棄任何一種可以為之嘗試的技術可能,因為每一次嘗試都可能帶來新的突破。
而@王小川發布的「搜狗海外搜索」,確實是技術應用於實踐的革新。全球首次把深度神經元網路的翻譯系統,變成完整的和搜索相關的產品,去惠及每個中國的用戶。這是將技術實際應用於產品中,讓用戶無界進行信息搜索。
搜索+翻譯,是一個極佳的使用場景,但對於技術要求極高,是「機器翻譯」目前有了突破性的發展才能得以實現的,並不是很多外人想像的那麼簡單
1 機器翻譯技術可以幫助翻譯公司的翻譯人員提升工作效率,雖然機器翻譯出來的結果並不能保證100%正確,但是有一部分句子翻譯的還是可以的,只需要翻譯人員稍作修改。如果翻譯人員能夠充分利用這部分高質量的機器翻譯結果,那麼他們的工作效率將會得到大幅度提升。2 機器翻譯技術可以應用到電子商務領域,幫助電商拓展開外市場。3 大型企業可以利用機器翻譯技術構建私有機器翻譯系統,確保企業內部機密信息的安全
去看看網路小說《數字生命》就行……這裡引用一些:1.將終端放到平板里,商人不懂外語也可以直接去任何一個國家談生意。
2.為國際會議提供臨時服務,會場任何一個角落說任何語言都能被即時翻譯。
3.為一個商務社區提供長期服務。商務社區的例子是各種XX廣場。另外,由於完美的機器翻譯意味著語言已被程序理解,那還可以用於電話客服。對於海量、快速低價、信息碎片、多重複、多行業多語種的跨境電商翻譯服務而言,應用機器翻譯是提高效率非常重要的方式。阿里就有組建自己的機器翻譯團隊來家強語言服務。包括15年,收購的翻譯365,也自有機器翻譯。這裡,不僅有我們一般意義上的文字,也還有語音翻譯系統。有公司在處處採購比如商務英語語音庫,或者同傳交傳場景的語音材料,估計也有做這塊的機器翻譯。
不僅是語言服務機構,研究機構和行業企業應用機器翻譯構建自己機器翻譯系統、應用語料進行垂直領域的機器翻譯訓練有過很多案例了,應用場景和市場十分廣闊。TAUS 翻譯數據報告里提過 The Machine Translation (MT) market alone according to the 2014 「TAUS Machine Translation Market Report」 was estimated to be worth €250 million. 國內現在的好幾家做知識產權領域語言服務電商平台的、專利翻譯的語言服務供應商也都在套這些概念,也有規划了自己的機器翻譯系統。千萬級的垂直領域的語料能夠訓練出可應用的機器翻譯結果嗎?拭目以待。
金融、醫療等行業信息安全相當重要。所以,也許是在不得已的情況下外包翻譯業務給LSP。下面瀋陽陽同志提到的「如果純考機器翻譯系統賺錢,現在的確比較難,但國內已經有公司這樣做了,據我所知,杭州雅拓、上海勇金毅、北京語智雲帆等。像杭州雅拓提出,使用用戶自己的高質量數據,為用戶構建私有的機器翻譯系統,來保證用戶數據翻譯的安全,提高翻譯效率,這個想法就不錯。」是差不多也是實情的。不論是LSP語言服務外包,還是機器翻譯系統,都和這些行業客戶密不可分,誰能提供更有價值的服務誰就能掙到更多的銀子。
在行業客戶,LSP,做機器翻譯系統的供應商這幾層關係中,還有一個角色是至關重要和核心的——這裡的翻譯數據平台(語料或者翻譯記憶平台)就凸顯了自己的價值,不論是通過提供語料交易平台(Tmxmall語料商城)擴大這些行業客戶的高質量語料來源以訓練機器翻譯,還是搭建行業公司內的語料管理系統以提高語料利用的效率。還是應了那句話,得數據者得天下。話又說回來,知識產權問題、數據可用性問題、技術實現問題都是需要解決的。
但是,像Tmxmall這樣做translation data的公司會成長很快的。小夥伴在留學,學的是specialised translation科技翻譯,包括language and automation機器翻譯。她說國內這方面不多,國外的MT發展還是挺好的。We are at the beginning of the translation data age.
這裡附上微軟IT領域的TM大概120萬句對,對MT感興趣的小夥伴可以拿來訓練下,看分數怎麼樣。鏈接:http://pan.baidu.com/s/1gf353YN 密碼:r7jr微型計算機還沒出來時,IBM一度認為這沒什麼前途,怎麼可能人人都有計算機呢?這麼巨大複雜的機器,人們有什麼用?能消費得起嗎?網路技術剛出來時,jobs等人率先看到了無限的前景,當時的普通人怎麼能想到僅僅20多年後,終端互聯已經成為常態。
同理,機器翻譯絕對是顛覆性的革命,語言溝通革命,對全人類都有好處!而且應用無處不在,或者說,商業模式覆蓋幾乎一切層面。
起初,人們認為計算機就是用來計算數學問題,手機就是用來打電話的。但是有些東西的發展遠遠超出人們最初的設想。
接下來,我就隨便談一談成熟的機器翻譯可以來做什麼。
哈佛、耶魯這些名校的公開課,經典流行日劇,法國某份報紙,這些全可以被翻譯,無需人工翻譯小組去費時費力。
出國旅遊,聽不懂看不懂怎麼辦?請雙語導遊?就算會英語,在低素質的非英語國家還是無法交流,有了成熟的機器翻譯,隨便走。兩位科研領域大牛,國籍不同母語不同,若都精通某外語,可以交流很多,否則,思想火花怎麼碰撞?有了成熟的機器翻譯,六國天才可以一起會談!中國某電商可以服務全世界,俄羅斯某軟體可以服務全世界,語言壁壘破除,市場變得更加廣泛……成熟的機器翻譯實現真正的全球化。和泰國人、巴西人成為朋友溝通,容易多了。就像當年qq剛出,聊天室聚集天南海北的人,溝通成本迅速減少,人們對於交流的需求突然迫切。20年前,相距1000km的人們用電話電報溝通,價格貴,信號差;200年前,相距那麼遠的人怎麼可能在幾秒之內實現溝通?
語言界限被突破,人們了解外部世界的慾望可以被滿足,相關需求是海量的!溝通交流成本急劇下降,這也會給其他各種變革提供支持。目前,我認為國家之間應該聯合起來重建巴別塔,就如當年一起破譯人類基因一樣。我覺得像Google Translate、百度翻譯等機器翻譯系統的存在就是為了吸引有翻譯需求的人進行使用,增加這些搜索引擎的流量,表面上是免費,實際上大家已經為他們創造了價值,這個商業模式可不簡單呢。如果純考機器翻譯系統賺錢,現在的確比較難,但國內已經有公司這樣做了,據我所知,杭州雅拓、上海勇金毅、北京語智雲帆等。像杭州雅拓提出,使用用戶自己的高質量數據,為用戶構建私有的機器翻譯系統,來保證用戶數據翻譯的安全,提高翻譯效率,這個想法就不錯。
語言的意境,AI是不懂得。首先AI行業的從業人員就靈性極低。
比如
身是菩提樹,心如明鏡台,
時時勤拂拭,莫使有塵埃。
菩提本無樹,明鏡亦非台,
本來無一物,何處惹塵埃。
AI行業的從業人員有幾人可解答。
吾心似秋月,碧潭清皎潔。
列物堪比倫,教我如何說。
南台靜坐一爐香,終日凝然萬慮忘。
不是息心去妄想,都緣無事可商量。
獨坐清談久亦勞,碧松燃火暖衾袍。
夜深童子喚不起,猛虎一聲山月高。
碧澗泉水清,寒山月華白。
默知神自明,觀空境逾寂。
這些詩歌,AI行業的從業人員有幾人懂得!
還指望AI機器翻譯出來!真是大笑話!
SAAS或技術外包。
具體可參見目前國內的新銳公司,新譯科技。
機器翻譯和硬體結合, 提供一種可以自然交流的即時翻譯機科技產品, 給到 end user 去使用.
MT+hardware 產品銷售的商業模式, 能夠讓 MT 技術真正在大眾消費群眾中落地, 進而再次推動機器翻譯技術的更快速發展.
http://www.wt2.co WT2 即時翻譯機正在重新定義翻譯機.
記憶中,第一次回答知乎問題。作為機器翻譯博士狗,目前還真沒有想到靠譜的商業模式。不然,我已經創業了。
推薦閱讀:
※遊戲中的地名該如何翻譯?
※freak、geek、nerd、weird、nut等這些詞的區別是什麼呢?
※有什麼意思是中文一個詞就能表達清楚的,但是用英文表達卻很難?
※《喀秋莎》日語版歌詞是否翻譯錯誤?
※「雲吸貓」一詞怎麼翻譯比較好?