解讀翻譯機背後的技術:AI、語音和雲服務 | 對話微軟黃學東

解讀翻譯機背後的技術:AI、語音和雲服務 | 對話微軟黃學東

來自專欄深圳灣 | shenzhenware4 人贊了文章

近年來,不少語音技術和設備商都瞄準海外旅遊市場,將機器翻譯技術落地到設備端,相繼推出 AI 翻譯機。其中,小米魔芋 AI 翻譯機以 249 元創下了市場新低,是目前市面上性價最高的翻譯機產品。這個「性價比」不僅體現在價格上,更在於其內置來自微軟的 AI 翻譯技術,代表著行業中英 AI 翻譯技術的最高水平。

在上周舉行的香港 Emtech HK 峰會上,微軟首席語音科學家黃學東受邀發表了主題演講,系統分享了微軟自然語言和機器翻譯技術發展的歷程及其取得的突破性進展。在會後接受深圳灣(ID:shenzhenware)採訪時,黃學東也重點談到微軟 AI 翻譯技術及應用,以及支撐 AI 翻譯機背後的技術、服務。

談翻譯: 機器可媲美達到專業人員的水平

語音技術領域,在過去幾年裡,微軟多次的創造了接近人類水平的人工智慧技術。尤其在今年 3 月,微軟創下機器語言史上新的里程碑:其機器翻譯系統在通用新聞報道的中譯英測試集上,達到了人類專業譯者水平,也是業界首個在新聞報道的翻譯質量和準確率上媲美人類專業譯者的翻譯系統。

中譯英機器翻系統由微軟的美國團隊和中國研究院團隊共同研發,不僅代表微軟 AI 翻譯技術上的重大突破,還意味著,與人類同等水平的翻譯技術能夠幫助中國語言和中國用戶走向世界。

在國內,微軟積極推進與各公司合作,將技術帶到行業端和消費市場。其中,華為的 Mate 10 預裝了微軟認知服務的機器翻譯系統,小米生態鏈企業香蕉出行於今年 5 月份推出的魔芋 AI 翻譯機,就內置了微軟翻譯技術,能實現 14 種語言互譯。(點擊了解:《魔芋 AI 翻譯機評測:小米生態鏈首款,搭載小愛同學,僅售 249 元要「掀翻」同類市場?》)

實際上,此前微軟的 AI 翻譯技術已經在許多產品中落地。例如在微軟 Office 中為用戶提供同聲翻譯服務:在辦公軟體的 Power Point 中安裝 Presentation Translator 插件,課堂、演講場景下,可實現實時轉文字、同聲傳譯等功能,支持 60 種語言、100個人在課堂上同步交流,學生/聽眾可通過微軟翻譯的手機應用,加入對話同步交流。

談語音:翻譯機上的語音技術跟智能音箱的是互通的

在這兩年來,智能音箱的火爆,進一步帶動語音識別、遠場拾音等技術在行業上的應用。在這方面,微軟也取得不少領先業界的研究成果。

在今年的 Build 2018 大會上,微軟正式發發布了面向遠場語音識別的軟硬一體方案——多 MIC 語音開發板 MSDDK,該方案由微軟語音團隊聯合 ROOBO 完成,搭載微軟語音 AI 的演算法。

在這一方案的基礎上,任何一家公司都可以將這套技術打包到他們的服務系統中, 並打造智能音箱、機器人等智能硬體產品。

該方案涵蓋微軟在過去多年積累的語音識別、語音合成、機器翻譯等自然語言技術。其中,遠場語音識別技術同樣為 AI 翻譯機奠定了硬體和演算法上的基礎。

談雲服務:AI 技術的發揮,需要雲的高度配合

以上提到的包括機器翻譯、語音識別、語音合成等多項語音 AI 技術,均已經集成在微軟 Azure 雲服務上。「微軟將這 30 多年以來的 AI 研發成果,包括最底層的核心架構、最高層的演算法和認知服務都打包到 Azure 雲上,並面向所有人開放、分享微軟的最新人工智慧研發進展和工程化的結果。」

而這些技術,在微軟的 Azure 雲服務的配合使用情況下,得以更好的發揮。

在談及技術在產品落地時,黃學東表示,以微軟和小米聯合推出的魔芋 AI 翻譯機為例,這款產品集成了微軟包括拾音、機器翻譯、微軟 Azure 雲等在內的技術。

作為當下市場上價格最低的翻譯機產品,魔芋 AI 翻譯機擁有微軟 AI 翻譯技術的支撐,在提供翻譯效果的同時,以低價位獲取更多受眾,能讓微軟的語音 AI 技術更快的普及用戶市場。

翻譯機的用戶體驗,關係到語音識別準確率的高低、網路連接穩定與否等。黃學東表示,由於微軟在支持翻譯語言的國家均設有數據中心,能在設備在當地使用的情況下,確保數據的穩定性傳輸,從而提供優於不少國內品牌產品的翻譯體驗。

據香蕉出行技術副總裁於亮反饋,國內不少用戶會傾向於將這款魔芋 AI 翻譯機推薦給國外朋友,甚至有人專程從國外跑到國內購買產品。因此,他們已有產品向海外市場進軍的計劃。

據黃學東透露,微軟 AI 翻譯技術研究目前已有階段性成果和突破,在未來幾個月,將會在雲端上進行升級,給現有客戶、產品用戶帶來更大的驚喜。

公眾號:shenzhenware

主筆、採訪:萊恩

題圖來源:Emtech


推薦閱讀:

constituent parsing & dependency parsing
Text Summarization
<DepthLGP : Learning Embeddings of Out-of-Sample Nodes in Dynamic Networks>筆記
新的開始,路途漫漫(專欄介紹)
隱馬爾科夫模型學習總結之一

TAG:自然語言處理 | 科技 |