驚爆 | 貓哥獨家連線阿里巴巴未來CEO!

貓哥在蜻蜓FM上的一檔黑科技連線節目《未來科技局》終於上!線!啦!

第一期節目花了整整一周的時間籌備,我和我的小夥伴用音頻連線採訪到了雙十一晚會上你看到的那個會變魔術的「ET先生」,它是阿里雲的AI人工智慧產品,本來希望它用馬雲的聲音來接受採訪,結果它還有點不好意思,所以就用原聲了。想聽的來找貓哥(貓眼科技:maoyantc)回復關鍵詞「阿里雲ET」 可以聽到ET模仿馬雲的聲音

阿里雲AI專家連線內容(獨家!)

貓:先請我們的科學家自我介紹一下吧?

  陳:大家好,我是阿里雲負責ET智能語音對外服務的陳一寧。

貓:你好,陳工。我們看到et能言善辯還可以模仿馬雲的聲音。這個是怎麼實現的呢?

  陳:模仿馬雲的聲音,這個是我們的語音合成技術。我們的語音合成技術原理是說它會根據一些已有的錄音庫生成一個與人的聲音類似的模擬聲音。那這個馬雲的聲音實際上是因為我們收集了一些馬老師在大會上的講話之類或者是一些演講的材料,根據這個我們做了一個音庫。根據這個模型生成的一個對應的馬老師的語音合成的聲音。

貓:語音識別在ET的各項能力中處於一個什麼樣的地位?我看它有很多種能力啊?

  陳:我認為語音識別首先是一個我們叫做聽覺或者聽覺中樞的一個作用!它實際上是在ET的這種人機交互的過程中是一個必不可少的很重要的作用。也是相對來說一個比較成熟和比較接近產品化的一種能力。它很多時候在我們需要跟ET交互或者ET需要理性的處理一些非結構化數據的時候,語音時識別都可以幫助我們能夠進入到這些數據中,能夠讓我們的交互可以開始發聲。人機交互嘛!所以需要人說一些事情讓機器去理解它。語音識別是這些理解的第一步,先把它變成文字,然後才能開始做進一步的理解和進一步的交互。

貓:從現在全球的情況來看,語音識別的應用情況是怎麼樣的?從專家的角度如何看這個事情?

  陳:全球來看的話,語音識別應用還是比較火熱的吧!現在有很多種應用領域,我們一個一個來說吧,比如說從這個人機交互的角度來說其實現在有很多這種助手類的產品,比如蘋果的siri,比如微軟的小娜,比如亞馬遜的echo等等這樣的產品。實際上都是在做這種比如手機特別是IOT設備上的語音交互產品。他們都需要語音識別的技術。那麼再往下一點,比如在做車載系統,如果你想跟車載做一些交互,基本上智能汽車對於語音識別技術都是不可或缺的部分。同時如果對於商用的系統,對於這種全球的客服,比如我們民航的這種退票和改簽服務應用,還有比如說在醫療領域一些醫生處方或者醫療記錄中發揮作用。

貓:現在語音技術,還有沒有面臨挑戰的地方?阿里雲是如何應對這種挑戰的?

  陳:語音識別這個方向上我們覺得現在遇到的挑戰有幾種吧,一個是比如說想雜訊的這種挑戰,那麼現在碰到的情況就是在乾淨的情況下或者說雜訊很小的情況下語音識別的效果還是不錯的,但是在這個雜訊比較大的時候,這個識別率就會相對有所下降。還包括說話有一定口音的情況下。標準普通話標準語音會好一些,但是有口音的情況下,識別率也會有下降,然後還包括說話的年齡過小或者過老也會有一些影響,會打一些折扣。那麼阿里雲我們認為在這裡面最主要的都是數據的問題。包括我們剛才講到說抗雜訊的理由,識別率低實際上都是因為我們沒有足夠的雜訊語音在裡面。那麼我們阿里雲會採用一些技術,通過人工的方式記錄或者採集的方式獲得大量的這種含雜訊的,含口音的等等的這些語料,通過我們大規模的大數據方式做一些計算,把這些海量的數據結合在一起就能夠做出很多在各種情況下應用會比較好的語音識別的效果。還有提到比如中英文混雜的效果,這是一個很頭疼的問題,那麼我們也會通過各種識別材料增加的方式來達到最終的滿意度。

貓:給我們能不能講幾個科學家工程師們的小故事,讓大家都了解一下他們的付出。了解工程師們是如何努力的?

  陳:試試看啊,我講一個前線落地的故事,不是一個後台的故事,落地的時候我們會碰到一個很正常的問題,有時候我們在做語音識別相關的工作的時候,有一個事情很重要就是錄音質量要好。錄音如果本身就有巨大的雜訊或者是你根本就沒錄下來,那麼肯定這個效果就會不好吧,那這個就會有問題,我舉個例子,比如說之前我們在這個湖南衛視《我是歌手》這個節目裡頭去預測這個歌王。我們現場要得到歌手演唱的這些數據,那麼這樣的一些東西我們都需要把聲音錄下來,都錄下來以後才發現我們跟電視台的設備做的一些連接,我們的設備和電台的設備是不兼容的。插上來基本上就是燒設備。然後當時很緊急的要拔掉,開始直播了,就發現這個設備有問題。然後後來緊急的想了各種辦法,來解決。從湖南衛視借了他們的一些設備出來,才把這個事兒最後解決的,這種情況還有很多,比如說在雙11晚會的過程中。也會遇到這種設備插在一起,還會遇到這種電流電源上的干擾這種聲音,錄起來是完全沒法聽,這樣的情況都有很多,這種需要現場的,工程師去解決,他們有時候都是沒日沒夜加班連軸轉,把公司當做自己的家,非常的辛苦。

關注貓哥(maoyantc)就是關注未來!

推薦閱讀:

Docker常見故障排查指南-基於阿里雲容器服務
【阿里雲大學免費課程】機器學習業務實踐之路! 快收藏起來周末學習!
阿里雙11看不見的精彩:創世界紀錄背後的人、故事和技術
承擔雙11萬億流量,阿里核心技術揭秘:12位大咖告訴你!
如何在阿里雲上部署私有的Docker Registry

TAG:科技 | 阿里云 | 马云人物 |