運營商做智能語音平台有什麼優勢?

最近看到中國移動推出了自己的語音平台,叫靈犀雲,從品牌上看來是跟那個靈犀語音助手對應的,而且也是跟科大訊飛合作的產物http://software.it168.com/a2014/1226/1693/000001693796.shtml

感覺現在做語音平台的已經有不少公司了,科大訊飛走在最前面自不用說;BAT三家都分別自建了語音能力;雲知聲之類的創業公司發展速度也很猛。那麼傳統運營商在這塊市場里有什麼優勢呢?


能說句實話嗎?

很多時候,移動代表著壟斷,呆板,流程化。。。

除了運營商該乾的事情,不太看好傳統中國運營商做的其他的應用類的服務,沒別的,公司考核指標,流程管理制度,等等不是以技術能夠解決的。


試答一下。其實電信運營商來做智能語音技術應該是有其先天優勢的。

這裡以語音識別為例簡單說說。目前在這個領域國內大多數公司都已經能達到90%以上的識別準確率,走得最前的科大訊飛據說能達到97%以上,如果用過訊飛輸入法的語音輸入的話,應該能有所體會。雖然從數字上看到準確率已經很高了,但在實際應用時由於受太多因素影響(包括環境噪音大小、方言種類、語速、錄音質量好壞等),帶給終端用戶的體驗還存在不少提升空間。

而要提高語音識別率,關鍵有兩點:

第一,演算法的持續優化;

第二,海量的語音數據積累。

這其實就跟人類學習語言是一個道理。首先,你的大腦要有學習認知的能力(相當於演算法);同時,你還要掌握充分的辭彙量,接受足夠的聽力訓練(相當於語音數據),你才能聽懂一門語言(語音識別)。

如果說演算法的持續進步提升可以依靠基礎研究和人才的不斷投入在相對短的時間內出成績,那麼海量語音數據的積累就不是那麼簡單的事了。

從哪裡能獲取海量的語音數據呢?以科大訊飛舉例,經過多年來的建設和耕耘,可以做到通過自家的互聯網應用及語音雲來積累用戶使用時產生的語音數據,這是一種可以實現良性循環的數據積累方式。然而,更多的創業公司,可能是通過以下這種方式來實現原始積累的。

走在北京海淀某高校的校園裡,你可能會被人冷不丁地叫住,邀請你用自己的鄉音,照著本子,對著他手裡的移動設備,念一段日常生活的對白。

同樣的一幕,換不同的文本,重複成百上千次。這看似「笨重」的工作,卻是智能語音流水線的開端。

http://tech.163.com/13/0803/10/95BKBQVT000915BF.html

《智能語音登陸戰:如何真正成為移動互聯網入口》

通過請人大批量地錄音,或者通過向相關機構購買,即使如此能獲取到的數據還是遠未足夠的。這也成為了提高語音識別率的其中一個主要門檻。

但是對於像移動這種大型電信運營商來說呢,這方面恐怕就不是問題了。我在知乎上的另一條問題里看到知名知友Luo Patrick寫的下面這段話,這還是寫在移動剛入股訊飛時的,對這方面的優勢已經描述得很到位了:

…………

我覺得這是非常有眼光的戰略投資。中國移動抓到了為數不多的屬於自己的機會。

補充一個技術細節。

語音識別的基本原理是用海量樣本數據調教識別模型,顯然在中國能拿到的最海量、最貼近語音識別需要的樣本,就是中國移動網路上無數的通話語音。

…………

http://www.zhihu.com/question/20424395/answer/15107677

《如何評價中國移動投資科大訊飛?》

想想確實是這樣對么?作為用戶數已經超過8億的國內最大運營商,中國移動所能獲取並積累的,用「海量」來形容可能還有點不夠力度……總之你能想像,電信運營商在這方面的條件真的是先天性的,而且得來毫不費功夫。

至於另外一個因素——演算法方面的研究投入,對有錢就是任性的運營商們來說,是不是相對也不是什麼大問題呢?

怎麼說呢,在語音識別乃至整個智能語音市場來說,運營商的插足不能輕視。更何況,現在移動是跟行業內的巨人科大訊飛合作而推出的這個靈犀雲,用的核心技術是源自訊飛的。在基礎演算法研究+語音數據 都能得到保障的前提下,還真不好說它能不能做出點厲害的東西出來……

當然,但凡運營商涉足非它本行的東西時,受限於自身體制的低效或基因不對等等問題,都是不太被看好的,這些也是說不準的因素。

嗯,大概就是這樣紙了。


其實我很懷疑中國移動攪局進入智能語音市場,後發而至,對於這個已經有科大訊飛、互聯網三大巨頭BAT等廠商佔領市場的行業會不會有點晚……

不過一個產品只看進入的時機早晚也是不嚴謹的。

說說我認為的運營商搞智能語音的優劣勢吧,先分析:移動入股科大訊飛這樣一家國內智能語音廠商,目的是什麼?【從最早的計算機發明到現在的微機,經歷過幾次重大的變革,滑鼠、鍵盤、觸摸屏分別在提升人機交互體驗做出了自己的貢獻,在蘋果把觸摸屏的體驗做到極致之後,就連谷歌也在尋求新的人機交互發力點。也許智能語音會是一個很好人機交互方案】運營商在互聯網戰線上相對薄弱,智能語音可以起到入口的作用,假使將來語音真能成為進入千家百戶的人機交互方案,那這個入口帶給運營商的流量和業務將有非常大的想像空間。

優勢:1、有錢,移動的進入能幫助語音行業更快的發展起來;

2、運營商天然擁有收集語料的渠道,這對於極度以來語料庫訓練語音模的行

業語音行業來說是個珍貴的渠道;

3、網路,這對於在線識別和在線合成來說也是一個根本制約,運營商的優勢也比較明顯;

劣勢:運營商的互聯網之路艱難重重咯,大家懂

***路人發聲,非喜勿噴,如果認同請頂起***


推薦閱讀:

如何讓阿里巴巴在90天內倒閉?
Siri 和 Cortana 吵架會是怎樣一番景象?
如何看待蘋果在 WWDC 2016 上頻繁提及中國元素?
有哪些優秀的哲學主題網站?
哪一個瞬間讓你覺得移動支付真的改變了生活?

TAG:互聯網 | 電信運營商 | 中國移動 | 語音識別 | 雲服務 |