如何從技術角度來評價科大訊飛2015人工智慧大會?

今天科大訊飛在北京發布了人工智慧大會。相比較其他互聯網公司的發布會,科大訊飛的發布會鮮有人提及,對於發布會的內容在網上也沒有看到較多討論。有沒有大神能從技術角度來評價科大訊飛此次的發布會?比如會上發布的人機語音交互標準,還有一些其他的語音應用。鏈接地址http://mp.weixin.qq.com/s?__biz=MzA4NjM4ODQzNQ==mid=401555247idx=1sn=cb08abc8df01011486a3776561c7ef15scene=0#wechat_redirect


儘管我骨子裡不喜歡訊飛這樣的公司,但不得不承認訊飛在人工智慧技術方面沒有落後,緊跟前沿,縱橫捭闔,七上八下,鼓搗出這麼一大堆亂七八糟的東西,至少說也算是個人工智慧技術前沿型公司了,雖然他們的東西仍離強人工智慧很遠,但不是他們的問題,整個行業都這個德性,這個大神那個大神的,都沒什麼像樣的突破,所以能把大神的東西折騰成這樣,我想說:訊飛,你贏了!


先簡單談下,另外找時間再詳細介紹語音識別上人工智慧(人機交互)的鑒別基礎和方法。總的來說此次發布會展示了科大訊飛在語音識別準確度進一步優化,而其推出的人工智慧平台「訊飛超腦」需要辯證看待。科大訊飛發布了錄音寶、錄音筆、訊飛聽見網、智學網、E 聽說等產品,都是建立在其多年中文語音識別的功底上而做出的應用化嘗試,在這一點上毋庸置疑,科大訊飛在中文語音識別技術處在行業龍頭。但人機語音交互需要一個通俗的過程:聽清(語音識別,聲音到文字)——聽懂(語義識別,文字到知識)——交流(人工智慧)。訊飛所提的「人機語音交互」應該就是指該平台已經能達到第三步具備交流能力,這依託於發布的AIUI平台(雙全工技術、麥克風陣列技術、聲紋識別技術、方言識別、語義理解技術和內容服務)。其實不難看出這些核心技術(除內容服務)都只涉及到了人機交互的前兩過程——聽清和聽懂,而真正的「交互」則需要更深的場景識別、機器學習、數據挖掘等技術的支撐,而從現場訊飛的演示(語音購機票)看,其交互還處在起步階段。後文會繼續介紹人機交互實現各階段特點,訊飛此次的演示體現其處在比較靠前的一個階段:場景識別。

怎樣才算得上人工智慧或做到人機交流呢?理解力和記憶力是關鍵。

(以下論述都建立在能準確做到語音識別的基礎上,即語音轉文字)

先用三個通俗問題測試機器人記憶力:

A. 孫儷是誰?

B. 孫儷的老公是誰?

C. 孫儷拍過什麼電影?

看似簡單的三個問題,經測試對於市面上大多數中文語音助手都能很好地分別作答,但把問話的方式稍做變化結果就會大相徑庭。

將問題變為:

A. 孫儷是誰?

B. 他(她)的老公是誰?

C. 他(她)拍過什麼電影?

一目了然,對於普通人來說,這個三個問題幾乎沒變(除了問題C出現歧義,此處故意設置,後文會詳細說明)。但對於機器人來說,將出現分水嶺,回答情況將出現以下組合:

結果1. 僅正確回答A:

最初級階段,沒有記憶能力(這是上下文、連貫交流的基礎),截止發稿日測試國內外中文語音產品大多數都停留在這個階段。

結果2. 正確回答A.B,而C直接答出鄧超的電影:具備單層記憶能力,僅記得上一句中的信息,所以這裡直接默認主人公已經變為了鄧超。

結果3. 正確回答A.B,而C答出孫儷的電影:這裡並不能看出具備多層記憶能力,因為很可能問題A讓機器進入一個圍繞孫儷為中心的場景,機器認為之後的所有問題都與之相關。所以還是屬於單層記憶。

結果4. 正確回答A.B,C問題提示出現歧義,比如回答」你是想知道孫儷還是鄧超的電影呢?「:具備多層記憶,歧義發現。我認為這才算的上初級智能,而試問現在有中文語音廠商能做到?

編輯中……


訊飛有很多互聯網業務,但根本上說算不上互聯網公司,或者純粹的互聯網公司,和nuance一樣,在語音等人機交互領域這個方向上很強大,但還是傳統意義上2b的公司,雖然這些年他有意的在向2C領域上轉型。這就和互聯網公司或者一些手機廠商相比,他的受眾人群會相對會比較局限,對接的是主要的應用廠商,行業相關開發者,或者K12里的學校老師等,關注者自然不會那麼廣泛。事實上,在語音這一片領域裡,訊飛的影響力上毋庸諱言的,看你問的問題應該是有相關技術背景,但對這個行業應該不是很了解。據我所知,雖然發布會的傳播上算不上熱,但也不至於那麼冷門。今天搜科大訊飛相關消息,在主要媒體網站都會有新聞報道,36氪和雷鋒網上也有相關文章,可以關注一下。順便說一下,沒有更多的討論主要在於,1是和自己關切不大,2是沒有話題感,在這兩點上,訊飛或多或少都沾了點邊。這或許也說明,訊飛這個技術提供商的角色的尷尬境地。

至於你所說的從技術角度來來評價,這個不大好說,發布會主要講的是人工智慧的內容,這個領域比起語音技術來說,那就更高冷了,如果有相關博士或院士願意來科普一下相關知識,非常樂意傾聽。


科大訊飛是我們合作夥伴。曾用過我司視音頻延長器。主要是HDMI,DVI,USB,VGA,KVM數字光纖產品。如是在線有需求可聯繫我18600122764,微信195194358


推薦閱讀:

方舟子打假林志穎,大家怎麼看?
如何看待「Apple Watch 30 分鐘被搶訂一空」的新聞?
如何讓學校的OI隊看起來比機器人社強的多?
Apple Watch 你覺得會出現捉姦在床這個神技嗎?
如何看待 伊隆·馬斯克(Elon Musk)加入 特朗普 (Trump)的顧問團隊?

TAG:人工智慧 | 互聯網產品 | 科技 | 科大訊飛 |