CSDN創始人蔣濤:中國智能音箱大戰,我為何看好小米
AI 滔滔是CSDN旗下一檔關於科技類的評論節目,內容涵蓋當下的科技熱點內容,歡迎廣大科技愛好者關注。
作為消費級AI應用的首個載體,智能音箱今年特別的火。
但故事卻要從2014年說起,當時亞馬遜在其官網上低調的上線了一款智能音箱Echo,它搭載了Amazon 自家的智能語音助手Alexa,外形和普通的藍牙音箱沒有太大的區別,也沒有顯示屏,唯一的交互方式就是語音。通過智能語音助手,用戶能用簡單的語音指令就可以查詢信息、播放音樂、設置提醒,甚至控制家裡的智能設備。
2015年Echo 年銷量為250萬台,2016為520萬台,時至今日,Echo的總銷量已經達到千萬量級,真正走進了千家萬戶。亞馬遜在智能音箱上取得的成功引來了眾多的競爭者和跟隨者,美國本土市場有谷歌、蘋果、微軟等巨頭效仿,國內有科大訊飛、阿里、小米、出門問問、Rokid等玩家紛紛入局。
在Alexa目前完全hold不住中文的空檔期,Copy to China 模式依然方興未艾的大背景下,誰能成為中國版的Echo成了科技圈內不斷被熱議的話題。
本期AI滔滔,CSDN創始人蔣濤老師將從小米智能音箱的發布說起,跟大家聊聊語音交互的那些事兒。蔣濤認為,目前以手機為首的觸屏創新時代已經結束,語音交互的新時代拉開序幕,很多觸控的操作方式未來都有可能被語音所取代。
談及很多國產的智能音箱並未複製Echo在海外的成功的原因,蔣濤認為,很多產品並沒有找到用戶真正需要使用的場景並完善產品體驗。但對於小米AI音箱的未來,他卻樂觀的預測小愛同學將會成為一款銷量數百萬的現象級產品,並且剖析了具體原因。
除了對產品的橫評,蔣濤還縱論了目前BAT、小米、科大訊飛等主要玩家在語音交互領域的戰略布局情況。
最後,作為CSDN和極客幫創投的創始人,蔣濤認為對於開發者和創業者來說,現在想做一款突破性的手機APP已經很難了,需要密切地關注語音交互這個新領域,而目前這個場景開發者還不多,是個入場的好時機。
特別鳴謝聲智科技在本視頻錄製階段的大力支持!
以下為本期AI滔滔的文字整理:
蔣濤:滾滾長江東逝水,全憑濤濤一張嘴。大家好,這裡是AI滔滔,我是主講人蔣濤。
我們剛才測試了一下小米新發布的AI音箱,我們預測它會帶來一個爆款式的現象。這個現象在美國已經發生了有3年,2014年亞馬遜發布了一個Echo,不聲不響的,但是這個Echo在今年的CES爆紅,成為真正的下一代智能硬體的一個突破級的產品。
觸屏時代的創新已結束,語音交互的時代到來
現在大家一致公認手機的創新時代已經結束,我們現在看到,即使蘋果今年10周年,它拿出來的產品也沒有太多的一個創新,所以大家都在期望著看到一個新時代。這個新時代有很多的預測,其中最重要的一個觀點就是說,我們從所謂的這種觸屏時代,會被語音輸入所取代,這個產品已經被亞馬遜做出來。
誰最有可能在中國複製 Echo 的成功?
中國的廠商其實在3年前也注意到了亞馬遜這款產品,有很多的模仿者和追隨者,其中呢,力度最大的是科大訊飛和京東合作的叮咚音箱。因為科大訊飛在語音這個領域耕耘了很多年,又藉助京東的這個銷量,想模仿亞馬遜的成功。可是兩年下來,銷量應該說完全沒有達到預期。
但是我們今天測完小米這款AI音箱,我覺得有可能會迎來一個跟亞馬遜Echo一樣成功的產品,原因呢,當然我覺得現在是技術的一些進步帶來的。
- 首先,是語音的識別力在最近的這幾年有非常大的突破;
- 第二個語音在音箱上的應用,它還用到了另外一個技術,這也是亞馬遜做得比較獨到的一個地方,就所謂遠場語音識別。但是在國內大家還在摸索,小米音箱呢,我們實驗了一下,它的遠場的這種效果它的靈敏度和反應速度已經達到了一個用戶可以覺得非常好的一個舒適度。
更重要的是小米它有強悍的供應鏈的能力,所以它把這個音箱的價格做到了299,而且它的整個的設計,和音箱的這個材質體驗都還是非常棒的。
所以呢,小米音箱我們判斷,它是有可能爆款的,這個爆款就說,至少它是個百萬級的,它有希望衝到三百萬或者五百萬的這個量級,那可能就是除了手機這個市場,我們智能手機帶來大的硬體的升級換代以來,最重要的一個硬體的升級了。
語音交互目前主要被用來執行單一指令型任務
亞馬遜的這個Echo發了三年,大家都用它來做什麼呢?這實際上是有一個統計報告的,大家用它最多的四樣事:聽歌曲;調整燈光;設置鬧鐘;查天氣。
我們可以看到,語音它開創了一種新的場景形態,就是你要做一個單一的一個任務,這個任務很明確,用手機去做的時候,你就會發現它很煩瑣。你要打開手機,打開APP,然後找到那個功能,再去激發那個功能,最後起到作用,可能要走四步。
但是現在呢,用智能音箱以後,第一呢,它是不間斷的在那,你可以隨時喚醒它。這樣當你的任務非常明確的時候,音箱就成為你的很好的一個助理。
為什麼很多國產的AI音箱不成功?
為什麼前面這些音箱都做的不太成功呢?
就是第一,它們可能在產品的設計體驗上,沒有找到真正的場景點把它解決透,就是實際上音箱的功能不像想像的那樣。特別是有一種誤區,就是現在天貓推的那個天貓精靈就是這樣,用戶可以通過音箱去下訂單,這是一個很愚蠢的這個想法,你想想,你要在音箱上去下訂單,這幾乎是不可能的一件事情,這個交互太複雜了,怎麼去選擇你的商品?這個事實上呢,即使亞馬遜動用了這麼大的力量去推它的Echo,大概有6%的用戶會用Echo來查它的定單,94%的人都沒有從來沒有想到用這個功能。
第二個,首先得是個好的音箱,這是蘋果去做它的叫HomePod,它的智能音箱的一個出發點,說我比你的Echo要做得更好,音質要做得更好。
大公司的語音交互戰略布局
我覺得百度今年做了一個重大的戰略,要做一個度秘(DuerOS)操作系統,語音的一個交互系統。它把度秘從一個事業部升級成公司的大的戰略部,而且把它那個系統要開放和開源。百度推了一個叫喚醒萬物,和Duer的一個操作系統,它的想法是什麼呢?既然未來這些萬物都要具備聽的能力,那每家公司像小米一樣去開發一套系統嗎?不用了,我百度來做幫你們做好,你們把我這個模塊嵌入進去就行了。
我們可以把它比喻一下,在新交互時代,我們從這種手指的交互進入到語音交互,小米選擇了一個路徑,說我們要做軟硬體結合的,類似於iPhone的一個解決方案,我們要做蘋果,把所有的系統都封裝起來,你們在上面去開發應用,就像亞馬遜的Echo,下面有很多號稱有上萬種技能,是第三方開發者在上面開發的一些單嚮應用,那也就意味著,亞馬遜Echo是成為一個服務的入口了,我們已經可以看到這樣的一個現象,這是小米選擇的路徑。
那百度,包括阿里,他們選擇的 路徑是什麼樣的呢?
阿里現在選擇兩條路,第一,我做個天貓音箱,我也也想干這個事,我也想學亞馬遜,做這樣一個語音的入口。第二個,實際上它背後是想推它的阿里雲的服務,因為做音箱,現在就不僅僅是做音箱本身了,首先你要有AI的能力,AI的 技術,識別,處理,再還有更重要的是後端的雲端的服務能力,他有點像後交互時代,新交互時代的安卓一樣,我們建立一個生態,這是百度阿里選擇的道路。
騰訊在幹什麼?騰訊在等著大家先做,做完了以後,我再上,因為他有一個殺手級,QQ加微信,用戶在他那,所以他不怕,你們先做吧,等你們先探索出來道路以後,我們再Copy上。這是我們目前看到的這個就是所謂智能音箱帶來的這個新交互時代現在的一個格局。
語音交互藍海,創業者和開發者應該何去何從?
這個我覺得對於創業者,還有我們這個CSDN的這些開發者來講,我覺得大家還是可以非常密切的關注這樣的一個動向,為什麼呢?就是說,現在想做一個APP在市場上已經很難突破了,但是我們如果開闢一個新的場景,現在的開發者還是很少的,你可以進入進去。
- 第一,你也可以選擇跟小米合作,因為小米裡面也需要更豐富的應用;
- 第二個,更重要的是,未來這些傳統的這些行業和場景都會被智能化。
就像我們看到一個報告,現在賣音箱排名第一的還是叫漫步者音箱,這大概是我們15年前時候 ,買電腦時候就有的一家品牌,它的音箱是什麼樣的一個情況?它的音箱是個真正的音箱,它沒有記錄你的數據,它不知道你聽的是什麼歌,它也不能理解你能跟它講的話,你也無法跟它對話,智能的這樣一個用戶體驗一定會改變這些行業的,漫步者這樣音箱如果它不改變,三年之後,它肯定是不存在的。
但是它怎麼去改變呢?不光是他一家,可能還有非常多家這樣的音箱廠商,還有可能一些,原來我們沒有想到的一些環境都可以把這種語音輸入場景用上去,而現在做這件事情,除了你利用小米音箱去做以外,你還可以在市場上找到非常多的集成的解決方案。
百度提供了一套API介面,雲端的後台,前端訊飛有語音的識別方案,聲智科技也有識別方案,再加上一個樹莓派,一個小的電腦,你就可以自己搭建出來一個帶有語音識別能力和後台雲端交互能力的一個叫智能電腦系統,這個智能電腦系統能夠聽懂你說的話,加上攝像頭以後,它還能夠看清楚周圍的物體,這時候,他能提供這個解決的能力,就跟原來的我們電腦系統會很不一樣的。
所以每個行業可能都存在這樣的一個機會,我們也非常歡迎大家把你的想法跟我們拿來一起交流,如果有這樣的一套系統,你會用它來做什麼?今天我們就給大家講到這裡,謝謝。
更多內容敬請關注我的公眾號:AI科技大本營(rgznai100),一個專註於發布人工智慧前沿信息的敬業狗。
推薦閱讀:
※Momenta: 我聽過的最公開的無人車宣講會
※第四範式戴文淵:商業公司構建AI能力的五大核心要素
※物聯網:Facebook人工智慧正在教機器人「討價還價」
※掃地機器人的真偽智能如何分辨真假?
※只需修改一個像素,讓神經網路連貓都認不出 | 論文+代碼