你不知道的智能音箱

TL;DR

  • 智能音箱已經在美國非常流行,但在中國還在起步階段;
  • 語言識別和NLP,特別是遠場拾音的技術讓智能音箱成為可能;
  • 智能音箱作為語音消費產品(聽歌、FM、朗讀)已經可用,但作為智能家居的核心則為時尚早;
  • 語音助手和Skill開放平台是智能音箱的核心競爭力,巨頭已經/將要親自下場。

撰稿:蔡芳芳

編輯:徐川

出品:InfoQ

在中國人還在為哪款手機更好而撕逼不休的時候,智能音箱已經悄悄深入美國人的生活。

2017年7月亞馬遜Premium會員日,它賣出了超過去年同期7倍的Echo系列智能音箱。而在2016年下半年,Echo總共已經賣出超過700萬台。市場調查公司eMarketer近日公布的智能音箱市場研究報告預測,美國今年智能音箱的月活躍用戶將達到3560萬人。這一數字已經超過美國總人口的十分之一。

智能音箱以及它所代表的趨勢,已經不容忽視。智能音箱到底值不值得用?智能音箱的未來又會如何?本文將帶你一起觀察國內外智能音箱市場的火熱現狀,解析背後的技術,並給出我們對於趨勢的分析和判斷。

何以起風波?

根據Gartner預測,到2018年將會有30%的人機交互通過自然語言會話完成[1]。而基於遠場的自然語音交互恰恰就是催生出智能音箱市場的重要需求。

以一次普通的聽音樂和看視頻為例:

現在用手機聽音樂,首先要先解鎖手機屏幕,打開某一個音樂APP,搜索你想聽的那首歌,然後點擊播放;如果變成語音交互會怎麼樣呢?你只需要說:播放陳奕迅的好久不見。

如果這個時候恰好是周日晚上10點,你想看最新一期極限挑戰。如果是現在,你需要在手機上切換到視頻播放軟體,或是打開電腦輸入視頻網站地址,然後搜索極限挑戰第三季,最後選擇最新一期播放;如果換成語音交互,你只需要說:播放極限挑戰第三季最新一期。

類似以上場景,語音交互在很多時候執行效率都明顯高於GUI交互。業界普遍認為,智能語音交互會成為未來人機交互的新方式,一如當年喬布斯在iPhone上用觸屏打敗傳統手機鍵盤,語音交互也可能會顛覆圖形界面交互。而智能音箱已經成為智能語音交互的重要載體

2014年11月,亞馬遜推出基於語音交互的智能音箱Echo,拉開智能音箱市場大幕。2016年Echo的銷售數據一路高漲,一舉突破500萬台,亞馬遜獲得先發優勢,在美國市場積累了大量用戶。

資料來源於網路

亞馬遜率先嘗試並大獲成功,證明了以智能音箱作為智能語音交互載體和智能家居入口的可行性和正確性。各家紛紛入局智能音箱市場,既是響應智能語音交互時代的召喚,也是不甘亞馬遜獨佔用戶和市場紅利。

根據CIRP、RBC Capital Market數據,自2014年11月發售以來,包括Echo、入門級EchoDot和攜帶型Tap在內的亞馬遜智能音箱,已累計銷售超過千萬台,銷售額達到8至10億美元。

而根據市場調查公司eMarketer近日公布的智能音箱市場研究報告預測,美國今年智能音箱的月活躍用戶將達到3560萬人,比去年增長128.9%,其中亞馬遜的Echo將達到70.6%的市場佔比,遠遠領先於第二名Google Home的23.8%以及聯想等其他品牌。今年每月至少使用一次這些語音助手的美國人將達到6050萬人。這一數字已經超過1/4的智能手機用戶,並且接近1/5的美國人。[2]

再看國內的智能音箱市場:

根據《科大訊飛股份有限公司2016年年度報告》[3],叮咚智能音箱在2016年的總銷量為10萬台。基於線上淘寶(包含天貓)銷售數據的跟蹤調查,智能音箱品類的整體月銷量還不到2萬台。[4]

與國外智能音箱龐大的用戶群體相比,國內智能音箱市場似乎「小」到不值一提,但產品數量之多卻毫不遜色。

亂花漸欲迷人眼:智能音箱產品介紹

智能音箱在傳統音箱的基礎上增加了一些更「聰明」的功能,主要體現在以下幾個方面:

  1. 通常內置無線射頻晶元或射頻模塊,可以通過WiFi接入互聯網。
  2. 支持語音交互,無需動手就能控制音箱,一般也支持少量按鍵操作。
  3. 接入豐富的音頻內容,如各家音樂提供商的曲庫、有聲讀物等。
  4. 提供豐富的互聯網服務,如外賣、打車、購物、充話費等,滿足日常生活多種多樣的場景需求。
  5. 實現對各種智能家居設備的控制,使用戶能夠通過與音箱對話來操控家電產品,成為智能家居控制的核心。

目前市場上的智能音箱產品主流為無屏幕的智能家居助手類音箱,以語音交互技術為核心,旨在成為智能家居的控制中心,亞馬遜的Echo、京東的叮咚、阿里的天貓精靈等都屬於這一類。

智能音箱代表大比拼之海外黨

Amazon Echo系列產品

資料來源於網路

海外黨以亞馬遜、Google、蘋果和微軟這四款智能音箱為代表,這四款智能音箱功能並無太大區別,均支持個人生活助手、智能家居控制等主要功能,都採用了各家自研的語音助手。

亞馬遜進入市場較早並致力於打造開放的Alexa開發平台,現在Alexa幾乎無所不能,成為亞馬遜的優勢之一。

Google Home的優勢是信息檢索和會話聊天的能力。今年四月份Google Assitant還添加了一項新功能,能夠識別出誰在說話並相應地做出個性化的回應,最多支持六個人的不同聲音。谷歌本身擁有完善的內容和應用生態系統,Google Home已經和部分自家應用以及不少第三方應用打通。通過Google Home可以查看日程安排,播放Google Play Music和YouTube Music里喜愛的音樂,點播YouTube或Netflix視頻並在電視上播放(需配合Chromecast)。但目前還有很多重要應用如Gmail、Voice和Docs,Google Home尚無法支持。

蘋果和微軟的這兩款音箱都已經發布但還沒有正式上市。HomePod主打音樂和音質;微軟的Invoke一開始則以支持Skype互聯網電話作為亮點,但奈何競爭對手產品更新太快,未等Invoke推出,亞馬遜的Echo和Google Home均已經支持撥打電話,雖然還存在一些隱私問題留待討論。

2017年8月底,微軟與亞馬遜達成合作,以更好地整合他們的語音助手「Cortana」和「Alexa」,想必還有一個未明說的原因是為了更好地抗衡谷歌語音助手。

智能音箱代表大比拼之本土派

從左至右分別為:天貓精靈、叮咚二代、小米AI音箱

資料來源於網路

上圖選擇叮咚、天貓精靈、Rokid月石和小雅音箱進行對比。目前國內智能音箱產品同質化也比較嚴重,前三款智能音箱的主要功能依然沒有太大差異,而小雅智能音箱主打內容服務,並不支持智能家居控制。

在語音助手方面,Rokid月石採用了自主研發的語音助手,而叮咚、小雅分別採用了科大訊飛、獵戶星空的語音技術方案,天貓精靈的語音助手則集成了思必馳和阿里自研方案。若琪最突出的一點不同是它的喚醒詞只有兩個音節,而目前市面上其他智能音箱產品的喚醒詞大多為三個音節或更多。9月新發布的叮咚二代支持自定義喚醒詞,但實際使用效果有待驗證。

智能音箱背後的核心技術

智能音箱的核心需求和一切操作的前提是語音交互,因此語音交互技術自然成為其核心技術。當然它的背後還連接著一棵鬱鬱蔥蔥的人工智慧「技能樹」,受限於文章篇幅和筆者能力,本章僅重點介紹語音交互技術。

以下圖為例,當我們調戲天貓精靈時,跟它進行一次簡單對話的語音交互流程包含哪幾步?

語音識別

第一步是語音識別(ASR)。智能音箱所使用的語音識別技術與手機端的語音助手有所不同,叫做遠場拾音,指的是我們能夠在超過5米以上的距離跟設備進行自然語音對話。

有了遠場拾音之後,人們可以在家裡任意角落、輕鬆地跟智能設備交流。雖然蘋果siri、谷歌Google Now、微軟Cortana等語音助手很早就實現了語音識別,但都是近場語音,使用時需要拿出手機、啟動助手、靠近講話等步驟,與遠場拾音相比在體驗上有很大的差距。

要實現相對理想的遠場拾音效果,降噪是重要的一環。目前常見的做法是利用演算法與硬體相結合實現更好的降噪效果。硬體部分,通常麥克風越多,越有助於收集到來自不同方向的聲音,從而更容易在噪音環境中識別出有用信息,達到更好的遠場交互效果。現在大多數廠商都採用了6個以上麥克風組成的麥克風陣列技術,只有Google Home通過演算法+僅僅2枚麥克風就實現了還不錯的遠場拾音效果。

語音識別還需要配置激活詞,通過激活詞「開啟」語音交互功能(就像開機按鈕一樣),從技術上來說,激活詞越短則體驗越好、技術難度越高,但同時誤激活概率也隨之變高。

語音識別技術的局限性

語音識別技術歷史進程

語音識別技術的目標是將人類語音中的辭彙內容轉換為計算機可讀的輸入。自2009年以來,藉助機器學習領域深度學習研究的發展以及大數據語料的積累,語音識別技術得到突飛猛進的發展,語音識別準確率大幅提升。[5]

今年8月20日,微軟語音識別系統再次取得重大突破,錯誤率降低至5.1%,大幅刷新原先記錄,並在語音識別行業樹立了新的里程碑[6]。

可惜,這些突破更多是針對在安靜的室內並近距離靠近麥克風的場合。在噪音或者遠場識別環境下,錯誤率仍居高不下;面對口音、方言,識別率也還有待提升。

自然語言理解

第二步是自然語言理解(NLU),指的是對自然語言的內容和意圖的深層把握。通俗地講,就是在一些話題上,智能設備能夠理解人講的話,或者能把人類的語言理解成機器的語言。目前智能設備只能做到淺層的「理解」,例如把轉化成文字後的兩句話「給蕭敬騰打電話」和「打電話給蕭敬騰」理解成同樣的操作。

第三步是自然語言生成(NLG),這一步和第二步相反,就是把機器的語言轉換成人類的語言。

第二步和第三步從廣義上來說也可以合稱為自然語言處理(NLP)

自然語言理解技術的局限性

自然語言理解屬於業界難題,也是人工智慧的終極目標之一。

現在的自然語言系統一般使用的是基於統計的方法。所謂統計方法,主要指分析單詞的統計量作為「特徵」,將它們輸入到計算模型里,算出一個結果,最終輸出成詞句。

目前自然語言理解尚處於淺層語義分析階段,大致包含詞法分析、句法分析、語義分析這三個層面。機器對句子的理解還只能做到語義角色標註,如標出句中的句子成分和主被動關係等。當前的研究方法大多是同一套路,即通過語料標註、建立模型、訓練模型、使用模型,令自然語言系統做到簡單的模型式「理解」。即使是當下最火的深度神經網路,也只是在模式識別這個手段上更加高明一點,仍然無法達到理解語言的程度。自然語言理解研究主要集中在一些特定領域,研究跨領域的通用語言理解為時尚早。

如今為大家所熟知的自然語言處理系統,比如蘋果Siri、微軟小冰、訊飛聽見等,其實都沒有真正的「理解」自然語言本身,大多是基於文本相似度的匹配,更高級的則應用了知識圖譜。

語音合成

最後一步是語音合成(TTS),也就是將文字轉換成聲音播放出來,並儘可能地模仿人類自然說話的語音語調,給人以真人之間交談的感覺。

語音合成技術發展到今天已有200多年的歷史,但自計算機技術發展起來以後才有了長足的發展。近些年,一種新的基於資料庫的語音合成方法得到了更廣泛的應用。

隨著技術演進,語音合成的複雜度、自然度和音質都已取得不錯的成績,目前研究重點在於提高合成音的表現力(如語氣和情感等)以及多語種的語言合成。

其他語音交互技術

以上僅僅是最簡單的一次對話會涉及到的核心技術,如果進行更複雜的對話或者根據用戶給智能音箱指派的不同指令,還會涉及更多(以下技術可能存在交叉):

  • 高級語音技術:聲紋識別、情感識別、多輪會話、場景感知、個性化對話等
  • 大數據相關技術:搜索、推薦、知識問答、知識圖譜、開放式聊天等
  • 其他:可擴展語義技能

其中聲紋識別技術賦予智能音箱的能力是讓設備記憶並識別使用者的身份,在此之上可以擴展更多購物、安防、個性化對話等方面的應用;多輪會話就是讓智能音箱能夠在一段比較多來回的會話中自動記住上下文,用戶不需要重複說喚醒詞,就能對智能音箱提出問題並進行追問,真正做到接近於與人溝通的語音交互體驗,多輪會話同樣屬於語音技術領域研究的難點,其主要建立在語音識別、合成以及自然語言理解等技術基礎之上,目前自然度和準確度有待提高;情感識別指的是設備能夠從聲音中聽出你現在的情緒,是生氣、傷心還是高興,然後做出相應的個性化回應。搜索和推薦很好理解,比如你總是放某一類歌曲,下一次你讓智能音箱隨機給你放首歌,它就能選對你可能喜歡的歌曲。

多輪會話

至於可擴展語義技能,是指第三方開發者可以在語音開放平台上為語音助手添加新的技能,豐富語音助手的功能。

智能音箱功能使用現狀與消費者調查

智能音箱背後雖然有許多「高大上」的技術,但這些技術本身還在不斷地發展和完善。作為消費者,更關注的是技術交付後的實際使用效果。

智能音箱功能使用現狀

截至9月,Alexa已經擁有超過2w項技能,Google Assistant擁有的技能大約不到600個,而在這其中真正好用的有多少呢?

2016年Echo用戶調查報告(來自statista.com)

據國外的研究機構2016年進行的調研顯示,Echo使用最多的功能分別是音樂播放、控制智能燈泡、設置鬧鐘;用戶至少嘗試過一次的功能中,排在前三則是設置鬧鐘(85%)、音樂播放(82%)、新聞播報(66%)。而一直作為Echo宣傳重點的「Uber打車」服務,體驗比例僅為6.3%。

2017年美國智能音箱用戶調查報告(來自statista.com)

再看今年針對美國所有智能音箱使用者的調研結果,最常使用的功能還是諸如普通問答、播放音樂、播報新聞、播報天氣、設置鬧鐘這類比較簡單的功能。

易觀的一份產業報告稱,國內智能音箱使用者最常用的功能是點歌。

由此可見,雖然從理論上看,語音交互是更高效的交互方式,但由於現實生活場景複雜且語音交互技術尚未成熟,當前智能音箱的交互體驗還無法代替原有的交互邏輯

聽聽「消費者」怎麼說

為了了解消費者對智能音箱的真實看法,筆者找到一些朋友聊了幾句。

十幾位朋友中只有兩位買了智能音箱,其他人大多沒了解或者關注得不多,也有人認為現在的智能家電功能不太好用,所以短期內不打算買,當然也有考慮價格因素的。

受訪者聊天記錄節選

朋友W是科技產品達人,有什麼新玩意都會第一時間買來把玩。這次毫不意外地得知他去年就已經買了「叮咚」智能音箱。他家裡還有BroadLink的智能遙控器用來控制空調,尷尬的是,這個與京東合作的智能遙控器不屬於京東微聯,所以叮咚並不能控制它去調節空調溫度。他反饋最常用的功能是控制開關(京東的智能插座)和聽歌,其他還有定鬧鐘、聽喜馬拉雅、查天氣(但用的不多),其他功能基本沒用。並表示短時間內沒錢買其他牌子了,但會繼續關注。

iOS圈大咖Z今年購置了Google Home(使用時需要英文+架梯子),並燒錢購置了一些配套的智能家居設備,目前他家裡能夠配合Google Home使用的有Chromecast投射、Sony音箱以及飛利浦的Hue燈。最常用的功能是控制智能家居、聽歌、放雨聲。他表示Google Home帶來了很好的使用體驗,非常智能而且音質很好(當然還是比Bose Soundlink要差);缺點是軟體配置使用體驗比較差,相關配套智能家居設備很少,而能買到的智能家居設備也比較燒錢。後續他還會考慮購買小米AI音箱或HomePod,未來他的家裡可能會有三個智能音箱,他認為小米硬體很全應該會很方便。

Z對智能音箱未來的發展非常看好:「智能音箱我認為是手機之外的新戰場,IoT的入口,而且有很強的配套購買帶動作用,也是AI的最好載體。雖然不確定商業模式最終會怎麼樣,但我認為他會改善人們生活的體驗,並創造極大的粘性,滲透到你的生活中,將各種服務、設備變成你的一部分,他在IoT上比手機更方便,手機已經像我們的器官一樣,為我們提供對外界的眼、耳朵,而Home提供的體驗更近一步,他把你的家和你連接在一起,你只需要動嘴就可以控制家裡的一切,這是信息化和人類結合的重要一步。」。

廠商布局智能音箱市場,哪家棋高一著?

百家爭鳴,各憑本事

互聯網大公司、技術提供商、內容提供商、傳統音箱廠商布局智能音箱市場大多以自身優勢為切入點。

資料來源於網路

其中內容廠商的版權優勢在巨頭公司(如騰訊、阿里)面前其實並不明顯。

人人爭當語音交互時代的安卓,智能音箱不是唯一戰場

很多人將語音交互系統比作安卓,而語義技能則被比作安卓應用商店,第三方語義技能是否豐富在一定程度上會影響該智能音箱產品是否能佔據競爭優勢。

資料來源於網路,具體以官方發布為準

百度沒有推出自己的智能音箱,而是對DuerOS寄予厚望,目標是要打造一個基於語音交互的全新開放平台,向合作夥伴輸出AI技術能力,將自己的語音系統部署到越來越多的硬體產品中,他們想做「人工智慧時代的安卓」。與天貓精靈發布的同一天,百度在「百度AI開發者大會」上宣布,自己的語音助手DuerOS將作為智能語音生態鏈的基礎存在。

但是打這個主意的又何止百度一家?

對各大廠商而言,目前語音開放平台(包括語音交互系統和語義技能)已經成為標配,「有」不再是優勢,而「沒有」卻可能成為巨大的劣勢。與此同時,語音交互系統的戰火早已燃燒到了智能音箱以外的戰場,智能家居硬體、耳機、手機、車載系統、機器人等處處可見各家語音交互系統的身影。

截至2017年初,Google Assistant覆蓋智能設備已經超過1億台,並且即將登陸iPhone,其工程副總裁稱「我們的最終目標在於,以後人們可以在任何設備上與Google Assistant對話,而它能夠儘可能地為你做任何事情。」;而Alexa同樣以可怕的速度滲透整個電子市場,據不完全統計,截至2017年9月份已經有近4萬多種硬體接入了Alexa。

相較之下,國內廠商的語音開放平台和語音技能商店大多剛推出不久,且開放程度不一,接入的第三方硬體偏少,未來語義技能開發情況尚不明朗。在中文語音交互市場,科大訊飛(市場份額超70%)和百度(市場份額低於科大訊飛,但擁有更全面的AI技術)目前優勢較明顯。

反觀移動端操作系統的另一位霸主蘋果,2011年率先推出語音助手Siri,顛覆了用戶使用手機的交互體驗,並引領了一波手機端語音助手的潮流。但從那之後,Siri除了偶爾被調戲,似乎並不太實用,如今面對層出不窮的語音開放平台,只能運行在封閉的iOS內的Siri顯得有些沉默。

看似FreeStyle的智能家居布局,卻成了智能音箱混戰的快車道

與大部分廠商先推出智能音箱、再推動智能家居設備接入的路線不同,小米很早就開始打造智能家居產品,如今推出智能音箱更像是順勢而為。

很多米粉將米家及其一系列家居產品趣稱為「小米全家桶」,這側面說明了小米這幾年積累的智能硬體資源之豐富。雖然米家推出的時間不算早,但依附於小米生態鏈,整合了小米之前一系列智能產品和幾十家生態鏈公司的智能家居產品,形成了一套相對比較完整的智能家居系統。截至今年5月31日,基於小米MIOT平台的聯網設備總量已經突破6000萬台。當年很多人不理解小米為什麼做智能家居產品,如今智能音箱市場火爆,大家都搶著做智能家居入口,在所有人都還在忙著對接更多智能硬體設備時,小米布下的局已經先行啟動。

智能音箱的未來是什麼?

語音交互勢在必行,但是……

根據Gartner2017年最新版技術成熟度曲線圖,目前Conversational User Interface(對話式用戶界面)正從科技誕生的促動期步入過高期望的峰值,距離成為主流應用還有5-10年。Gartner報告中將CUI列為2017年的十大科技趨勢之一,報告[7]稱「隨著科技變得能夠讀懂人心,對話系統將帶來下一代信息技術轉型。企業架構和技術創新領導者當前必須充分利用可行的應用案例,同時探索未來會話系統存在的機會。」

CUI目前最主要的載體是手機、音箱和耳機

對廠商而言,布局智能音箱其實是在為了藉此形成入口、輸出服務,同時掌控語音交互背後的用戶和數據。智能音箱只是當下最適合的載體之一,未來家中所有的電子設備可能都會搭載語音交互模塊,屆時你將能與電視、冰箱等設備直接對話(P.S.這不是科幻片預告,在小米電視、美的智能冰箱等設備上已有不少落地案例)。

對於用戶而言,語音交互確實更符合人類本能,如果能通過語音交互的統一入口、免去單獨到每一個應用上獲取對應服務的麻煩,一句話就能便捷高效地完成眾多操作,用戶自然沒有不用的道理。但是現階段的智能音箱真的能做到「解放雙手」嗎?

技術尚未成熟,談入口為時尚早

拋開廠商設定,智能音箱本質上就是一款基於語音進行人機交互的智能硬體。播放音樂是傳統音箱的主要(幾乎是唯一)功能,但對於智能音箱來說,音質只是附加選項,用戶更看重人機交互的體驗,以及交互背後所能支持和兼容的服務數量與質量。人機交互體驗、線上互聯網服務和線下智能家居系列產品三者缺其一,智能音箱的入口目標就難以達成。而語音交互技術正是人機交互體驗的關鍵掣肘

從技術現狀和實際產品效果來看,語音交互技術還需要完善,最為關鍵的自然語言理解尚有眾多難關等待突破,各家公司都在艱難地往前探索。智能音箱的實際使用效果必然受限於技術。現在已經發布或者上市並且叫得出名字的智能音箱產品暫時還沒有誰甩誰一條街的情況,使用中普遍存在「動口不如動手」的尷尬場面。

總有做智能音箱的廠商說「用戶還沒養成語音交互的習慣」、「用戶還沒做好準備」,用戶才是真躺槍,人家倒是想養成習慣,可是你先給整個好用點的語音交互唄?

若要說語音交互存在泡沫,那泡沫主要也是源於各大廠商對語音交互技術成果的盲目誇大,比如家家語音識別準確率都達到97%以上(一切不提前置條件和測試數據集光說語音識別率都是耍流氓)。在自然語言理解出現重大突破之前,解決噪音問題、提升遠場語音識別率才是當務之急。

智能音箱還缺什麼

智能音箱還缺大屏參與互動。研究表明,在人的感知系統中,視覺所獲取的信息佔60%以上,聽覺獲取的信息佔20%左右;而人在溝通中表達的信息55%來自肢體語言信息,38%來自聲音信息。

雖然阿里憑藉購物場景的優勢,為天貓精靈搭載了聲紋購功能,但實際上網路購物是典型的離不開屏幕的應用場景,幾十秒就能看完的商品描述和評論,智能音箱可能需要幾分鐘才能念完,更何況眼見為實耳聽為虛,不看圖片光聽幾句商品介紹就敢下單的人有幾何?語音上場,屏幕卻不會消失,融合語音、視覺和肢體動作的交互方式或許更可能成為下一個時代的主宰。

Google IO 2017上簡單演示了使用Google Home喚醒Android TV並展示信息,智能音箱與智能電視的深度集成可能會成為新的趨勢。

除此之外,還需要將語音助手形象化,我們對著空氣、對著一個圓柱體說話太傻,需要一個能給予視覺或表情反饋的存在,我們才願意與語音助手有更多的交流。

智能音箱的中國問題:智能音箱能在中國重演安卓的盛況嗎?

我的答案:不能。語音助手強烈依賴雲端,需要廠商提供服務,而Android的核心代碼AOSP都在本地,可以構建分支。很難想像國內的智能音箱最終都使用同一家公司提供的語音助手。

那麼中國的智能音箱市場會變成什麼樣?

智能音箱是硬體、軟體平台、雲服務的合體,需要在這三方面都有強大的實力才能做好,目前中國符合這個條件的並不多。創業公司如果使用第三方的語音助手服務,核心技術操於人手,註定做不大。所以和目前共享模式的利用創業公司進行代理人戰爭不同,智能音箱需要巨頭親自下場。

巨頭有各自的護城河,幾乎每家都有自己的音樂和語音內容產品,而智能音箱和這些業務是可以相互促進的,因此只要智能音箱業務沒有嚴重虧損,巨頭就不會輕易言棄。所以中國未來智能音箱的市場很可能是在一場混戰之後,形成幾家割據的局面。

目前的問題是巨頭已有布局,但沒有人願意教育市場。


[1] gartner.com/doc/3021226 ?

[2] emarketer.com/Article/A?

[3] cninfo.com.cn/finalpage ?

[4] gelonghui.com/p/132229. ?

[5] news.sciencenet.cn/sbht ?

[6] mp.weixin.qq.com/s/lc5u ?

[7] gartner.com/doc/3645325 ?


推薦閱讀:

城市雲腦研究之三,人工智慧在城市雲腦建設中的地位與作用
人們對徵信的十大誤區
從互聯網進化的角度看AI+時代的巨頭競爭
《無人值守商店運營指引》正式發布,看看首份監管文件都說了些啥
從機器人到谷歌大腦—人工智慧的6個智能等級

TAG:智能音箱 | 人工智慧 | 語音助手 |