智能音箱的中國戰事

文丨周小丹、宮一柳

2017 年硬體領域最大的風暴,由電商巨頭亞馬遜引起。

2014 年 11 月,剛經歷過 Fire Phone 銷售慘敗的亞馬遜選擇低調發布智能音箱 Echo,貝索斯甚至沒有單獨為它開一場發布會。那時的他應該也不會想到,兩年多後這個「試驗品」不僅讓亞馬遜的股價創下歷史新高,也將幾乎所有科技巨頭捲入到一場由亞馬遜引領的商業競速。

(Amazon Echo 是一款智能音箱,也是私人聲控語音助手)

根據 CIRP、RBC Capital Market 數據,包括 Echo、EchoDot 和 Tap 在內的亞馬遜智能音箱,目前已累計銷售接近千萬台,銷售額達到 8 至 10 億美元。亞馬遜的 Echo 佔據了這個市場超過 70% 的市場份額。

這當然只是一場更大戰爭的序章,微軟、三星、谷歌、蘋果等科技巨頭正在加速進入戰場。

在 5 月 9 日亞馬遜發布帶觸屏的 Echo Show 僅僅一天之後,微軟在 Build 大會上發布了與哈曼卡頓聯合打造的 Invoke 智能音箱,內置了微軟研發多年的人工智慧助手 Cortana。

5 月 17 日的 Google I/O 上,最引人注目的就是 Google Home 和 Google Assistant 的重大更新,新版本的 Google Home 通過深度學習等技術升級後,現在只需要兩隻麥克風(亞馬遜 Echo 需要七個麥克風陣列),就能實現準確定位周圍說話的人;而 Google Assistant 宣布覆蓋設備超過一億台。

在 6 月即將到來的蘋果 WWDC 上,蘋果將發布首款搭載 Siri 的智能音箱這一消息也早已被外媒提前泄露. 據其台灣供應鏈的消息,產品已經進入到測試階段。

矽谷科技巨頭圍繞智能音箱的諸神之戰已經打響,戰火必然也將影響到大洋彼岸。

野心的繁榮

90 年代進入音響行業時,曾德鈞大概不會想到,三十年後,這個行業的主流玩家就要被一群互聯網公司取代。

這位有「中國膽機教父」之稱的 50 後創業者在音響行業浸淫多年,甘苦嘗盡。最近幾年來他越來越意識到,智能化將會帶來新一輪行業洗牌。但現在,這個趨勢正在加速到來:僅在 2016 年,就有包括 BAT、360 等多家互聯網公司的相關負責人陸續來到曾德鈞位於深圳的辦公室,與他討論相關產品問題,甚至有一家巨頭向曾德鈞創辦的雲動創想直接提出了投資意願——這樣的「盛況」此前從未出現。

「大家已經對這件事情有了很高的預期。」這是曾德鈞過去一年來最明顯的感受。

「如果說哪家公司不眼紅,那絕對是假話。」一位國內語音識別技術公司 CEO 直言。據頂樓 TopView 獲悉,國內包括 BAT、小米、獵豹、聯想在內的多家公司都在這個領域積極布局。一位智能家居行業從業者對頂樓 TopView 透露:「現在已經沒有哪家巨頭不在做智能音箱了,估計就在 2017 年,國內起碼會有 7、8 個中國版 Echo 面世。」

自 2014 年底到今天,國內科技公司受 Echo 啟發而加入到智能音箱戰局的過程,大致分為三個階段。

2014 年 11 月,Echo 正式面市。作為一款概念上並不新鮮的智能音箱,Echo 帶來的最亮眼的變革在於,用戶無需按鍵,只要喊出 Alexa 就可以把它激活並發號指令,而實現這一遠場語音交互體驗的基礎是 7 個裝置在產品頂端的環形麥克風陣列。

(Echo獨創的6+1環形麥克風陣列,大大提升了遠場語音識別效率)

最先看到 Echo 潛力的是國內語音技術方案提供商:「其實拿到 Echo 內測版的時候,我們意識到這可能是一個很好的方向。」語音交互技術和解決方案公司思必馳市場總監龍夢竹說。

到了 2015 年 10 月,僅在 Ehco 正式放開銷售幾個月後,思必馳就迅速推出了跟 Echo 同源的麥克風陣列。在此之前,國內軟硬一體化的麥克風陣列市場幾乎屬於空白。

在同一時間感受到變革「氣息」的,還有此前專註於機器人方向的人工智慧創業公司 Rokid。2014 年公司成立之初,Rokid 的戰略重點是當時最受追捧的機器人。2015 年,Rokid 第一款家用機器人發布。也就在那時,Echo 在美國市場受到的追捧直接影響了 Rokid 的戰略方向,「那時候我們開始意識到,相比於機器人,智能音箱或許會成為更容易打開市場的方式。「Rokid 產品總監向文傑說。2015 年底,Rokid 立刻決定轉變戰略方向,在第二代產品中將語音和遠場識別技術作為了核心。

如果說,2015 年 Echo 的影響力還只是被少數創業公司所注意,2016 年 Echo 在市場上的高歌猛進則讓更多國內互聯網公司加速在智能音箱市場的布局。

根據 CIRP 的報告,截至 2016 年年底,Echo 系列產品在美國的銷售量已經達到 700 萬。更重要的是,亞馬遜在這一年已經逐步將 Echo 背後的語音助手 Alexa 做成了開放平台,目前平台擁有上萬種技能。同樣是 2016 年,Google 正式推出了智能音箱 Google Home,這無疑成為重要的產業風向標。

「兩年前公司剛成立的時候,我們就一直嘗試與 BAT 合作打造智能硬體,那時候他們對智能硬體沒有明顯的興趣。」作為智能硬體供應鏈上的服務提供者,硬蛋科技負責人發現,就在 2016 年 10 月,Google 的智能音箱 Google Home 正式推向市場的同時,此前拒絕了硬蛋的大公司竟然紛紛主動找上門來,詢問合作可能。另一位語音技術供應商則表示,同樣是在 2016 年 10 月份,小米開始和他們接觸談智能音箱合作。根據這位負責人的透露,雷軍對此事表現出了強烈的興趣。

(2016年10月15日,Google正式推出能通過語音助理聲控的Google Home)

Echo 及其背後的語音助手 Alexa 讓亞馬遜一飛衝天,智能音箱 AI 時代交互入口的觀點被更多人所意識到,沒有人願意在智能手機之後的下一個平台級機會面前被拋下。

進入到 2017 年,無論是大公司還是創業公司,幾乎都向著成為「中國版 Echo」擺好了進擊的架勢:2017 年 2 月,百度宣布全資收購創業公司渡鴉科技;3 月,在離職前幾天,吳恩達還曾親自率領一支技術團隊來到深圳考察硬體廠商;4 月,騰訊宣布推出智能語音助手「騰訊叮噹」,直接對標亞馬遜的 Alexa;隨後出門問問在 4 月宣布推出虛擬個人助理,以及即將在下半年亮相的問問智能音箱 Tichome;而在 5 月,來自聯想和創業公司 Rokid 公司的智能音箱產品正式面市,從外觀或功能上,二者都以本土版 Echo 自居……

據某家技術供應商透露,網易、搜狗、360 等手裡都有智能音箱相關的立項。就連一直被認為不具備硬體產品基因的騰訊,內部產品也早已完成了開發。還有早已浮出水面的微信硬體「微信相框」,也「正對標亞馬遜的 Echo 調整產品定位和功能」,微信相框負責人對頂樓 Top View 說。

大戰前夜,未見火光,但硝煙漸起。

2015,京東教訓

智能音箱的中國故事,其實早在兩年之前就有過第一季的上演。

對於一直將亞馬遜視作對標對象的京東來說,亞馬遜通過 Echo 和背後的 Alexa 實現的成績帶來顯然是一個不可忽略的信號。

早在 Echo 面市後不久的 2015 年,京東就火速與科大訊飛成立了一家合資公司靈隆科技,並在 2015 年 6 月發布了一款名為叮咚智能音箱的產品。這款音箱搭載了科大訊飛的智能語音系統,內置 8 個收音麥克風,喚醒詞則為「叮咚叮咚」。在內容方面則集成了百度音樂、喜馬拉雅 FM 等等服務。根據京東官方給出的售價,這款產品最低配青春版售價人民幣 199 元,最高配新東方教育版售價 998 元,平均價格為 618 元。

(叮咚音箱。根據技術商透露,199元低配版每賣出一台,「就要虧五十元。」)

據一位接近靈隆科技的語音解決方案服務商公司負責人透露,在京東內部,「劉強東對此事非常重視」。當年京東為靈隆科技注資 4500 萬人民幣,占股 45%,另外 55% 股份則由科大訊飛持有。而新公司由京東智能產品中心總監魏強直接負責。

很明顯,叮咚音箱並沒有帶來如 Echo 一樣的市場效應

在產品剛剛上線的一段時間內,京東也曾主動讓出網站主頁 Banner 頁面為產品做 24 小時的展示和宣傳——這和亞馬遜的策略如出一轍。根據公開數據顯示,今年叮咚音箱及其合作產品累計銷量已經突破 100 萬台。但不只一位智能音箱從業者對頂樓 Top view 坦言,這個數字存在水份。「有可能幾十萬台都不到。」

「京東當時投入的決心很大,但現在雙方都有點心灰意冷。」上述負責人把叮咚的失利總結為二者合作方式的不當:從叮咚音箱的技術、研發到產品設計,再到靈隆科技的架構上,科大訊飛一度都佔據著主導地位。「叮咚音箱想學亞馬遜,又沒學到精髓。這件事情上,絕對不能讓技術為主的公司負責產品;另一方面京東又很快的通過很激進的宣傳、推廣把市場的預期拉的太高。這是非常危險的」。

那麼,京東希望學習又沒學到的亞馬遜的精髓又是什麼?

首先,亞馬遜 Echo 在發布的初期足夠的謹慎,並不是高舉高打,概念先行。

從亞馬遜神秘的 Lab126 實驗室誕生時,Echo 脫胎於此前失敗的項目 C(Lab126 實驗室按照產品重要級別從 A 到 Z 為項目編號,Kindle 為項目 A,曾被寄予厚望的 Fire Phone 為項目 B)。或許是因為 Fire Phone 的折戟,包括貝索斯在內的亞馬遜高管對這款帶有遠場語音識別功能的音箱只帶有相當謹慎的預期:他們僅僅希望 Echo 提供的新體驗會讓用戶更願意在亞馬遜電商網站上進行購物。在 2014 年 11 月 Echo 面世後,亞馬遜甚至沒有過分強調所謂的「智能音箱」概念,而是把 Echo 當做一個音箱升級的產物,最初只把 Echo 提供給少數用戶,並收集他們的使用反饋。

其次,在得到市場印證之後,亞馬遜果斷將其上升為公司戰略業務,並充分利用亞馬遜的平台資源不遺餘力推廣。

Echo 在市場上出人意料的受到了用戶歡迎。這讓亞馬遜重新審視了 Echo 的意義,並漸漸開始放開手腳,將所有資源都傾向給 Echo:2015 年開始,亞馬遜除了在銷售推廣上不遺餘力,也選擇了在合適的時機將 Alexa 逐步開放,在這個過程中,甚至就連許多第三方的接入都由亞馬遜親自操作完成。到 2016 年,Echo 一戰成名,Alexa 上升為公司戰略級業務——此時,亞馬遜獲得的先發優勢甚至讓谷歌也望塵莫及。

2016 年 5 月 Echo 副總裁 Mike George 在一次大會上介紹Echo。)

從最開始謹慎的產品和市場定位,到後來上升到戰略層面的高舉高打,亞馬遜這套「組合拳」式的打法讓人稱奇,但想要在中國這個市場上攪動風雲的公司只能羨慕,卻無法模仿。一個最直接的原因是,在國內,即便是被行業視作巨頭甚至是陰影的 BAT,也沒有一家能像亞馬遜一樣本身就擁有強大的軟體、硬體以及銷售渠道相結合的綜合能力。在這種情況下,最有效率的方式可能就是「抱團取暖」。

對於 BAT 和京東來說,理論上他們具備接近於亞馬遜所能調動的資源能力,但是目前的公開信息來看,並沒有一家將智能音箱上升到足夠的戰略高度來對待,而在智能音箱背後的 AI 助手技術層面,也整體落後於微軟、谷歌、亞馬遜等國際巨頭。

而那些想要抱團取暖入局的互聯網公司,對他們之中的大多數,智能音箱更像是一個 BD 的合作,在中國的硬體供應鏈基礎上,打造一個能夠對聲音進行反饋的音箱並不難,但這個音箱能夠做到多智能則是另一回事情了。

即便是今天回頭來看,當初亞馬遜 Echo 的成功也是集天時地利人和的小概率事件,很多時候,野心的繁榮並不等同於市場的繁榮,習慣了追逐風口而缺乏足夠技術積累的那些中國公司,在智能音箱所引發的產業機會面前,更多時候可能是有心無力的焦慮。

智能音箱熱的背後到底是個什麼機會?

智能音箱不是硬體創業熱潮的延續,而是 AI 時代的第一個實體載體。

這註定是一場關乎技術、設計和商業等綜合實力的競爭。產品的打磨只是第一步,所謂的智能音箱還需要回答的一個重要問題是,夠不夠聰明?消費者有多大的動力願意為它花錢?

「用戶買回家,大部分只會用它聽歌或者詢問一下天氣,但這樣形成的黏性不會太高。」出門問問創始人李志飛覺得,在目前階段,家庭環境中暫時還不存在一個強烈的語音交互需求場景。所以儘管出門問問也發布了虛擬語音助手和智能音箱的產品計劃,李志飛也表示公司將把這個方向「認真的當做一個戰略」去做,但是根據他的判斷,」智能音箱的市場需要時間「,現階段更成熟的語音交互場景還是會發生在車內空間。

而豌豆莢創始人王俊煜在一篇關於 Echo 和 Google home 的使用體驗的文章中則提到,要養成新的交互習慣,「必須具備三個條件:新路徑比舊路徑要短得多,新路徑的成功率足夠高,新路徑失敗後的損失足夠小。」換言之,如果用戶發出的指令得到的是智能音箱緩慢甚至錯誤的反饋,那麼用不了幾次,人們就會認定這款產品不夠「聰明」,產品體驗大打折扣。

Echo 最初讓人眼前一亮的功能之一,就是可以通過 Alexa 平台控制家庭環境內的其他智能產品,比如消費者可以發出指令命令 Alexa 為自己開燈或關燈;不僅於此,亞馬遜作為電商平台本身就能夠提供用戶通過智能音箱語音下達購物指令的頻繁場景;這些都在為幫助用戶養成新的交互習慣和提升黏性添磚加瓦。某種程度上說,Echo 的成功是恰到好處的先發優勢+場景的勝利。

(Echo 功能之一可以通過 Alexa 平台控制家庭環境內的其他智能產品。)

另一方面,Echo 模式也有其瓶頸。如果認同智能音箱之爭背後的實質是 AI 之爭,你就會意識到數據和調用頻率對於一個 AI 產品長期發育的重要性。Echo 系列產品目前固然銷售了千萬台,並且亞馬遜 Alexa 本身正在成為開放平台,但畢竟只是基於亞馬遜自己的生態,而在剛剛結束的 Google I/O 大會上,Google Assistant 宣布其覆蓋設備已經超過一億台,這一數字還會隨著接入更多硬體平台而大幅度提升。

更值得關注的是,Google 已經開始把其最新的 AI 技術深層應用到 Google Home 之中,比如 Google Home 增加了視覺反饋技術,即便沒有如亞馬遜最新發布的 Echo Show 那樣自帶屏幕,但當你需要屏幕交互時,你可以和 Google Home 音箱對話,就能讓結果顯示在你的手機或電視上。這意味著,你不但能讓 Google Home 播放你喜歡的音樂,讓它打電話,而且可以對著它說出你想看的視頻。

同時,Google Assistant 正在成為一個進化速度可怕的 AI 幽靈。Google Assistant 在集成領先語音能力的同時,也深度集成了 Google Lens 的圖像處理能力。並且它還會不斷被 Google 的強大數據來源所「餵養」,這些數據不僅來自 Google 自己的用戶平台,也來自接入 Google Assistant 的越來越多手機、空調、冰箱等終端。

未來,當我們再談論起智能音箱,談論的將不只是智能音箱的軀殼,也不只是語音交互與聲場識別,而是一個不斷進化迭代的 AI。這就意味著,對於沒有深厚 AI 技術基礎和數據基礎的參與者,智能音箱的熱潮縱使誘人,也只是一個水中撈月的幻象。

中國戰事的三種路徑

亞馬遜和 Google 將會引領智能音箱市場兩種典型的模式,前者依靠其多年構建平台的生態協同,用盡量多的場景增加使用黏性;後者則藉助其智能助手藉助硬體的病毒般擴散,在海量的設備和數據餵養下讓 AI 不斷迭代進化。

在中國,能夠做到亞馬遜模式的平台本就不多,在硬體產業鏈和銷售、品牌等環節已積累起優勢的小米,或許將成為一個值得關注的重量級選手。

根據頂樓 TopView 從產業鏈多方獲得的消息來看,「小米版 Echo」早已完成了產品研發。在微信公眾平台上,已經出現了一個名為「小米 AI 音箱」的賬號。這個賬號由已經由 2017 年 4 月 26 日完成認證,主體是北京小米移動軟體有限公司,公司法人代表則是黎萬強。

另據一位深度參與了小米 AI 音箱的技術廠商負責人透露的細節,這一項目是由小米電視掌舵人王川和小米大腦負責人 KK 直接帶隊。同時這位負責人還表示,來自小米的這款音箱和 Echo 的產品策略相同,最開始不會過分強調「智能」概念,儘管具有了遠場語音識別的功能,但是在服務集成上做了不少「減法」,零售價格也不會超過 500 元。

事實上,這並非小米第一個試水語音功能的音箱。2016 年 11 月 22 日,小米曾經發布過一款小米網路音箱,當時售價 399 元。但這款網路音箱採用的是近場雙麥技術,長按控制面板的「CH」鍵才能下達語音指令。

小米網路音箱於2016年11月發布,定價399元,與騰訊、阿里兩大音樂版權庫合作,後接喜馬拉雅FM等多個頭部語音頻道。)

此次發布的新產品很有可能以「小米網路音響」的升級版概念出現在市場上,它對小米的意義不言而喻:隨著手機銷量增長停滯,雷軍也必須為消費者和市場講一個更新、更酷的故事。而越來越完整的智能家居生態鏈、強勢的渠道和品牌,這一切可能都會在未來成為「小米版 Echo」手上的王牌。

根據頂樓 TopView 獲得的消息,小米對還未發布的智能音箱抱有的是百萬台級別的期望。但在記者接觸的大多數業內相關人士判斷,這個市場」真正做起來」,至少還需要 2-3 年,甚至是 5 年的時間。

儘管市場需要耐心培育,對於大多數創業公司來說,他們遠沒有小米的天時地利,想要在智能音箱的機會面前分一杯羹,換一種思路更加合適。

一個可以關注的機會是藉助 Google Assistant 的全球擴張抓海外市場機會。中國有成熟的硬體製造鏈條,藉助與 Google 等巨頭的全球體系合作將生產的音箱產品賣到海外去,用 Google 的靈魂,造自己的軀殼,不失為一種商業路徑。

出門問問創始人李志飛告訴頂樓 TopView,出門問問也會將智能音箱,以及背後的家庭語音交互場景當做戰略重點嚴肅對待,因為「這和公司的使命相關」。不過,儘管 4 月出門問問發布了基於虛擬個人助理的免費級 AI 開放平台,但李志飛在接受頂樓 Top View 採訪時表示並不排除以後和巨頭合作的可能。而就在 2017 年的 Google I/O 大會上,出門問問成為了 Google Assistant 的官方合作夥伴。同時,出門問問即將面向海外推出的智能音箱產品 Tichome Mini 即將搭載的就是 Google Assistant 操作平台。

(智能音箱產品Tichome Mini 產品概念圖)

第三種路徑則是抓住 Google、亞馬遜智能助手服務暫時不能入華的時間窗口。例如一些優秀的中國創業公司通過與亞馬遜、Google 合作的方式,成為這些巨頭服務曲線入華的本土合作夥伴。與此同時,理論上來說,Google、亞馬遜的智能音箱服務暫時沒能進入中國市場的這段時間對於 BAT 來說也是個機會窗口,但關鍵取決於他們是不是有足夠大的決心,以及在 AI 層面的技術積累是否足夠深厚。

2017 年 1 月,百度在 CES 現場推出了人工智慧操作系統 DuerOS,並且宣布和智能機器人公司小魚在家達成合作。DuerOS 這個平台可以實現語音控制、日常聊天、直接提供多種 O2O 服務等的智能化轉變。而到了 4 月,騰訊推出的智能語音助手騰訊叮噹,更是直接接入了騰訊內容生態和技術生態,按照騰訊的官方說法,叮噹更希望打造一個完整的服務體系。

但同時,兩家公司也在通過不同的方式向自己曾經並不擅長的終端產品領域進軍:在 2016 年 9 月的百度世界大會上,當時還未離職的吳恩達曾宣布將與音響廠商哈曼合作生產推出智能音箱,後來在 2017 年初收購渡鴉科技後,關於智能音箱的研發、設計等任務似乎落到了渡鴉科技團隊身上;而根據頂樓 TopView 從多方獲得的消息證明,騰訊內部也一直沒有放棄硬體產品的嘗試,關於智能音箱的研發似乎已經進入了尾聲。

對大公司來說,一旦決定親自「下水」,就意味著必須親力親為,把軟體平台、硬體、線上線下的銷售、營銷、供應鏈整個抓起來,需要的決心和難度可想而知。

而對於沒有技術縱深,也缺乏強用戶需求牽引的創業公司,可以藉助資本看不明白的階段快速拿盡量多的錢,但很快就會發現,隨著更多巨頭認真投入其中,自己可以做的事情是有限的。

不同於五六年前的智能手機浪潮開始時,中國市場和產業鏈條的蓄勢待發。智能音箱的中國戰事前所未有的迷茫和混亂,在亞馬遜、微軟、谷歌等公司近期密集的動作影響下,內心不論多焦慮,都要認清現實:智能音箱熱潮的實質是 AI 之爭,歸根結底是未來人工智慧的入口和焦點,這個機會不僅是靠硬體上做好幾個局部功能就抓的住的。

一個殘酷的現實是,早已從「Mobile First」向「AI First」轉型的 Google 又一次把不確定的格局抓到了自己手中,這一次,大多數的中國公司從戰略到技術儲備上再一次落後了。

(編輯:王偉;實習生鄧婧對此文亦有貢獻)

原文鏈接→智能音箱的中國戰事

推薦閱讀:

智能音箱大戰已在矽谷巨打響:但國內為何沒啥動靜?
在亞馬遜 Echo 挑起的智能音箱大戰中,他選擇了在移動辦公這個垂直領域精耕細作
價格屠夫小米入局智能音箱,會成為智能家居的收割者嗎?
把表情包做成智能音箱,Line 為莎莉雞和布朗熊找到了一條全新的發家路…

TAG:智能音箱 | AmazonEcho | GoogleHome |