智能音箱能否成為物聯網中的「超級產品」?

新聞背景:智能音箱可能是亞馬遜下一個值錢生意,它是怎麼來的?

Echo 正式開售後不久,亞馬遜特別設立了 Alexa 基金(Alexa Fund),還推出了免費的開發者軟體工具開發包 Alexa Skills Kit (ASK),邀請硬體商和軟體開發者使用 Echo 音響內置的 Alexa 語音技術。

亞馬遜在 Echo 上的開放平台策略讓 Echo 能做的事越來越多,一個簡單易用、並且慢慢增加技能的智能音箱,讓用戶越來越離不開它。

儘管 Echo 還不夠完美,但是它很可能成為亞馬遜下一個重點業務:去年聖誕節期間,Echo 是亞馬遜上銷售最好的產品之一,而亞馬遜第一次在美國春晚「超級碗」上投放的廣告,主角也是 Echo。

感覺音箱使用的場景比想像中多,而且願意購買智能音箱的客戶質量比較高


Echo能,其他未必。

Echo在美國據說賣的不錯,去年下半年至今年春節3M台左右(各路傳言我個人歸一化後的數據)。為了回答這個問題,需要定義什麼是「超級產品」?我不想拿Echo跟iPhone比,iPhone是「神級產品」,三千年一開花,三千年一結果,三千年一成熟,需要日月星辰的造化(扯遠了)。超級產品比如Wii,比如Walkman,比如Nest等,這些已經是現象級的產品了,可以開拓一個方向,打開一片藍海。

從這個意義上講,我認為Echo是超級產品,因為TA把一種新的交互以新的產品形態商業化了,起步還蠻成功。如果你說Google Now Siri也是新的交互,但其交互方式是為手機這個移動計算設備打造的,其交互方式是基於Touch觸屏這個基礎交互之上的。Echo首次把語音和自然語言理解的交互以嶄新的產品形態呈現給消費者,得到了消費者的認可(截至此時,Echo在亞馬遜有36177個評論,4.5顆星)。當然,Echo的嘗鮮門檻是極低的,Amazon Prime會員$99就可以,這個價格在國內都是沒有門檻的。

Echo的產品設計也是及其用心出色的:圓柱形的身體,黑色噴漆,簡單大方,符合亞馬遜一貫的硬體氣質。音量的控制用最直覺的旋鈕(yes, Sugr Cube方糖音箱也是這樣設計的),旋鈕巧妙的與機身融合一體。燈光的反饋配合波束成形和聲源定位演算法,這是給人十足信心的人機交互設計。通體只有一根圓形電源線從底部開口引出。簡潔的可以適配任何房間。聲學設計是其最大的挑戰,怎麼在全向聲音採集,音樂的播放和音質之間達到平衡,到目前為止Echo應該是給出了最佳答案,以至於跟隨者們就直接抄之。當然,從一個音響產品的角度,Echo還遠不能稱為一個好的音響,其音質讓普通消費者聽歌是足夠了。Amzon新出的Dot/Tap,一定程度上可以實現Echo全部功能,且可以連接家中已有的各種檔次的音響,算是可以部分解決音質的問題。Echo開放API給其他智能家居廠家,可以聲控飛利浦的燈等其他產品。相信會有越來越多的廠家加入Echo的平台。Echo最驚艷的是響應速度,真的快,超出預期,及時在國內使用也能做到秒級的響應。這是產品成功的基點。

今天恰好有朋友問我為什麼Google, Microsoft, Apple沒有出EchoAlexa這樣的產品,反倒是AMZN搶先了。我覺得這挺簡單,Google, Microsoft和Apple習慣了設設設設計計計計產品(此處強調設計)。他們對產品外觀、材質、交互等等的設計強調到了很高的高度,甚至為了設計而設計(以前在MS的時候,工業設計師的地位短短几年迅速提高,在這種環境裡面一般產品從水底浮到水面給決策者看到的機會是不大的),而忽略了產品的本質。Amazon向來是一家從不過度設計的公司(Kindle,Fire...),而語音交互類產品也恰恰是一個不需要過度設計的產品。因為你不需要摸TA,甚至不需要看TA(好悲催的產品,是撿來的孩子嗎?),有事問他一下就好。在這樣一個品類裡面,AMZN搶個先機也不奇怪。

Echo的硬體賦予了他強健的骨骼和肉體,其實真正的實力在TA的最強大腦Alexa,而且這個大腦是在成長的。目前Alexa還有許多問題(比如無法記憶上下文,知識庫狹窄等),比起Google和Siri其實還很幼齡,但我相信開放會讓TA快速成長。在AMZN強大的AWS和數據能力加上老貝這個戰略偏執狂的支持下,Alexa前途會很光明。

很快,估計Google, Microsoft也會以各自的產品形態加入這樣的戰場,藍海變紅海的速度是不是也要有個類似摩爾定律的公式了?不論如何,歷史總是驚人的相似,革掉一個行業命的往往是外來者,不妨簡單回顧一下:iPod vs 唱片發行,iPhone vs Nokia。所以音響行業夥伴們和同行們應該都動起來了,Fortune(Sonos Layoffs: Firm Refocuses on Paid Music Streaming, Voice Tech)報道過知名Wi-Fi音響品牌Sonos已經在裁員。

Echo的產品、設計、邏輯看上去都沒有什麼大問題,前途光明。就像無人機,VR每個浪潮一樣,國內的同行們自然不會放過每一個掘金的機會,一直都有大大小小的公司在這個領域布局。有的玩玩就走了,有的在掛靠各種概念(機器人,智能家居,智能音響),也應該有在認真打磨產品提供體驗的。我認為EchoAlexa類的產品在有中國特色的市場還不夠成熟:

1. Siri Google Now在美國已經有極高的使用率,在國內很少。語音輸入法也沒有被很好的使用。

2. 美國中產的居住環境跟國內差別很大,房間的面積、數量,電器的使用情況和習慣差別很大(溫控,電控,取暖,車庫等)

3. 文化習慣的差異,美國人對背景音樂(BGM)需求是比較普遍的,可能是汽車文化導致收音機廣泛收聽的原因。而中國人的聽歌習慣更多是從磁帶、CD、專輯、歌單這樣演化的。所以Echo更適合在某種電台、頻道或者曲風下面連續的播放,而更有針對性(歌手、曲目)等的聽歌方式還是適合在屏幕上操作(視覺反饋)。

4. (這個是我拿不準的)兩邊文化的差異,會不會導致人們使用語音產品也有差異。老美普遍愛說(你看《老友記》《The Big Bang Theory》應該會感受到),有什麼事就開口說。中國人在儒家文化影響下平均不愛開口。我不知道這種文化差異會不會帶來使用語音產品的需求和習慣差異。

再加上新產品新形態從美國發源到國內接棒,通常有個時滯效應(當然,這個延遲越來越短),所以國內的Echo應用還需要創新者們積極的探索和思考。

2016-7-29補充: 5月18日,Google I/O大會上發布了Google Home,直接對標Amazon Echo的產品https://home.google.com/ 從域名的級別來看,可以算是Google的戰略級產品了。從那時至今沒有任何動靜,讓我們拭目以待吧。

2016-10-5補充:今日凌晨,Google新硬體發布會終於揭開了Home基本功能的面紗,雖然沒有詳細說軟硬體配置,但100%對標Echo的模仿也算是對Echo的充分致敬和開足火力競爭了。


作為智能硬體行業的從業者,從從業經驗及個人看法來回答,先說下結論結論:

智能音箱不會成為物聯網中的超級產品。

------------------------------------------------開始叨逼的分割線------------------------------------------------

2014 年 11 月 6 日,亞馬遜在官網低調地宣布了一款名為 Amazon Echo 的家庭智能音箱。2016 年 3 月,在 Echo 音箱的基礎上,亞馬遜推出了 Tap 和 Dot 兩款內置 Alexa 的硬體,Tap更像是 Echo 的廉價版, Dot 則是將其他揚聲器智能化的產品。Echo售價180美元,Echo Dot售價49美元,Echo tap售價129美元,Echo Show售價249美元。

2015 年,Amazon Echo 一舉佔據整個音箱市場銷量的 25%,比 2014 年增加了 1200%。

亞馬遜公布2016年第四季度財報,宣布搭載語音助手Alexa的設備成為假日季最熱銷的產品,銷量同比翻了九倍。根據CIRP、RBC Capital Market等公司的估計,自2014年發售以來,Echo及另外兩種產品累計銷售量接近一千萬台,銷售額達到八至十億美元——儘管這對於亞馬遜的體量來說不算什麼,然放眼語音AI這個新興市場來說,還真沒有人比得上。

2016年5月19日,在年度I/O開發者大會上,谷歌發布了配有內置揚聲器的語音激活設備Google Home 。2016年10月5日,推出能通過語音助理「聲控」的Google Home。市場定價129美元。

蘋果公司在2017年6月6日召開的蘋果全球開發者大會(WWDC)上宣布推出智能音箱HomePod,同現有的Echo和Home一起形成了智能音箱領域三足鼎立的局面。HomePod將於2017年12月在美國、英國和澳大利亞上市。市場定價349美元。

來自eMarket的數據顯示,在2017年一季度美國語音助手市場中,Amazon Echo的市場份額達到70.6%,Google Home則佔到23.8%,而其他廠商(包括蘋果、Lenovo、LG、Harmon Kardon和Mattel)分食剩下的市場份額,為5.6%。

2017年7月5日,阿里巴巴人工智慧實驗室今日正式發布了旗下首款智能語音終端設備——天貓精靈X1,其內置AliGenie中文人機交流系統,能夠理解中文普通話語音指令,實現音樂播放,智能家居控制等功能。

目前智能音箱越來越火,2017年將會是智能音箱爆發的元年。

▲智能音箱百度指數在2017年發生急劇變化。

國際三大巨頭都開始做智能音箱了,國內的京東和阿里也開始做了,各路科技大佬也紛紛表示看好智能音箱這個市場,更別說全球大大小小的智能硬體公司、音樂公司也在參與智能音箱。

於是給大眾造成了一種錯覺:智能音箱要飛了,即將爆發出幾千億的大市場。

與其說是智能音箱火爆了,個人覺得,更多的不如說是語音AI火爆了。

智能音箱,或者是智能語音中樞,未來將會有更多的具有廣域收聲能力的硬體產品,都會有智能助手加身,通過語音語意的識別,來實現不同的功能,Echo也不例外。

智能音箱,只會加快語音AI的發展。

1、智能音箱不會成為物聯網中的超級產品。

看看對超級產品有個定義,最高票米唐科技的@Sugr宋少鵬 ,按照他的意思是像蘋果那樣的產品,就是上古神器產品,基本上就是前無古人、後無來者,大眾對它來說是可遇不可求。

嘿嘿,這周六正好去聽了他的演講,宋總,好有緣分呢。

我個人理解,超級產品,就是說它會是很多東西一個入口,能帶動一個產業、一個方向。

從這個方面說的話,假如真是各個行業更加細分地發展的話,比如電子產品,智能音箱並不會是一個超級產品。因為從個人就是這麼看,音箱就是它本身就是一個最基本的元素:聲音,傳遞音樂或者是傳遞語義。但是傳遞音樂在某些特定的場合,有的人會喜歡,有的人認為它是噪音,而且聲音涉及到使用距離問題,這些都是無法避免的一個問題。

所以從我的理解來說,隨著行業的發展,它應該不會是一個超級產品,它更多的是一個伴侶,就這麼一個角色,它可以跟很多硬體搭配在一起。

從我的角度看,超級產品更多的像手錶、手環這種穿戴,就像微軟電影裡面,一個手錶戴在手上就是隱形的,因為到那時候你的電池、你的網路、你的交互都不是問題。到那時,音箱能幹的,它都能幹。除聲音之外,因為聲音可能你喜歡、我不喜歡,公共場合里不可能跟音箱說一些私密的事情,但是手環、手錶就可以,它不會給你帶來一個變動的東西,有的人喜歡,有的人不喜歡,所以我是這麼理解的,我不認為智能音箱它是一個超級產品,但是它會是一個比較好的伴侶,也會是一個很多智能產品的連接器。

2、目前智能音箱遇到的最大的阻礙或者問題,主要是在哪些方面?

  • 網路WiFi的穩定性:因為智能音箱目前打的是音樂這個東西,點歌、推送,如果你的網路不好的話,你給它發個指令,它半天不來,或者說網路時好時壞,特別是播放在線歌曲可能卡頓或者造成音質不好,或者說你想聽個無損的,它給你來個標準音質的,這個聲音層次就降低了。所以說WiFi的穩定性、網路是目前首要解決的一個問題,但這也是目前的一個通病。
  • 優質內容:更深的就是那個音樂內容這一塊,優質內容是最終播放和吸引用戶反覆多次使用的重點。優質內容的獲取,目前還不統一。

以國內為例,目前國內有三大音樂陣營體系:阿里、海洋(酷我、酷狗)、騰訊。

做智能音箱的廠家,就需要找這三大體系之一來合作獲取內容,目前還處於不收費站隊選擇陣營階段。加入阿里/海洋/騰訊的智能硬體體系,加入他們的智能硬體之後,他們的這些資源都免費提供給你。目前你只能選擇一家。

如果不把這三家兼容起來,聽這首歌可能要選擇一個平台,聽另外一首歌可能沒有版權,所以音樂層面可能需要打通,還有就是可能需要付費及版權。現在三大音樂體系是還沒有打通。當然未來也有可能是這麼一種情況,推出一個東西,三家進行有音樂資源共享,所以這是當前可能要面臨的一個問題。

  • 交互:遠場交互和近場交互問題,個人認為目前市面上的交互都還是比較初級的階段。做得比較牛逼的就是Echo,它已經實現了支付,我在美國的同事已經測試過,可以通過它手機就不用帶了,支付密碼可以通過聲波支付進行購物。

3、未來的智能音箱/超級產品會發么樣?它應該朝什麼樣的方向發展?

從短期來看,它應該是能完成最基本的音樂、聲音的傳遞;另一方面就是說對一些科技、愛玩的人士,隨著技術AI比較成熟,它會做到類似於機器人的這種效果。短期的話還是在智能音箱的功能上繼續加強。

從長遠來說,個人覺得智能音箱會被機器人產品替代,機器人就會把智能音箱的功能全部融合進去。

所以,未來物聯網中的超級產品將會是智能機器人,而不是智能音箱。

如果是傳統音箱,就是有這麼一部分人,比如說追求極簡的人,不需要你搞這些交互什麼東西,因為本來就是喜歡純粹聽音樂。當音箱真正達到一個智能化程度之後,你打個噴嚏,它認為你這個行為是埋怨或者其他無法解讀的信息,但其實這只是一個正常的反應,這個時候反而適得其反了。所以說,這種觀點認為你是音箱你就好好給我放音樂,精神層面我來享受這個產品就完了。

智能音箱就是WiFi音箱演化來的。目前走純音箱的路線還是很窄的。WiFi音箱,誰都能做,阿里系最便宜的99,但是做完之後能不能在市場上火起來,這是個問題。

智能音箱相比與藍牙/WIFI音箱,區別在於兩方面:一個就是雲端及網路的暢通;一個是交互方式,目前就是說語音,語音裡面有兩種,近場和遠場。

目前國內的音箱,包括叮咚,在一定距離之內,我要點語音那個按鈕,音樂停止我再去說話,這是近場,就是我必須要去觸發它。遠場就是類似於Echo,其實後面做的就是要走遠場,比如360度的環繞,這個音箱在這個方向說也可以,在背後說也可以,而且它正在播放音樂時候我說也是可以的。

智能音箱,後期它的發展應該是更加專業化,再把網路互通做好的基礎上,繼續深化和優化交互,可能就是更多偏向於遠場交互,後面一個是發展的重點方向。然後第三個就是真正的AI,你有一個好的交互,加上一個好的網路,這時才會談更多的使用場景,這時候才會有比較好的發展。

------------------------------------------------分割線--------------------------------------------------

雖然作為一枚標準的工科男,但本人保證寄幾逗比有趣且有料,從事智能硬體產品開發,歡迎各種智能硬體老鐵們來嘮嗑。都看到這裡了,點個贊再走唄。


作為智能硬體行業的從業者,從從業經驗及個人看法來回答,先說下結論結論:

智能音箱不會成為物聯網中的超級產品。

------------------------------------------------開始叨逼的分割線------------------------------------------------

2014 年 11 月 6 日,亞馬遜在官網低調地宣布了一款名為 Amazon Echo 的家庭智能音箱。2016 年 3 月,在 Echo 音箱的基礎上,亞馬遜推出了 Tap 和 Dot 兩款內置 Alexa 的硬體,Tap更像是 Echo 的廉價版, Dot 則是將其他揚聲器智能化的產品。Echo售價180美元,Echo Dot售價49美元,Echo tap售價129美元,Echo Show售價249美元。

2015 年,Amazon Echo 一舉佔據整個音箱市場銷量的 25%,比 2014 年增加了 1200%。

亞馬遜公布2016年第四季度財報,宣布搭載語音助手Alexa的設備成為假日季最熱銷的產品,銷量同比翻了九倍。根據CIRP、RBC Capital Market等公司的估計,自2014年發售以來,Echo及另外兩種產品累計銷售量接近一千萬台,銷售額達到八至十億美元——儘管這對於亞馬遜的體量來說不算什麼,然放眼語音AI這個新興市場來說,還真沒有人比得上。

2016年5月19日,在年度I/O開發者大會上,谷歌發布了配有內置揚聲器的語音激活設備Google Home 。2016年10月5日,推出能通過語音助理「聲控」的Google Home。市場定價129美元。

蘋果公司在2017年6月6日召開的蘋果全球開發者大會(WWDC)上宣布推出智能音箱HomePod,同現有的Echo和Home一起形成了智能音箱領域三足鼎立的局面。HomePod將於2017年12月在美國、英國和澳大利亞上市。市場定價349美元。

來自eMarket的數據顯示,在2017年一季度美國語音助手市場中,Amazon Echo的市場份額達到70.6%,Google Home則佔到23.8%,而其他廠商(包括蘋果、Lenovo、LG、Harmon Kardon和Mattel)分食剩下的市場份額,為5.6%。

2017年7月5日,阿里巴巴人工智慧實驗室今日正式發布了旗下首款智能語音終端設備——天貓精靈X1,其內置AliGenie中文人機交流系統,能夠理解中文普通話語音指令,實現音樂播放,智能家居控制等功能。

目前智能音箱越來越火,2017年將會是智能音箱爆發的元年。

▲智能音箱百度指數在2017年發生急劇變化。

國際三大巨頭都開始做智能音箱了,國內的京東和阿里也開始做了,各路科技大佬也紛紛表示看好智能音箱這個市場,更別說全球大大小小的智能硬體公司、音樂公司也在參與智能音箱。

於是給大眾造成了一種錯覺:智能音箱要飛了,即將爆發出幾千億的大市場。

與其說是智能音箱火爆了,個人覺得,更多的不如說是語音AI火爆了。

智能音箱,或者是智能語音中樞,未來將會有更多的具有廣域收聲能力的硬體產品,都會有智能助手加身,通過語音語意的識別,來實現不同的功能,Echo也不例外。

智能音箱,只會加快語音AI的發展。

1、智能音箱不會成為物聯網中的超級產品。

看看對超級產品有個定義,最高票米唐科技的@Sugr宋少鵬 ,按照他的意思是像蘋果那樣的產品,就是上古神器產品,基本上就是前無古人、後無來者,大眾對它來說是可遇不可求。

嘿嘿,這周六正好去聽了他的演講,宋總,好有緣分呢。

我個人理解,超級產品,就是說它會是很多東西一個入口,能帶動一個產業、一個方向。

從這個方面說的話,假如真是各個行業更加細分地發展的話,比如電子產品,智能音箱並不會是一個超級產品。因為從個人就是這麼看,音箱就是它本身就是一個最基本的元素:聲音,傳遞音樂或者是傳遞語義。但是傳遞音樂在某些特定的場合,有的人會喜歡,有的人認為它是噪音,而且聲音涉及到使用距離問題,這些都是無法避免的一個問題。

所以從我的理解來說,隨著行業的發展,它應該不會是一個超級產品,它更多的是一個伴侶,就這麼一個角色,它可以跟很多硬體搭配在一起。

從我的角度看,超級產品更多的像手錶、手環這種穿戴,就像微軟電影裡面,一個手錶戴在手上就是隱形的,因為到那時候你的電池、你的網路、你的交互都不是問題。

到那時,音箱能幹的,它都能幹。除聲音之外,因為聲音可能你喜歡、我不喜歡,公共場合里不可能跟音箱說一些私密的事情,但是手環、手錶就可以,它不會給你帶來一個變動的東西,有的人喜歡,有的人不喜歡,所以我是這麼理解的,我不認為智能音箱它是一個超級產品,但是它會是一個比較好的伴侶,也會是一個很多智能產品的連接器。

2、目前智能音箱遇到的最大的阻礙或者問題,主要是在哪些方面?

  • 網路WiFi的穩定性:因為智能音箱目前打的是音樂這個東西,點歌、推送,如果你的網路不好的話,你給它發個指令,它半天不來,或者說網路時好時壞,特別是播放在線歌曲可能卡頓或者造成音質不好,或者說你想聽個無損的,它給你來個標準音質的,這個聲音層次就降低了。所以說WiFi的穩定性、網路是目前首要解決的一個問題,但這也是目前的一個通病。
  • 優質內容:更深的就是那個音樂內容這一塊,優質內容是最終播放和吸引用戶反覆多次使用的重點。優質內容的獲取,目前還不統一。

以國內為例,目前國內有三大音樂陣營體系:阿里、海洋(酷我、酷狗)、騰訊。

做智能音箱的廠家,就需要找這三大體系之一來合作獲取內容,目前還處於不收費站隊選擇陣營階段。加入阿里/海洋/騰訊的智能硬體體系,加入他們的智能硬體之後,他們的這些資源都免費提供給你。目前你只能選擇一家。

如果不把這三家兼容起來,聽這首歌可能要選擇一個平台,聽另外一首歌可能沒有版權,所以音樂層面可能需要打通,還有就是可能需要付費及版權。現在三大音樂體系是還沒有打通。當然未來也有可能是這麼一種情況,推出一個東西,三家進行有音樂資源共享,所以這是當前可能要面臨的一個問題。

  • 交互:遠場交互和近場交互問題,個人認為目前市面上的交互都還是比較初級的階段。做得比較牛逼的就是Echo,它已經實現了支付,我在美國的同事已經測試過,可以通過它手機就不用帶了,支付密碼可以通過聲波支付進行購物。

3、未來的智能音箱/超級產品會發么樣?它應該朝什麼樣的方向發展?

從短期來看,它應該是能完成最基本的音樂、聲音的傳遞;另一方面就是說對一些科技、愛玩的人士,隨著技術AI比較成熟,它會做到類似於機器人的這種效果。短期的話還是在智能音箱的功能上繼續加強。

從長遠來說,個人覺得智能音箱會被機器人產品替代,機器人就會把智能音箱的功能全部融合進去。

所以,未來物聯網中的超級產品將會是智能機器人,而不是智能音箱。

如果是傳統音箱,就是有這麼一部分人,比如說追求極簡的人,不需要你搞這些交互什麼東西,因為本來就是喜歡純粹聽音樂。當音箱真正達到一個智能化程度之後,你打個噴嚏,它認為你這個行為是埋怨或者其他無法解讀的信息,但其實這只是一個正常的反應,這個時候反而適得其反了。所以說,這種觀點認為你是音箱你就好好給我放音樂,精神層面我來享受這個產品就完了。

智能音箱就是WiFi音箱演化來的。目前走純音箱的路線還是很窄的。WiFi音箱,誰都能做,阿里系最便宜的99,但是做完之後能不能在市場上火起來,這是個問題。

智能音箱相比與藍牙/WIFI音箱,區別在於兩方面:一個就是雲端及網路的暢通;一個是交互方式,目前就是說語音,語音裡面有兩種,近場和遠場。

目前國內的音箱,包括叮咚,在一定距離之內,我要點語音那個按鈕,音樂停止我再去說話,這是近場,就是我必須要去觸發它。遠場就是類似於Echo,其實後面做的就是要走遠場,比如360度的環繞,這個音箱在這個方向說也可以,在背後說也可以,而且它正在播放音樂時候我說也是可以的。

智能音箱,後期它的發展應該是更加專業化,再把網路互通做好的基礎上,繼續深化和優化交互,可能就是更多偏向於遠場交互,後面一個是發展的重點方向。然後第三個就是真正的AI,你有一個好的交互,加上一個好的網路,這時才會談更多的使用場景,這時候才會有比較好的發展。

------------------------------------------------分割線--------------------------------------------------

雖然作為一枚標準的工科男,但本人保證寄幾逗比有趣且有料,從事智能硬體產品開發,歡迎各種智能硬體老鐵們來嘮嗑。都看到這裡了,點個贊再走唄。


與其稱 Ehco 為智能音箱,不如稱它是語音助手, Ehco 想成為的是鐵人的 Jarvis.

最近國外科技圈有很多關於「語音交互」的探討

Chat bots, conversation and AI as an interface a€」 Benedict Evans

medium.com 的頁面(the hidden homescreen, 最近 Medium 都被牆了)

討論的都是一個問題,即一種新平台產生的可能。

語音交互無疑是一種最好的方式,而且現在的環境正逐漸成熟。

- 語音識別技術相比微軟在 PC 機上的語音助手時代已經有了巨大的提升,而且還在不斷提升中。

- 網路速度越來越快,極大的提高響應時間。畢竟一個正常的對話,是需要實時反饋的。

- 各種像水電煤一樣健全的基礎服務,比如外賣 O2O,比如叫車,比如電商,比如智能家居(我把智能家居也當做網路服務的一種,而且智能家居本應是一種網路服務)比如流媒體音樂服務,這在 5 年以前都難以想像。

- AI 以及搜索技術的發展。

- 這一代人的信息化程度越來越高,這點大陸網民可能還比較欠缺,但國外的用戶信息化程度已經相當高了(從 IFTTT 的使用程度上可以看出一些端倪。)

- 語音交互方式。這是一種比點擊、滑動更自然更直覺的交互方式,畢竟人類文明的產生就是基於語言與交流。Voice really is a natural and human way to interact with the world around you.

帶來的好處就不用說了,解放你的手與眼,無論你是在開車還是在廚房做飯(我覺得車聯網的最終交互方式就應該是語音,而不是屏幕,不是手機)。

雖然好處極多,但現在我們還是不要自欺欺人的好,還有非常多的工作要做。

- 在一個空間內隨時隨地都能響應,而不是靠近某個設備對著說話。據我體驗過 Ehco 的朋友說,Ehco 是可以實現遠場交互的,國內的幾個類似產品還不行。

- 可以跟正常人一樣對話。而不是現在很多語音識別一樣,需要 一 - 字- 一 - 頓 - 的 - 說- 才 - 行

- 希望國內的互聯網服務的提供商都可以一種開放的心態來開放自家的基礎服務,而不是抱著一種「我自己要成為平台,為什麼要我向你提供服務?」看看 Slack 上可以集成的服務,在看看國內企業應用可以集成的服務。

至於為什麼現在的 Siri, Google Now 不行? 進行交互之前我還需要掏出手機,這對一個語音助手而言太反人類了啊。

非常期待 Echo 入華。


非常看好類 Echo 產品在智能家居領域的未來。(IoT 是個更大的概念了)

註:本人其實目前還沒體驗到 Echo,但體驗了追隨者京東和訊飛語音出的"叮咚智能音箱",已經感覺潛力巨大。而幾位朋友告知我實際 DingDong 和 Echo 還有很大差距,那麼我更覺得 Echo 在市場上會有更出色表現了~

先補一下相關英文報道鏈接,不知問題里提到的好奇心日報這篇明顯翻譯刪減而來的報道是不應該也附上參考鏈接:

http://www.bloomberg.com/features/2016-amazon-echo/

http://www.businessinsider.com/the-inside-story-of-how-amazon-created-echo-2016-4

再描述兩個場景先:

  1. 你疲憊的下班回家,打開門、打開門廳燈,走進客廳倒在鬆軟的沙發上,只想先好好休息一會,可是環視一下空調遙控器又不知道放哪去了... 這時你可以對著空氣發出一連串的命令 『Echo,打開空調調到 25 度』、『Echo,幫我煮一杯咖啡』、『Echo、打開電視』,哦對了,還有『Echo,關掉門廳的燈,打開客廳氛圍燈,把窗帘也拉上,窗戶打開透透氣...』

  2. 再一個更剛需,你一定碰到過的:冬天,洗刷完上床打開檯燈看會書,好不容易熱了被窩,正要睡,發現屋裡的某燈、某電器沒關...

  • 將成為智能家居的控制中心、核心交互入口。

智能音箱強調"音箱"屬性,只是階段性的戰略決策。仔細閱讀英文原版報道,可以看出貝索斯是清楚的:在生態尚不成熟的時候,需要通過音樂播放的功能,增加用戶與音箱互動的頻率,增大黏性,提早佔位做用戶教育,但 Echo 的野心並不止於此

道理很簡單,現在市場上可由 Echo 控制的智能設備還很少,用戶也不可能一下把家裡的家電、燈具都換了;這樣新的產品形態、用戶體驗需要逐漸適應,而聽歌是誰沒有的需求呢?實在是很好的選擇。當然造成的問題也是,很多人覺得 Echo 不過就是個能對話、點歌的音箱。

但我覺得 Amazon 是要先放一個聲場麥克風陣列在你家裡,軟體及服務層面雲端不斷升級,而你呢,聊著聊著,音樂聽著聽著,會逐漸發現越來越離不開它了...

這是那個「亞馬遜第一次在美國春晚「超級碗」上投放的廣告(主角也是 Echo)」:

2016超級碗 Amazon Echo - BaldwinBowl Party—在線播放—優酷網,視頻高清在線觀看 http://v.youku.com/v_show/id_XMTQ2NzY5Mzc4OA==.html?from=s1.8-1-1.2

你以為這一切還挺遙遠?

錯了

  • 在我國,這基本已經完全實現了。

京東和訊飛語音合作的叮咚智能音箱(叮咚智能音箱京東官網專賣店),已經可以語音控制符合「京東微聯」(京東微聯 - 商品搜索)標準的數百種智能家電,從吊燈到窗帘,從洗衣機到空調……

不得不承認,我們國人在某些方面執行速度確實可以,600 多元在淘寶就可以買到正品,據我實測響應速度、拾音距離都挺不錯: 通過叮咚智能音箱語音控制燈—在線播放—優酷網,視頻高清在線觀看 http://v.youku.com/v_show/id_XMTU2MTc1ODA0OA==.html

如果你即將新裝修一個房子,完全可以不多花什麼成本,讓你全家的家電都可以語音控制,多一個語音管家,基本告別「開關」「遙控器」了… 反正我是打算這麼幹了。

做了個小調查,問了一些朋友,答案基本都類似。

京東做的很低調,感覺是在錦衣夜行,一些智能硬體圈內的朋友,都沒有注意到這個產品。但據稱在此情況下,叮咚智能音箱已經成了WIFI音箱類的銷量第一,雖然是個很細分的品類,不過我相信其口碑傳播的效果。

  • 音質差,這都不是事~ 大招已出。

京東聯合二十多家傳統音箱品牌成立智能音箱聯盟,不乏 JBL、惠威、漫步者、創新、飛利浦等傳統大廠。說白了就是開放出來技術,招呼大家一起造智能音箱,拉低成本,拉高音質。

(在我看來這麼大的事,京東就是在微博默默發了一張圖片,都沒細說是啥事,實在很難不讓人懷疑是在刻意低調啊哈哈)

目前非京東自己 DingDong 系的,第一款合作產品 JBL GO Smart 已出(只聽你的話 JBL GO Smart智能音箱試玩評測)。

相信很快,我們將看到多種不同品牌的智能音箱,叮咚賣多少對京東都是小事兒了,因為..

  • 接下來接入的將是各種服務,包括電商...

不啰嗦了,舉幾個例子就好:

「叮咚叮咚,兩個小時後給我送來半斤雞蛋、兩個西紅柿」

「叮咚叮咚,幫我訂好今年要用的衛生紙」

「叮咚叮咚,半小時後我要出發去機場,幫我叫一輛車」

……

這一切,你不用去摸它,甚至不用去看它,它就在房間的某個角落,默默傾聽。

有人說智能家居的殺手級交互是手勢、語音或其它還未形成定論。我認為,安靜無陌生人的家庭場景,語音再合適不過了,Echo 和 叮咚 都已給出證明。

這樣的前景,當然會有很多人看到。例如杭州的豪華團隊、巨額融資,打造出的售價 5k+ 的酷炫家庭語音機器人 Rokid(首頁-rokid旗艦店),也已經可以預訂。

不過我認為在這個市場里,初期的關鍵是硬體快速佔領用戶,後期則將比拼的是服務與生態

不得不說,這一次,京東的速度讓我刮目相看,但比賽才剛剛開始。

有人說,這不就一沒屏幕的 Siri 么?

可能是的,但你要知道:

偉大的產品大往往不是由巨大的技術進步驅動的,而是技術綜合產品恰如其分的一小步,驅動用戶體驗一大步的飛躍。

iPhone 不用電阻屏而啟用電容屏,也是這樣看似一小步,但是從此改變了手機的定義。從 Siri 到 Alexa 目前看來也是這樣一小步…

----------------寫了這麼多忍不住插個硬廣了------------------

VR、AR、智能語音助手……科技行業的前沿,都將是血雨腥風,巨大的想像力也伴隨著極大的競爭壓力。如果你不想那麼累,做做藍海市場,用新的技術優化一下體量巨大、需求穩定、又無科技巨頭關注的傳統硬體市場,做一些切實有用不浮誇的需求,可以考慮聯繫我們聊聊(拓奇科技 | 產品蓄勢待發,與你砥礪前行)。數一數二的投資機構支持,且能幫我們搞定供應鏈及製造,還有紮實的技術團隊、這些就不多說了。

對了,做硬體需要安穩的耐心,我們在西安,買房買車都不是問題。大家一直吐槽西安互聯網及創業環境,最關鍵還是缺少一些標杆企業,我們有信心去挑起一桿旗,不限崗位,歡迎共濟。


這個問題的關鍵因素,個人覺得實際不是討論音箱,而是討論語音識別技術。

我認為語音識別技術的重要性,一直都被國人低估。

我大膽預測:誰能將語音識別技術做到極致,誰將可能成為BAT陣營中的另一新成員!

語音識別技術,必將造就一個劃時代的產品和巨無霸的企業!

值得思考的問題一:

iPhone劃時代地用手指觸控代替了按鍵控制,因為觸控比鍵控能接近於人類的本能。而動嘴比動手,更接近於人的本能!所以,下一代的革命性產品,應當是把人從「動手」中解放出來!

值得思考的問題二:

既然語音操控貌似比手指觸控更接近本能更便捷,為什麼它在中國沒有流行起來?!

我認為當下現象並不代表聲控永遠不能超越觸控,只是因為時機、技術、模式等的未成熟,導致了其體驗感不能被普遍接受。而這,也只是暫時現象。

舉個例:iPhone並不是世界上第一代觸控式智能手機,微軟等比蘋果在此方面更早嘗試,但均不很成功,很多廠家由此放棄了對觸控智能機的嘗試,這也讓諾基亞自以為江山永固。而此低迷的大勢下,喬布斯清醒而固執地認為觸控比鍵控更接近於人的本能,於是蘋果公司為屏幕觸控創造了一套近乎完美的操控系統,再加上APP Store帶來的驚艷,觸控瞬間秒殺鍵控,並成為智能手機的首要標準!所以,誰敢斷言聲控有一天不能超越觸控呢!誰又敢保證自己不會成為第二個諾基亞呢?

當下的語音識別差在哪裡,什麼又是下一代的語音識別技術?

首先,當下語音識別的準確度較差,特別是針對具有濃重地方口音的人,使用體驗較差,比如訊飛和微信,在長段語音輸入後,有的用戶往往還得費神逐個手動糾錯,但畢竟這是一個不算太差的開始。而技術的進化,必將推動這樣一天的到來:語音識別將是一個超級大腦,它除了能識別普通話和絕大多數方言外,它還是針對每一個用戶的人工智慧系統,通過雲計算和機器人學習,它能夠識別每個特定用戶的特質嗓音和說話習慣,甚至感冒變嗓後的語音也能精確識別。一句話,只要你的親人能聽懂的話,這個智能語音系統也能聽懂!

其次,使用場景受限制。語音控制和語音輸入在一個人的環境下還好使用,在公共場合使用就難免覺得嘈音干擾還泄漏隱私,這限制了語音控制的習慣養成。針對這種情況,未來的語音識別,將可能在極致減噪的同時能夠準確識別「細聲私語」,甚至識別近於無聲的「唇語」,從而讓語音識別慢慢放大到各種生活場景,最終成為主流。

為什麼語音識別將可能造就另一個BAT?

這個事件的發展,將可能分為下面幾個發展階段:

第一、最智慧的語音輸入法。和目前所有的語音輸入軟體不同,這種輸入法不是「通吃型」產品模式,而是某企業為每個用戶量身打造的屬於他/她的獨一無二的個人語音資料庫(記住,是針對「個人」),這個資料庫沉澱了每個特定用戶的特質嗓音和說話習慣,所以能極其精確地識別每個人的說話,同時還結合人工智慧,用戶剛講上半句,系統根據其說話習慣和行為習慣,已經知道了下半句,還知道接下來你想做什麼。

第二、跨平台的語音操控系統。這個用戶的個人語音資料庫,是存儲和運轉於雲端,通過個人賬戶能夠自動上傳和下載,換了手機也能下載後輕鬆使用,並在每個智能家居和車載設備上都能下載使用,不會再出現說拗口普通話而機器聽不懂,然後讓人再重新去適應一台新機器的情況。所以,真正厲害的是:就像電腦要預裝微軟,未來若哪個智能設備不標配預裝這套語音系統,都會顯得不夠智能!

第三、互聯網時代的超級入口。僅僅一個搜索的需求,能夠成就出一個谷歌和一個百度。而未來的語音操控和語音輸入,將可能超越百度等,成為億萬用戶連接互聯網世界和物聯網世界的最大入口。道理很簡單,你是上網多一點,還是用搜索多一點?而如果某個語音系統成了你進入網路世界最常用的一個入口呢?如果某企業建立了這一套超智慧和跨平台的個人語音識別系統(再說一次,是「個人」),基於個人數據歷史沉澱帶來的識別準確性和體驗流暢性,它將具有對手難以複製的競爭優勢,它將比QQ更具有粘性,並且比百度更加使用頻繁。說不定哪一天,人們聊QQ、上百度、去淘寶、用小米系設備,都是通過這同一個語音入口轉接進入。

第四、大數據時代的超級服務商。作為一個超級入口,這套語音系統不僅積累了用戶的語音習慣,它還將積累了用戶的生活習慣、即時情況,它將存儲每一個用戶在遨遊互聯網和使用物聯網中的海量數據。這種個人小數據上升為社會大數據,將使它對億萬用戶的了解,超越於用戶自己,從而「最接近於上帝」。這一聯結萬網萬物的大數據平台,就像駭客帝國中的「母體」,具有超級智慧,它構成了未來世界所有聯結關係的支柱性建築。

某一天,人類歷史終將輪迴,

正如先有語言後有文字,嘴才是傳遞信息最便捷的方式,

動嘴終將代替動手,成為互聯網世界的主要溝通方式。

聽細語、看唇語,讀心語……

誰說語音識別,只是識別語音?!


這裡聚集了可能的顛覆者、野心家和追風者。這裡既有審慎明智,也有常見的騷動不安和狂熱不休。AI財經社訪問了大量的入局者,試圖通過一個截面的反光,映照出智能家居入口之爭中那些反覆上演的經驗教訓。

沉寂到瘋狂

「深圳市南山區一公里內有112家智能音箱方案提供商。」喜馬拉雅副總裁、硬體事業部總經理李海波在做小雅音箱的400多天里,多次往返深圳,親眼目睹了智能音箱這波浪潮從沉寂到瘋狂。

深南大道往騰訊大廈步行20分鐘,中間會經過30多幢大樓,每一幢都有數百家創業公司,他們的創業方向和每一次行業的風口密切相關,這一次的風向標是智能音箱。

李海波是個音響控,有過從一個文字工作者轉型硬體創業者的經歷,這塊領地的無數大坑他都踩過。2016年初,他的創業公司海趣科技與喜馬拉雅合併,關於聲音的新場景在喜馬拉雅內部開始討論,智能硬體項目小雅隨後立項。

那時國內的智能語音市場還相對沉寂。整個市場的火爆是2017年以後的事情。

「我們想探索手機之外新的使用喜馬拉雅FM的場景。」他說。亞馬遜Echo大賣的消息傳回國內,深圳市南山區的音箱創業者就越來越多了:有人從這家拿晶元,那家拿麥克風陣列,拼湊出一個音箱,再來找喜馬拉雅這樣的內容提供方接入內容。有時候李海波一天會見上四五家公司,體驗各種類型的音箱產品。

硬體巨頭聯想早在今年1月就在美國消費電子展CES上發布了智能音箱,包含海外和國內兩個版本。傳統的家電企業中也不乏入場玩家,海爾今年3月就發布了智慧家智能音箱AWE。

6月20日,小雅的產品發布。前後一個月里,智能語音助手及其終端產品層出不窮。但這只是序幕。

一個業內玩家稱,在眾多產品中,大部分使用體驗並不算好,多數基本聽不懂人在說什麼,一些智能音箱能開風扇,能關空調,但讓它播點內容就失靈了,結果完全準確的基本沒有。這正是希望的最高期,泡沫最大化,整個行業陷入膠著。

智能音箱何以突然火爆?這個問題,從巨頭到硬體企業再到內容平台,進入市場的邏輯並不一樣。不少人對音箱的熱情來自亞馬遜Echo的成績。

亞馬遜Echo發佈於2014年11月6日,相比於此後的市場號召力,它的誕生非常低調,在亞馬遜內部的優先順序也很低,但最終它成為了亞馬遜史上最受歡迎的硬體產品。在觀察者口中,這意味著一個基於語音場景的新的應用生態正在形成。

「語言是人與人之間最主要的溝通方式,也應該是人與另外一種智能進行交流的主要方式。」阿里巴巴人工智慧實驗室負責人陳麗娟在天貓精靈X1發布會上解釋了涉足智能語音的原因。

不少創業者都把語音交互及其帶來的變革視作下一次科技紅利的起點,但對增長和被顛覆的焦慮則是市場行動的另一原因。

「對於喜馬拉雅這樣的音頻內容平台,如果未來大家不用手機了,我們的依託點在哪裡?」喜馬拉雅團隊內部有一個基於未來的危機,他們力圖能夠在手機外,再造一個喜馬拉雅生態:做智能硬體的邏輯也基於此,對下一波趨勢的判斷是他們進入智能音箱領域的理由。

有人看中的是AI賽道。Rokid CEO、前阿里巴巴M實驗室負責人祝銘明2014年7月離開阿里巴巴。離開時,他對上司講了原因:「接下來的兩三年人工智慧會突飛猛進,提前起跑才能跟別人同台演出。」

Rokid成立當天,他對擠在會議室里的同事說:「我們必須打造最好的全棧團隊,因為AI領域的對手會在3年後出現,他們將是Google和Apple。」

2016年4月,他所在的Rokid開始小批量生產搭載智能語音助手的終端。Rokid是國內較早涉足這一領域的公司。智能終端所搭載的語音平台可能是物聯網時代的服務分發角色,它或許會顛覆基於硬體和屏幕的交互模式。

在祝銘明看好的市場上,亞馬遜的Echo最先嶄露頭角,谷歌和蘋果也如期而至。而阿里攜一般團隊難以匹敵的強大內容、渠道資源和技術積累業已入局。

阿里發布天貓精靈X1及AliGenie系統當天,祝銘明收到了近20個人的詢問,大家都想知道他怎麼看待競爭和應對。Rokid方面對AI財經社的回應是:最大的互聯網公司進入這個領域,是對方向的認可,也會教育消費者,未來Rokid會專心打磨產品,在技術和產品上都有合作的可能。

「祝老東家產品大賣,也期待老同事們的精彩演出。」他說。

如同此前的每一場入口之爭,這裡聚集了可能的顛覆者、野心家和追風者。所有人都在用自己的語詞策略吸引受眾。

上一場戰爭

「戰爭已經開始了。」去年9月,極路由董事長王楚雲看到亞馬遜的智能音箱Echo入門新品降到50美元以下時,一個念頭在他腦中掠過。

上一場戰爭是圍繞路由器開始的。那時,路由器才被認為是未來之王,而王楚雲是站立在智能家居入口之爭前沿的一批人:他經歷過智能路由器的激烈纏鬥,風口這個詞帶來的誘惑和它所招致的惡戰他也深有體會。「所有的戰爭都是相似的。」王楚雲對AI財經社總結說。

2012年,因為在路由器上嘗試刷機,王楚雲將辦公室網路從1800元一個月1M做到600元10M的水平,成功解決辦公室的帶寬問題,這讓他看到了路由器市場的痛點。而路由器的角色十分特別,它處於從互聯網到家庭區域網的節點,同時,市場上TP-Link一家獨大的狀態,顛覆它就足以改寫格局。幾個因素的疊加,讓王楚雲進入路由器市場。

如果將原來的路由器比作諾基亞板磚機的話,那麼「智能路由器」就是iPhone。除了提供基礎的網路連接功能外,還可以提供各種定製化乃至平台化的需求。億級市場和基於這個市場的生態,引發了主流互聯網公司對智能手機之後下一個入口的猜測與追逐。在資本編織的故事中,它被定義為「家庭信息中心」。

谷歌推出了一款語音助手設備Google Home

「@雷軍咱們一起發嗎?@周鴻禕還有新的嗎?@王楚雲有壓力嗎?」2013年11月19日上午,時任果殼副總裁的黃冬發過這樣一條微博。小米、360、極路由、果殼,一條略帶火藥味的微博囊括了幾家公司,這從某個側面能反映當時那場入口之爭的激烈。

雷軍當時給小米路由器下過定義:「第一是最好的路由器,第二是家庭數據中心,第三是智能家庭中心,第四是開放平台。」這足以體現它在小米戰略中的重要性。

此外,360、騰訊、百度、盛大、果殼電子、迅雷、優酷等公司都推出了智能路由器,老牌玩家華為也進入了這一市場,創業公司更是難以計數。

前迅雷高級副總裁段暉曾解釋過迅雷入局的邏輯:一個家庭擁有多款電子設備需要連接路由器上網,網路傳輸的性能一定是要求極高的。智能路由器最基本的特徵是高性能,可以同時承載多個設備的上網需求,並且做到網路流暢。

Kisslink吻路由也是那一波智能硬體創業的新興品牌,產品主打免輸密碼和安全穩定,當時的計劃是先做好路由器,再發展智能化。

「徐老師正和一個6人團隊聊無線路由器,不滿意。」創始人、董事長張兆龍曾回憶過拿到真格投資的情景,「我跟他聊了兩三分鐘,他不看產品demo就叫律師來簽」。

張兆龍告訴AI財經社,越來越多的設備入網,帶寬現狀和用戶對帶寬的需求之間,矛盾是永遠存在的。從這個角度看,更穩定和安全的路由器市場也是永遠存在的。

價格因素是極路由團隊想到的卡位方式,這也是戰爭中玩家PK的重要武器。一開始就把價格拉低,原本賣兩百多元的產品,極路由直接定價為99元促銷,提高用戶佔有率,抓住潛在用戶。「我們自己把價格拉下來,直接讓對手死在路上。」王楚雲表達了信心。

但隨著入場玩家越來越多,各家產品在功能、硬體配置和價格上咬得很緊,區別並沒有那麼明顯,對傳統玩家的顛覆似乎沒有發生。

硬體難以賺錢,智能硬體玩家開始探尋服務層面變現的可能性。基於路由器的操作系統和App成為了不少智能路由器廠商打開局面的辦法。但它也不可避免地遇到量的瓶頸。據《2016年上半年中國智能路由器市場監測報告》的數據,2016年上半年家用路由器整體出貨3195.2萬台,其中TP-Link系遙遙領先,份額超58.6%。智能路由器中佔比最高的360,份額也在10%以下。2016年上半年,智能路由器在家用路由器市場的比例是16.6%,這一數字在2015年和2014年份額分別為9.9%和2.0%。

「路由器的本職功能是聯網,它集合的功能越多,路由器本身的穩定性可能反而難以滿足。」一位接近TP-Link的人士對AI財經社表示。

破產和轉向

2015年上半年,智能硬體的熱潮突然冷了下來。王楚雲記得那種市場從熱轉冷的變化。

概念火爆了兩年,市場和消費者端卻遲遲沒有所獲。智能手環、手錶、可穿戴設備,一大批智能家居的產品銷量始終上不去。資本市場對智能硬體的熱情逐漸退卻。

大環境帶來的變化非常明顯。投資人期待看到用戶規模出現上一個量級的躍升,但這並不容易。一批公司死去了,極路由的融資也開始變得困難。

一位路由器行業的從業者告訴AI財經社:「智能路由器這個概念已經處於破產狀態。」這句話指向的是,路由器作為智能家居控制中心和下一代入口地位的丟失。

王楚雲承認智能路由器目前遇到的困境。由於路由器的連接特性,它被賦予了超越發展階段的期待。但他並不認同路由器已經失去了價值,它依然是智能家居中的重要一環,對於創業者而言堅持是現階段的關鍵詞。

小米一位不願具名的中層則表示,潮水褪去之後,從前跟風進入路由器市場的玩家都沒了蹤影,小米依然看好路由器市場。但對小米來說,這個市場的爆發可能還需要三五年。路由器的價值需要量的積累,最終它會在小米的智能家居體系中產生價值。

轉向非常明顯,一批玩家開始重新重視賣貨邏輯。極路由也從以補貼換量的思路中抽身。Kisslink的策略調整更為明顯,他們放棄了激烈競爭中走補貼路線的國內市場,轉向了海外市場。策略調整的契機在2016年京東的「6·18」大促。

Kisslink的VP包志嵩記得,大促中Kisslink以低於成本的價格銷售,但促銷結束價格回歸原位後,產品銷量馬上下跌,一天賣不超過10台。「國內這一塊,如果要賺錢,量就上不去。」包志嵩說,最終他們決定放棄國內,專攻海外,這反而讓團隊有了造血能力。包志嵩介紹,他們試圖在今年三季度實現盈利。

7月5日下午,阿里巴巴正式發布了首款智能語音終端設備「天貓精靈X1

巨頭谷歌的案例更有代表性。2015年7月,谷歌進入了智能路由器市場,在美國發布了Google Onhub。這款產品是圓柱形,長得非常像一個音箱。硬體部分由TP-Link負責,谷歌負責軟體和系統,定價199.99美元。

產品上市之初,谷歌也打出了「智能家庭控制中心」的概念,從當時的參數和配置來看,它可連接智能攝像頭、電燈、空調、熱水器等智能終端。按照當時輿論的判斷,這款產品已經為物聯網時代的到來做好了準備。

一位接近TP-Link的人士對AI財經社表示,開發之初谷歌對銷售的期待非常高,最初預計銷量達到100萬台,但最後算下來,一年銷量不到10萬台,投入產出並不匹配。

Google Onhub銷量不景氣,讓谷歌放棄了用路由器作為智能家庭入口的打算。2016年5月,Google Home亮相,這明顯跟隨了亞馬遜Echo策略,將音箱和智能語音助手視為了智能家庭的入口。

谷歌的硬體策略轉向,被業內人士認為是智能家居入口轉換的重要信號。

除了谷歌的轉向,極路由也打算積极參与智能語音領域的布局,比如幫助音箱類產品用更低的成本進入家庭。典型的場景是,不用每間房間放一個高成本的音箱,只用麥克風探針連接上路由器,通過路由器完成指令的本地分析運算處理。

Kisslink也在積極開發可與Echo對接適配的智能配件。在智能家居領域,一個普遍的共識是:設備聯網率不高,而AI技術距離真正改變生活還有一段時間。

大爆發遲遲不來,大廠商尚有機會去調整和等待市場成熟,像Kisslink這樣能調整方向實現造血的並不多,更多的小玩家最終的命運是在那一波大浪里銷聲匿跡。

在主流認知里,路由器的時代結束了,音箱的時代到來了。

被驗證的場景?

2017年1月的美國消費電子展CES上,作為一家互聯網公司,亞馬遜的存在感十足。人工智慧語音助手Alexa是它最大的秘密武器:在這次CES上,聯想推出了內載Alexa的音箱,LG的智能冰箱、Hub的家庭機器人、福特的汽車、三星的吸塵器、華為Mate 9智能手機以及通用的燈具都內載了Alexa。

根據Betaworks數據,2017年3月16日,Alexa技能種類最多的3類為新聞類、遊戲類和教育類,分別為2457種、2254種和1524種。

這一數據增長極快。去年1月,Alexa的技能總數只有130,去年11月時突破了5000,幾個月內,它突破了1萬,並且展示了極大的多樣性。

亞馬遜強大的第三方號召力讓智能語音助手儼然成了新的入口。由於語言的壁壘,在可以預計的一段時間內,國外巨頭智能語音類產品進入國內的可能性基本為零。複製亞馬遜的成功,無疑是不少國內玩家的心態。

但亞馬遜的成功並非一日之功,也不是一般玩家都能複製那樣簡單。

Kisslink的VP包志嵩對Echo崛起印象深刻,亞馬遜的首頁廣告是他最留意的細節。那個位置對其他公司的產品開價是18萬美元一天,而Echo的廣告常年出現在那裡。365天的強勢渠道宣傳,美國亞馬遜的用戶畫像又是對新科技產品興趣濃厚的人群。Echo如果誕生在一個創業公司,僅以美國亞馬遜首頁的宣傳為例,渠道宣傳費用就數以億計。

而在產品打造過程中,這款產品的誕生也並非一帆風順。

據Bloomberg報道,Echo誕生在Lab126團隊,1代表字母A,26代表字母Z。裡面涉及多個項目,包括Kindle和貝佐斯視為iPhone殺手的Fire Phone,它們的優先順序都排在Echo之前。亞馬遜CEO貝佐斯對Echo的期許在於創造新的消費習慣,幫助亞馬遜更好地賣東西,一開始產品的喚醒詞甚至就被定為Amazon。

根據工程師們最初的設想,Echo定價在50美元左右,成本在17美元。從2011年到2014年,團隊成員們一直認為他們會在6個月內搞定產品並推向市場。但產品發布時間一再後延,硬體成本也不斷攀升,最終售價達到了179美元。最難的點在於,讓Echo邊說邊聽,並縮短它的回復時間。

Echo的曲折在國內不少同類產品中也有體現。

上一場戰爭是圍繞路由器展開的。那時,智能路由器才被認為是未來之王。

2017年7月5日,天貓精靈X1發布會結束,阿里巴巴人工智慧實驗室負責人陳麗娟被問及天貓經理X1誕生歷程中最大的難點。「這是我見過鏈路最長的產品,每一步的結果都被乘數級放大。」陳麗娟說的其實是智能音箱這款產品的製造門檻。

天貓精靈X1發布時,阿里巴巴的人工智慧實驗室團隊也一併亮相。人員配備比一般的實驗室更為豐富,除了包含各類科學家和工程人員、演算法團隊,還包括產品設計、硬體製造生產的終端負責人員。

硬體、演算法、設計、第三方支持和內容豐富度,這都是智能音箱成為消費級產品要邁過的關卡。

「阿里為什麼選擇這個時候自己來做一款硬體?」有人問陳麗娟。

她的回復依然很直接:消費級產品要直接接收消費者的檢驗,長鏈路之下一般的硬體團隊不具備這個能力,阿里選擇由自己把這個鏈路跑通。

這個過程的繁瑣程度,可以由喜馬拉雅的小雅音箱窺其一斑。小雅經過了420天的打造,由獵戶星空、喜馬拉雅、洛可可、佳禾智能四家公司的近500人團隊共同完成。獵戶星空是獵豹旗下的機器人人工智慧公司,其中的數百位工程師主攻小雅的語音識別和演算法模型;喜馬拉雅自己有近百人的團隊負責NLP語義理解與音頻數據優化;洛可可負責外觀設計;佳禾智能則負責產能及成本控制。無論是人力還是財力,研發端都要不小的投入,而這已是最基礎的付出了。

李海波對AI財經社講到了一個細節。那是小雅音箱的一次外觀調整。音箱容積發生了不到0.2升的變化,音箱外部覆蓋的那層布材料則厚了一毫米。新版本測試時,所有人突然發現,原本調整好的語音語義識別率大跌,10句話中有9句話無法識別。

最終排查的問題和亞馬遜當時遇到的難題一樣。音箱本身的發聲和外部喚醒的聲音產生了衝突。40多天後,這個問題才被調試好。「要先對音箱發出的聲音做一個回聲消除和降噪,再採集5米之外的喚醒聲音。」李海波說,這裡面的複雜度把一般的團隊排除在競爭之外。

群鴉盛宴和列王之爭

王楚雲家裡有四五款智能音箱,其中不乏所謂的國內玩家仿效Echo之作。有一款產品他用了兩三天後就束之高閣。

最大的問題有兩個。一是指令只能以機器聽得懂的方式下達,換一個表述,機器就完全無法理解。目前的智能產品對自然語言的識別還遠未到能與人自由交流的地步。

另一點是家中設備的聯網率太低。要完成語音控制,要麼斥資換掉空調,要麼去買一款紅外線識別工具。而這些成本都通過一個起身按遙控器的動作就能解決。智能語音助手及其終端要想成為下一個入口,所有的家庭設備都得更新換代成具備聯網功能的新品,入網是一切的起點。

語音語義理解涉及演算法和機器學習,這需要收集語料庫。從這個意義上看,科大訊飛這樣的公司有不小的積累。它從前端不斷拿到用戶反饋數據,而像阿里、騰訊、百度這樣的巨頭在不少應用場景中也積累了用戶行為數據。比如,阿里的客服體系中曾經積累了不少的語料資源,神馬搜索和支付寶的語音搜索也能提供支持。

各類玩家進入市場的場景並不一樣,圍繞著音箱,不同公司未來商業變現的可能性也大不相同。

內容型平台喜馬拉雅被不少人認為與音箱產品有著天然的契合。喜馬拉雅自己的定位也很清楚,進入市場目的不在賣貨。

「我們不會站在任何一家的競爭對立面。」李海波對AI財經社說,雖然開發布會時小雅的二代三代產品就已經計劃得差不多了,但是喜馬拉雅進入市場時姿態非常低,就是做好一款內容產品在智能終端的用戶體驗,把小雅形成的一整套能力輸出給所有需要的合作夥伴。「我們的訴求很簡單,讓聲音走到每一個人需要的場景里去。」

小米探索實驗室也將在7月底推出智能音箱類產品。小米一位不願具名的中層告訴AI財經社,從前小米在智能家居領域的投資達90餘家,生態鏈上強大的第三方支持度將成為小米音箱在智能家居市場的重要優勢。

小米進入智能音箱市場,是否會影響它開放自己的產品接入其他語音助手平台呢?Rokid CEO在若琪·月石的媒體溝通會上也被問到了同樣的問題。這也是所有創業團隊在第三方支持上需要回答的質疑——如何讓更多人跟著你玩。

「一個偉大的公司一定是靠協作取勝,當然有些核心的東西不要觸碰。」就在發稿前,米家智能家居已全線向Rokid的智能音箱開放。祝銘明這麼回答,他習慣性地露出了略帶狡黠的笑容,相信成熟理性的市場會傾向於協作。

今年5月份,亞馬遜音箱產品全系降價,不少人視之為與谷歌展開競爭而採取的價格策略。而國內的音箱產品中巨頭紛紛入場,天貓精靈X1的價格僅為499元,阿里這樣的重量級玩家的低價策略和成熟的內容體系極大地提高了國內玩家進入的門檻。

「用戶體驗並不那麼好的時候,消費者沒有動力用高價去嘗鮮,購買一款半成品。」小米內部一位中層人士認為,價格因素很大程度會影響消費者的決策。

有人認為,下一代入口的戰爭將變成巨頭的遊戲。「如果有獨特的技術,小玩家最好的結局是被巨頭收購。」一位智能硬體創業者分析說,行業走向會在1年之內明朗,但大部分玩家撐不了1年。

激烈競爭中,具備強大的渠道才能把音箱賣出量來,這就把一部分玩家清出了戰場。而如果巨頭間的競爭加劇,類似百度在開發者大會上宣布全資收購KITT.AI,將智能設備的語音喚醒和自然語音處理等核心能力開放,這種免費策略對一些試圖走技術方案提供商路線的玩家很可能是滅頂之災。排他性的協議在更膠著的對抗中或許也會出現,這也是小玩家玩不起智能音箱的理由。

而一旦進入列王的戰爭階段,推出了硬體的阿里、京東和即將推出硬體的騰訊之間競爭最為直接,百度的DuerOS開放平台則與天貓精靈內載的AliGenie形成競爭。

值得一提的是,亞馬遜Echo的成功離不開強大的電商渠道能力和貝佐斯對支付購物場景的重視。在中國市場上,已經實現聲紋購物的天貓精靈X1對新的消費場景和消費習慣的驅動力可能更足。

另一方面,阿里與騰訊都坐擁海量內容庫,技術上阿里雲在大數據和演算法上的積累時日已久,騰訊的計算能力也不遑多讓,這場即將到來的戰爭還遠未到談格局之時,格局更遠未到明朗之時。

AI財經社(ID:Economic-Weekly) 文|任曉漁 編輯|金赫


音箱無法成為物聯網的超級產品!

個人認為通過語音交互來控制家電等設備會成為物聯網的趨勢;但音箱不會成為中心,在語音交互時,音箱有優點(網上列舉很多,不再贅述),但是缺點更多、更致命(而且無法解決)。

音箱的移動屬性不高,放置地點較為固定;這就意味著語音交互時,發出命令的人必須離音箱很近(目前最好的技術在無遮擋的情況下能做到5米內)。想像一個場景,音箱放在客廳,而你人在廚房做菜/卧室睡覺/浴室洗澡,進行語音交互是一件幾乎不可能的事情。受制於聲音傳播的物理屬性,解決方案有三種(音箱變成竊聽器、每隔一定距離就放置麥克風陣列、學會獅子吼),每一種要麼很難實現、要麼不經濟、要麼體驗太差。

因此,我認為找語音交互的早期,Echo類型的音箱可以起到教育消費者的作用。但未來物聯網真正的中心,我認為還是可穿戴設備和智能手機(iPhone 6s 可以直接語音喚醒並進行交互、Apple watch 亦如是)。它們有著音箱所具備的優點(有小音箱的屬性),同時因為在消費者身邊,接受語音不存在障礙。按照這個邏輯,我更看好像可穿戴設備。


凡是不能拿出門得瑟裝B的。。。很難在中國成為明星產品


金字招牌不太熟悉Echo等國外的智能音箱,但是對國內智能音箱有過一些調查,所以只能回答關於這個問題的國內部分。

金字招牌最近採訪了國內兩家智能音箱的生產商,一個是叮咚音箱的生產商靈隆科技CEO魏強,另一個是喜馬拉雅FM小雅音箱總裁兼硬體事業部總經理李海波,總結一下他們的想法,希望對題主有幫助。

中國很多智能音箱想做Echo的「中國門徒」,但是目前看來效果不是很好。其實音箱作為物聯網的入口有天然的語音交互習慣優勢,但是目前在國內希望實現入口的普及還有幾個問題 :1.智能家居物聯網不夠普及 2.智能家居語音技術不夠完善,購買體驗不好 3.智能音箱的用戶習慣還沒有培養起來

首先說第一個智能家居物聯網的普及問題,如果僅讓消費者買一個入口,但沒有配套使用的產品,自然是很不合理的。 京東、海爾、美帝、小米等企業扎堆進入智能家居這片「藍海」,為實現「萬物互聯」也推出了智能家居開放生態平台,去年智能家居企業融資總額更高達26.6億元,但中國智能家居滲透率卻不到5%。所以智能音箱應對智能物聯網的許多功能就不會被高頻使用,又變成了「不智能」的音箱。

其次是語音技術和購買體驗,拿叮咚音箱和Echo做個對比。靈隆科技從2015年成立到推出第一款智能音箱,僅花了不到一年的時間。而同樣的事,亞馬遜卻做了將近四年,從2011年收購語音識別技術創業公司Yap開始,直到2014年11月Echo才正式上線。

所以在看京東網購中叮咚音箱的購買評論里,有一些中差評提到了語音理解不準確、平台內容過少等問題。這些問題,要先從語音交互的環節入手。語音交互分為語音識別、語義理解、自然語言生成和語音合成四個環節,其中任何一個環節的偏差都有可能導致智能音箱用起來「沒那麼聰明」。叮咚音箱的製造者北京靈隆科技有限公司由京東和科大訊飛共同出資,後者佔有中文語音技術市場70%以上的份額。科大訊飛的識別準確率達到97%,而叮咚音箱也採用了8個麥克風矩陣,因此語音識別上較有保障,問題恰恰出在語義理解上。

語義理解是一個需要不斷調試和優化的過程,但是上面已經提到了,叮咚沒有足夠的優化時間。舉一個例子,靈隆科技團隊研發時把「開燈」當做了指揮智能家居的指令,上市後卻沒想到還有一首歌名叫「開燈」。所以當用戶發出「叮咚叮咚開燈」的指令,音箱暫時還不能做出智能的回應。

技術上的瑕疵肯定會影響用戶的購買體驗。所以說一些公司為了避免硬體和軟體的漏洞,就換了個方向去做音響,沒有做入口,而是做內容,相當於線上App的一個延伸,這個就是小雅音箱的路徑。

當然,隨著技術的發展,各家的側重一定會有不同。比如京東想把叮咚框進京東智能家居,7月5日上市的阿里巴巴智能音箱「天貓精靈X1」則把重點放在了語音購物上。有了天貓淘寶App上語音搜索功能的積累,「天貓精靈X1」可以完成從回溯購買記錄、挑選下單到支付的整個過程。但同樣又回到了技術和用戶體驗問題,目前在音箱上購買的商品只能限制在常購商品,或者是價格敏感度不高、品牌較為單一的商品,比如牙膏、礦泉水,但手機一類比較複雜的產品就不太適合語音購買,這就會顯得語音購買比較雞肋了。

第三個問題就是現在很多中國消費者還沒有和音箱語音的用戶習慣。小編的朋友買過一個智能音箱,但是還是選擇了用app操作,覺得和音響說話有點「傻」。這就涉及到這個智能音箱的市場有多大的問題了。不同的廠商有不同的預測。家庭機器人Rokid創始人祝明銘看來,國內音箱市場空間最多幾百萬台。相比起來,亞馬遜Echo智能音箱剛推出兩周,就接受了超過100萬份訂單,國內這個市場份額確實有點小。但是消費習慣肯定是慢慢培養的,當產品做得足夠好的時候,肯定會有人願意去嘗試和體驗。而且現在很多智能音箱背後的平台是不斷開放和成長的,所以不排除未來會變得越來越聰明,在智能家居布局裡也越來越重要。

提醒一點是,金字招牌在上面提到的智能音箱不包括幾百個跟風的小企業。深圳南山區一公里內就有112家做語音智能,但大多屬於「拼模組」,東買一個麥克風陣列,西湊一個喇叭。智能音箱要能同時理解「下一首」與「換一個」,同一個指令基本需要開發60多種自然語言,而自然語音技術(NLP)需要巨大數據量支撐,遠超出一個中小企業的能力。希望未來會看到更多的智能音箱廠家的合作,小編也會有興趣買一個回家玩一玩。


個人認為智能音箱短期內是很難成為物聯網中的超級產品,他的前提條件是語音交互的成熟。

1、目前主流大廠的語音識別的準確率都能做到90%以上,但是其應用場景仍然很局限,主要集中在家庭、汽車和忙碌中。也就是說人們主要在私密受限的範圍內使用語音,其中的原因既有社會規範的約束也包括語音本身的實用性問題。

2、語音交互是有天然缺陷的。比如說你想使用智能音箱購買一件襯衫,於是你向音箱發出指令:「叮咚叮咚,我要買一件襯衫」。很顯然音箱很難準確的給你一個答案,因為符合條件的商品可能有幾萬條。如果你想要進一步精確就要提供襯衫的顏色、尺碼、風格、時令、價格範圍、品牌等等。即使是這樣你還是難以下決定,符合條件的商品仍然很多。如果等音箱把一條條結果報給你,你恐怕沒有這個耐心,可能你會想如果音箱有一塊屏幕就好了。我想這就是echo加了一塊屏幕的原因。也就是說音箱在很多需要進行快速篩選、大量信息瀏覽、視覺介入的場景下是無力的。如果他需要加一塊屏,那麼他在產品形態上和手機的區別是什麼?還是說我們需要的其實是一個加了麥克風陣列(遠場語音識別)的手機,畢竟音箱能做的手機都能做到。他們顯著的區別就是,在音箱這個產品形態中語音作為入口出現。

3、語音輸入適合的場景是較為日常化的輸入,比如寫一段微博,聊天,搜索。如果用它來寫一篇文章你會發現他快不了多少。因為對於大部分人來說寫文章時更多的時間浪費在構思上。然而到目前為止的語音交互,更像是語音命令稍微的脫離正常的語言邏輯的命令,得到的回答就是「對不起,我沒聽明白」。所以我認為至少在相當的一段時間內,智能音箱的「智能」都是相當雞肋的,他與傳統的音箱沒有本質的區別。

4、智能音箱的絕大多數功能都是手機功能的子集和延伸他並沒有比手機更方便,更重要的是因為智能音箱不像手機那樣可以便攜,所以很多商業模式是無法承載的。智能音箱一般有兩個定位:一是個人助手,而是音樂播放器。因為不夠便攜並且缺乏感測器意味著無法搜集到更多的個人信息,無法隨時隨地的發揮助理的作用,因此個人助理的定位是很難承載的,而智能眼鏡手錶顯然是更好的選擇。而作為音樂播放器他的成本可能又更高而不具有競爭力。


在智能音箱領域外國的起步較早,對產品的完善程度較高。在2014年亞馬遜便推出而來Echo智能音箱,並在當時獲得了兩周內訂單就超過了一百萬的銷售成績,儘管初代的Echo僅僅是具備簡單語音命令的智能揚聲器。這也讓亞馬遜自己都沒想到會這麼熱銷。

而在用戶廣泛性與Alexa對話後,大多數人認為Echo比起硬體設備,更像是一個完整的系統,不僅可以上網購物,還可以完成用戶多項指令。而這也讓人們普遍認為Echo的模式是近些年互聯網行業最重大發明之一。而亞馬遜 Echo 的熱度持久不減,為其他智能公司提供了一條發展智能設備的新道路。谷歌等諸多廠商紛紛效仿了Echo,推出了幾乎一模一樣的產品。

其實在如今推行人工智慧、大數據的時代,語音交互的實際使用效果也越來越實用。而語音助理在垂直領域應用體驗更好。家庭、汽車等場景,用戶的需求相對固定,因此語音助理可針對用戶需求特性進行專門優化,進而更精準地理解用戶意圖,並完成相應任務。就是說根據現在的人工智慧技術程度,短期內一個只能完成特定任務的語音助理,相對於理想中無所不能的智能助手而言,將更加可行。路總是一步步走的。

家庭對大多數人來說是個極重要的地方。除了在卧室睡覺外,還有很多時間消磨在客廳,廚房等區域。因此這也是各大巨頭們一直想要搶佔的重要場景。而恰好智能音箱十分適合家庭場景。在家裡時人們很多時候不會拿著手機,比如在做飯,在做家務等等,這時候就給語音操控帶來了需求,所以許多智能電視機都將語音遙控作為標配。就好像暴風5月10日推出智能電視就主打AI的語音交互功能。

還有一個很重要的原因,既然要語音操作就必然要使用語音直接喚醒,而這個喚醒功能基於現在的技術程度,耗電量較高且會因此導致後台進程可能被自動關閉,目前手機的語音喚醒由於系統和機型適配的原因,在喚醒幾率和使用時必然要一直佔用麥克風導致無法使用其他的錄音工具,例如微信語音等等。而智能音箱從產品本身就很好的規避高耗電和無法喚醒問題,在先天上就優於手機的語音助手。規避了這兩點對智能音箱來說很重要,畢竟智能家居最根本的目的,就是要讓人們能夠儘可能隨心所欲地去控制自己的家居環境。

筆者覺得並不需要過多的去爭論,就目前的技術來說,肯定還無法完全的信任語音。增加了觸摸屏對用戶來說肯定體驗會更加好。在技術未突破式增長的現狀下,觸屏肯定是再次進行優化而不是會去減去觸屏功能,而不是什麼所謂的變性之危。並且值得注意的是,許多廠商在此之前也已經推出了智能家居系統,例如蘋果HomeKit系統,在此基礎上,智能音箱的控制權對於廠商來說就十分重要了。因此,各大擁有相應技術的巨頭公司在爭奪智能家居市場份額時,希望可以將智能語音打造為人工智慧助手的遠景也是情有可原了。

那是否說如今的語音助手終究會被時代淘汰呢,其實隨著這幾年的技術迭代更新和大數據的積累,如今語音識別和後端處理技術相比前幾年有了長足的進步。可以說語音助手在理解人類語言和意圖上表現越來越好,它可以幫你在手機上設置日曆提醒、可以打開某個App、語音撥打號碼等,再也不是那個單純被調戲的語音玩具了。相比智能音箱來說,靈犀語音助手,siri等語音助手軟體更為的便捷。從用戶需求角度來看,相比智能音箱手機更為剛需,假如以後像靈犀語音助手的智能助理從手機載體中解放出來,轉化為類似鋼鐵俠中賈維斯的存在。


作者:viktor wang

鏈接:http://zhuanlan.zhihu.com/p/21561696

來源:知乎

著作權歸作者所有,轉載請聯繫作者獲得授權。

由於Amazon Echo的出眾表現,帶語音識別功能的無線音響已經越來越火了。國內的JD也已經發布DingDong。語音識別從上次Siri之後,又在無線音響品類中青春煥發。

衡量支持語言識別的無線音響是否能在市場上具有長期競爭力需要回答兩個問題:

1. 產品的體驗是否對用戶有吸引力

2. 產品的scaling路徑是否高效

產品的體驗

支持語音識別的智能音響的使用場景主要分為兩大類:第一類主要是語音操控互聯網服務,包括流媒體音樂垂直服務,以及橫向服務如天氣播報,點餐,叫車等。第二類主要是智能家居操控,如對開關,燈光等得控制。

其實,這兩大類的應用目前通過手機都可以支持,可是在便捷性上,語音操控更自然,更迅捷,更符合大眾溝通本能。當年iPhone剛支持Siri時,大家對語音識別及操控期待暴增,PC廠家也紛紛集成Nuance和科大訊飛的服務,可是實際應用並不普遍。反而是這次Echo的上市,給語音識別提供了最好的應用場景。在相對固定的家庭環境中,手機的便攜減弱,集成麥克風和揚聲器的智能音響的優越性就凸顯了。

當然,在內容的豐富性上, 語音識別的音響還是和手機有較大差距。 所以目前的無線音響都是語音識別搭配手機應用,二者相得益彰。

作為電商巨蟒,Amazon和JD的戰略都是把集成了語音識別的音響作為流量入口,橫向集成海量互聯網服務,包括自己的核心服務。Echo已經集成了Pandora, Spotify, Amazon Music, iHeartRadio和TuneIn等音樂和在線電台服務。還集成了Uber, Yelp生活服務以及新聞類的TC,HUFF POST等服務。對於購物,Echo支持語音添加物品至購物車,然後在手機或網頁Amazon應用中結算。

在對智能家居的操控上,Echo支持了Wemo,三星的SmartThings, hue, INSTEON, WINK, nest以及ecobee。 WeMo-enabled smart switches以及 Philips Hue lights都可以通過Echo語音控制。

JD上市的叮咚音響提供的服務單薄的多。目前售賣的產品僅集成了咪咕,百度和喜馬拉雅。音樂方面內容的多樣性和優質性也不是很出眾。語音購物,路況查詢等還在開發中。一個問題是,提供的服務是否有足夠的用戶粘性。給用戶提供的體驗是否豐富。

產品的scaling路徑是否高效

提供語音交互體驗的音響系統通常包括四個部分:

1. 內置麥克風矩陣和揚聲器的終端:Echo, Dot,DingDong,以及其設備。作為語音雙向交互的HUB,最佳的硬體實體是麥克風和音響成對使用的。最佳的體驗是在較遠距離,存在其他聲音干擾時依然能接受語音指令並提供反饋(TV打開時,有人說話時)。這就要求有一系列的技術:包括 far field control, beam focusing, voice recognition, noise cancellation。 這也就是為什麼在家居環境裡面,手機並不是一個最佳的選擇。

2. 語音處理的平台(voice capture, speech to text, natural language understanding, execution of user intent, formulation of response to user, text to speech, response playback)。語音處理的平台還需要具有多種語言,和對多種應用的擴展性

3. 應用的合作夥伴。音樂服務,電商服務等等。作為無線音響,默認的功能當然是支持流媒體音樂。

4. 和主流智能家居平台的對接。

Android手機生態系統如同一幅扁擔挑子,多樣硬體終端和豐富的應用如同扁擔兩頭的籮筐,Android則是中間支撐的的挑子。映射到語音識別的智能音響系統中,支持語音識別的終端,智能家居的燈,門以及聯網服務就如扁擔挑子兩頭的籮筐,而語音識別平台和智能家居標準就如中間的挑子。極致的智能音響應當是大籮筐搭配中間堅韌的挑子。

這是一個龐大的生態系統,由於各自優勢的不同,Amazon和JD的切入點和擴展路徑還是不相同的。

Amazon的切入路徑是先打造一副好挑子。從Nuance等公司挖來了語音識別專家,經過3年的研發,開發出了業界領先的Alexa平台。關鍵性能如語音反饋時長達到1.5秒,領先業界的2秒標準。同時並行開發智能硬體,先開發Echo,然後推出內置電池的Echo Tab和入門版的Dot。 在這個軟硬體平台上,接入眾多的第三方服務和智能家居硬體。服務的多樣性驚人。在智能家居上,也支持了幾家主流的廠家。

基於這幅好挑子,Amazon迅速擴展。通過 Alexa Voice Service給第三方提供了APIs。第三方可以調用這些APIs快速部署語音服務。目前Invoxia已經開放了支持Alexa的Triby音響。這是一種類Android的套路。Echo系列就如Nexus手機一樣,打造了支持語音識別無線音響的樣板工程,同時有把Alexa如Android般開放授權,支持別的硬體。

JD的切入路徑是攜手科大訊飛成立靈隆科技公司,採用科大訊飛的語音處理平台。同時積極布局音響終端。首先自己做了一款DingDong音箱,有點類似於Google Nexus的玩法,打造了一個樣板項目,然後開始做基於硬體模組的擴展。沿襲傳統手機,平板的玩法,做好可嵌入的模組,尋找音響廠家合作。音響廠家直接硬體升級就可以接入這個生態系統。例如JBL發布的Go Smart支持語音識別。從scaling的有效性來說,選擇傳統音響廠家作為合作夥伴,受限於這些廠家在語音識別上的技術積累,例如目標音檢測,遠距離聲音識別等。選擇這些合作夥伴,在這個時間點做scaling是否合適。

做產品就如左宗棠所說「擇高處立,就平處坐,向寬處行」。項目立意要「擇高處立」。量產的產品要「就平處坐」,考慮上市時間,成本定價和渠道。生態系統的擴展要「向寬處行」。常見的問題是高處未立好,平處未坐穩,就向寬處行了,這其中的節奏,至關重要。長期來看,幾大玩家都想布局隨處可見的終端,豐富的應用,以及高質的語音平台。再獲取這平台上海量的流量。相對而言,Amazon的立意甚高,自主研發扁擔挑子Alexa,和Echo音響。上市的產品用戶體驗很好。而擴展時,選擇了開放Alexa的介面,讓第三方軟體集成。這是一套柔而快的打法。 JD的做法是趕著碎步上場,發布自己的終端。支持的服務有限,逐步迭代增加。同時通過硬體模組擴展生態鏈。這樣的問題是用戶體驗容易陷入良莠不齊。生態系統容易陷入低效。

其實業界另一位大腕也有一副好挑子。Google是看到了流媒體的興起,在音頻和視頻的流媒體上發力。Google Cast Audio基本上是和Echo同步上市的。Cast可以看做是Google版的AirPlay,支持了Spotify,Netflix等流行的應用。Google Now的語音平台也早已部署。只是這回棋差一招。忽視了語音識別的在音響上的重要性。放著自家的Google Now不用,沒有將二者結合起來,被Echo獨佔鰲頭。傳聞Google已經開始代號Chirp的項目,打造類Echo的音響。此外Google Now也已經開放了APIs,供第三方調用。 在未來的一到兩年中,我們可以看到的是這幾大玩家對無線智能音響用戶體驗的提升。會有更多的好產品發布。


由於Amazon Echo的出眾表現,帶語音識別功能的無線音響已經越來越火了。國內的JD也已經發布DingDong。語音識別從上次Siri之後,又在無線音響品類中青春煥發。衡量支持語言識別的無線音響是否能在市場上具有長期競爭力需要回答兩個問題:1. 產品的體驗是否對…

顯示全部


我就不看好任何語音控制的設備。

整天忙的要死,就算有空閑我也只希望靜靜的在網路上看我想看的。

閱讀的時候背景聲音很影響閱讀體驗。

有些人天生讀書一定要讀出聲才能進腦子。

有些人一點雜音就能心煩意亂,看了等於沒看。

我就屬於後者。上學時候背課文,一個教室的人嗡嗡嗡的背書我寧可集中注意力做理科卷子之類的。因為這種情況下沒多久就會進入全班亂鬨哄聊天模式,根本沒人真的看書,跟菜市場根本沒分別。

下課或者放學安靜時候再仔細看看課文,記下來。

早讀背課文,單詞的時候簡直就是災難!

全程不出聲的才能進入理解內容的境界。

上班以後,每天上下游工序,開會,指導各種交流,每個月電話費都得超支,直到公司開始報銷才感覺好了一些。

再加上設備噪音,公路噪音,只有每天下班進了門才能享受片刻寧靜。

總之,除了必要的時候,我一個字都不想說!

特別是跟一個設備說話這種蠢哭的行為!

這個世界不止有S,更多的是M好吧?

沒那麼多屎大顆那種控制狂魔跟連個人樣都沒有的機器人玩兒五十度灰!

賈維斯的確很酷,但是我想用手勢,動作,節拍控制都可以,就是不想跟它說話!它不是個小女孩的洋娃娃!

總結,又是一個

shut up and take my money!

結果拆開包裝就等著吃灰的玩意。

去特么的語音識別傻逼玩意!


不邀自來。

智能音箱市場今已成為科技巨頭、傳統行業廠商、創業公司博弈的競技場。智能音箱在如火如荼的「百箱大戰」中,獲得井噴式發展,玲琅滿目的產品不斷更新迭代。

智能音箱顛覆了傳統家居音箱概念,不再局限於一個揚聲器,轉而成為家庭消費者語音上網的工具。其人性化的操控和功能,主要集中在語音人機交互與內容服務,如基於智能系統的音樂點播、有聲讀物、電商網購等,甚至試圖成為智能家居的中控中心,連接家居產品,比如打開窗帘、設置冰箱溫度、提前讓熱水器升溫等。

拉開智能音箱序幕的Echo,它背後的Alexa及前輩Siri,實際上都屬於智能語音技術。智能音箱作為語音人機交互技術的載體,核心是要讓音箱在語音對話環節擁有近似於人的能力。對智能音箱的考量,除了作為音箱的音質效果外,更離不開包括語音喚醒、語音識別/語義理解能力的語音交互精準度,以及受喚醒響應速率、網路和雲數據處理等參數影響的語音交互響應速度。與其說智能音箱將成為物聯網中的「超級產品」,不如說智能語音技術將成為智能科技發展的趨勢。


更新:大佬說了,未來帶屏幕的可能是主流——所以,為什麼客廳電視、平板電腦不能集成智能音箱功能??

HomePod 將配備 Face ID 功能?未來的蘋果可能會出一款帶屏的智能音箱

----

很奇怪為什麼智能音箱突然被大佬們看中了。

蘋果、谷歌、亞馬遜、阿里……

雖然無法質疑大佬們的鑒別能力。但是真的看不出這個產品有成為什麼「超級產品」的潛力。

大佬們做這個產品的理論大概是:一個日常必備的硬體+智能助理功能=超級產品?

但是請問為什麼不能是路由器、待機的電視盒子/電視、待機的電腦?甚至是手機?

這些是每個家庭必備的。

但是音箱真的是每個家庭必備的嗎?而且是單音源的音箱?注意,這玩意稍有一點音質追求的人都不會拿他做電視機音箱,因為這玩意別說什麼7.1環繞聲了,連立體聲都不是。

還要另外多花500元。為什麼不能是我掏出手機、或者對著待機的智能電視說:siri/你好google,幫我打開燈,幫我放一首舒緩的音樂,幫我續播「行屍走肉」……

況且智能語音助手本身就是一個非常雞肋的功能,在手機上、智能電視上雞肋的語音助手,在智能音箱里也同樣雞肋。

用音箱買東西?且不說挑選物品看不到圖片,智能音箱也很難幫你做最優挑選(他的最優選不一定是你的最優選),你買東西會不經過任何挑選就下單嗎?除非你富得丟1000塊錢毫不在乎的程度。

所以我認為這玩意不會火。


最近比較關注智能音箱產品,自己手裡有叮咚一代,已經第一批內測體驗的聯想智能音箱。目前比較期待體驗的是小米的小愛同學。基於搜狗汪仔問答機器人的出色表現,以及搜狗輸入法語音輸入、地圖產品智能副駕、同傳的烏鎮展示以及iot部門糖貓產品基礎,更加期待搜狗能有一款驚艷的智能音箱產品。

下面是我對智能音箱以及智能家居的一些理解。

~~~~~~~~正文分割線~~~~~~~~

智能路由器,智能音箱,智能電視,誰才是智能家居入口

智能家居起始於物聯網的發展和智能硬體普及,隨著智能硬體產業鏈的成熟、一體化解決方案(類似聯發科手機晶元解決方案推動山寨機大爆發)的完善,以及眾多孵化平台(硬蛋,太火鳥)的助推,智能家居概念不斷演進。技術,協議,和入口不斷推陳出新,並將隨著自然語言處理、圖像識別以及人工智慧理論和技術進步,不斷深入家居各場景。通過科技進步,給人們家庭生活提供極大便利。

最初的智能家居理念,在於通過app等控制家電設備,這可以稱為0.x階段。這一階段的代表,主要是各種單個的智能硬體,如智能開關(海爾*,小米,硬糖*等),智能監控(聯想看家寶*,百度i耳目,小米攝像機,360智能攝像機#),空氣盒子(海爾*),智能機頂盒也可以勉強算是。這一階段的特點普遍是通過簡單的改造,使得傳統家電,可以實現手機遠程控制,缺少設備間的互聯。

而進一步豐富的智能家居概念1.0,起始於路由器的智能化和功能擴展,也可以稱為路由器時代。

因為路由器天然的聯網設備接入屬性,可以作為設備中心。通過插件與擴展協議或者網關控制多設備,豐富了應用場景。曾經深度參與過360智能路由器智能家居產品體驗,以及天使試用聯想newhome智能家居套裝。兩者都是在基於原有智能路由器基礎上實現,但也略有區別。

360智能家居是指智能路由器的app,能夠自動識別接入路由器網路的智能硬體(360設備或者合作廠商設備,如海爾),並通過支持的協議或者調起相應app管理各硬體。聯想的newhome方案,是在路由器上外接一個家居網關,通過網關的app,協調控制各家電(夜燈,門磁,開關等)。

這一階段還是基於手機app控制,相比0.x,增加了多設備互聯已經,統一入口控制。

隨著自然語言處理與語音識別技術的成熟,基於語音控制成為了智能家居的新的交互方式,引領了智能家居2.0時代。

代表性的產品主要有智能音箱和智能助手,主要是展現形式不同。

智能助手,主要是在pc或手機,也包括智能音箱等設備上,採用語音對話,問答形式提供交互響應。國外如蘋果Siri,微軟小娜小冰;國內如參加一站到底的搜狗汪仔機器人,參加最強大腦的百度機器人。

智能音箱則由於天生的語音播放優勢,逐漸被認為是2.0時代特徵。

智能音箱最早從國外亞馬遜的echo,到蘋果的homepod和谷歌的home。國內最早布局的是京東與科大訊飛聯合發布的叮咚智能音箱*,已經發到了二代。還有年前聯想發布的智能音箱#,以及前段時間密集發布的天貓精靈X1,喜馬拉雅的小雅,出門問問的問問音箱和小米的小愛同學,甚至傳聞中的騰訊。無論是國際巨頭,還是國內實力企業,都在爭搶布局該賽道。

其中比較成氣候的是亞馬遜的echo,已經延伸了多個家居場景和擴展功能,部分體現了智能家居的理念。新晉完成公測正式上市開賣的小米小愛同學則通過米家系列產品擴展,實現多種家居場景的智能體驗。

該種語音交互模式受限於設備反饋形式,無法詳細實時監控其他設備狀態(天氣,安防,冰箱,空調等),將逐漸被基於手勢與體感和屏幕的互動方式所取代,也即智能家居4.0。

比如近期暴風發布的智能電視,具有智能音箱的聲音交互,同時可以支持更直觀的可視化顯示。如果集成手勢和體感控制,更能極大方便老人小孩使用,解決需要顯示場景(如購票選擇,購物對比等)中語音交互的不足。

所謂的智能家居概念升級,就像曾經的功能手機集成mp3,集成相機,演變為智能手機。如果路由器可以集成到智能音箱或者電視,家居智能設備網關集成到電視,VR/AR等技術融入,將不斷助推智能家居的演進,成為家居智能生活的得力助手。

注:帶*為體驗過得設備,帶#為當前使用的設備。

作者:haomaiyys

寫於2017年8月23日凌晨


這波智能音箱的火,讓我想起2015年左右的電子手環的火。那一波智能手環火到什麼程度,深圳一堆創業公司都在做,今天2017年來看,還是一個非常小的市場,最後活下來就是咕咚手環、小米手環這些。

智能音箱可以成為整個智能家居的入口,但這個市場在2017年還遠遠未到爆發的時機。一方面技術沒有成熟,一方面用戶的使用習慣很難建立起來。

從智能音箱的幾個重大應用場景來看:

1)控制家庭的燈光等設施。這裡牽涉到上下游硬體廠商,周邊產品,需要有像小米那樣的硬體整合經驗。

2)播放歌曲,家庭娛樂中心。這裡牽涉到音樂、內容等版權資源。

3)其他的應用場景比如知識問答。這些場景需要更強的語音識別能力AI技術,但目前還沒有成熟,從測評來看,交流的速度非常慢,錯誤率非常高。


AI智能音箱,互聯網風口追趕騰訊阿里的「第二頭豬」?

互聯網風口的第一頭豬在雷軍老師吹風下已經上天,除此之外,在「互聯網+」的浪潮中,很多試圖起飛的豬都被地球引力所俘獲,要麼繼續向天上掙扎,要麼已經跌落。

現在,AI又一次給互聯網插上了騰飛的翅膀,在萬物互聯的神話中,智能家居中心控制戰,互聯網入口爭奪戰再次打響,而載體霍然是大家熟得不能再熟的「音箱」,而且互聯網的巨頭們紛紛入局。那麼,AI智能音箱,真的能成為「第二頭」上頭的豬么?

榜樣,國外火熱能否擴散國內?

Echo可謂是智能音箱界的「鼻祖」,亞馬遜早在2014年就推出了這款全新概念的智能音箱。它最大的亮點是將智能語音交互技術植入到傳統音箱中,從而賦予了音箱人工智慧的屬性。媒體上月的消息稱,Echo音箱的銷量即將突破1000萬台。

據京東價格顯示,Echo音箱單台的價格在2200元人民幣,簡單計算,這就是一個千億級的市場。

如此龐大的市場,怎能沒有競爭?在亞馬遜Echo問世之後,谷歌去年推出了智能音箱Google Home、蘋果今年也推出了HomePod。而最近報道,Facebook正在研發一個環境聲音設備,意欲與亞馬遜一爭高下。

國外的火熱能傳導到國內么,京東Echo的銷售數據並不能體現,但寥寥無幾的評價已經給出了答案。

國情,如何改變音箱弱勢地位?

Echo的爆紅,國外的企業在跟進,國內的企業也不例外。上至BAT、京東、小米、聯想等互聯網巨頭,再到傳統的家居、硬體企業,圍繞智能音箱的布局已經進入白熱化競爭階段。

但,「XX音箱」真的能讓國人買單么?

無論廠商怎麼包裝,在國人心目中依然不能改變其從屬地位的特性。有網友坦言,在家庭生活中,大塊頭有電視,靈活的設備有手機,除了個性的音響級發燒友,會有多少人關注音箱?除非,音箱的本質作用發生改變。

網友所提到的這種改變,莫非就是「智能家居的交互入口」?但讓筆者質疑的是,音箱的入口能取代手機么?

戰爭,贏者通吃阿里騰訊受益?

外於互聯網產業鏈頂端的企業們,掌握著大量的資源,都企圖推出智能音箱產品來佔領家庭的交互入口。前不久,阿里精靈問世,最近,小米AI音箱誕生。

一個接一個互聯網巨頭的背景下,是智能音箱不屈的靈魂,而這種靈魂的傳遞在繼續。

據不完全統計,目前做智能音箱的企業已近50家,還有許多正在進行中的或是不太知名的企業未被統計。目前,還有數以百計的硬體企業或技術提供商活躍在智能音箱的投資或生產領域。

在京東,以「智能音箱」進行產品搜索,我們已經發現,7500款可供選擇的產品已經讓有眼花繚亂。

生產這些產品的企業,都能在智能音箱的競爭浪潮中活下來么?目前,在互聯網行業有一個特別有意思的規律,那些試圖創業的創新者要麼在為阿里騰訊打工,要麼在為阿里騰訊打工的路上。一如滴滴,亦如摩拜。

也許,AI智能音箱真的會成為互聯網風口的豬,但,也只豬未必會飛!


不能,網路質量參差不齊,用戶談吐水平參差不齊,再好的演算法,沒有內容,沒有穩定性,就像一個沒有靈魂的空殼,連實用工具也算不上,只能是一個玩具。


推薦閱讀:

如何評價小米 AI 智能音箱「小愛同學」?

TAG:亞馬遜Amazoncom | 物聯網產品 | 智能音箱 | AmazonEcho |