無線智能音響的新潮流

由於Amazon Echo的出眾表現,帶語音識別功能的無線音響已經越來越火了。國內的JD也已經發布DingDong。語音識別從上次Siri之後,又在無線音響品類中青春煥發。

衡量支持語言識別的無線音響是否能在市場上具有長期競爭力需要回答兩個問題:

1. 產品的體驗是否對用戶有吸引力

2. 產品的scaling路徑是否高效

產品的體驗

支持語音識別的智能音響的使用場景主要分為兩大類:第一類主要是語音操控互聯網服務,包括流媒體音樂垂直服務,以及橫向服務如天氣播報,點餐,叫車等。第二類主要是智能家居操控,如對開關,燈光等得控制。

其實,這兩大類的應用目前通過手機都可以支持,可是在便捷性上,語音操控更自然,更迅捷,更符合大眾溝通本能。當年iPhone剛支持Siri時,大家對語音識別及操控期待暴增,PC廠家也紛紛集成Nuance和科大訊飛的服務,可是實際應用並不普遍。反而是這次Echo的上市,給語音識別提供了最好的應用場景。在相對固定的家庭環境中,手機的便攜減弱,集成麥克風和揚聲器的智能音響的優越性就凸顯了。

當然,在內容的豐富性上, 語音識別的音響還是和手機有較大差距。 所以目前的無線音響都是語音識別搭配手機應用,二者相得益彰。

作為電商巨蟒,Amazon和JD的戰略都是把集成了語音識別的音響作為流量入口,橫向集成海量互聯網服務,包括自己的核心服務。Echo已經集成了Pandora, Spotify, Amazon Music, iHeartRadio和TuneIn等音樂和在線電台服務。還集成了Uber, Yelp生活服務以及新聞類的TC,HUFF POST等服務。對於購物,Echo支持語音添加物品至購物車,然後在手機或網頁Amazon應用中結算。

在對智能家居的操控上,Echo支持了Wemo,三星的SmartThings, hue, INSTEON, WINK, nest以及ecobee。 WeMo-enabled smart switches以及 Philips Hue lights都可以通過Echo語音控制。

JD上市的叮咚音響提供的服務單薄的多。目前售賣的產品僅集成了咪咕,百度和喜馬拉雅。音樂方面內容的多樣性和優質性也不是很出眾。語音購物,路況查詢等還在開發中。一個問題是,提供的服務是否有足夠的用戶粘性。給用戶提供的體驗是否豐富。

產品的scaling路徑是否高效

提供語音交互體驗的音響系統通常包括四個部分:

1. 內置麥克風矩陣和揚聲器的終端:Echo, Dot,DingDong,以及其設備。作為語音雙向交互的HUB,最佳的硬體實體是麥克風和音響成對使用的。最佳的體驗是在較遠距離,存在其他聲音干擾時依然能接受語音指令並提供反饋(TV打開時,有人說話時)。這就要求有一系列的技術:包括 far field control, beam focusing, voice recognition, noise cancellation。 這也就是為什麼在家居環境裡面,手機並不是一個最佳的選擇。

2. 語音處理的平台(voice capture, speech to text, natural language understanding, execution of user intent, formulation of response to user, text to speech, response playback)。語音處理的平台還需要具有多種語言,和對多種應用的擴展性

3. 應用的合作夥伴。音樂服務,電商服務等等。作為無線音響,默認的功能當然是支持流媒體音樂。

4. 和主流智能家居平台的對接。

Android手機生態系統如同一幅扁擔挑子,多樣硬體終端和豐富的應用如同扁擔兩頭的籮筐,Android則是中間支撐的的挑子。映射到語音識別的智能音響系統中,支持語音識別的終端,智能家居的燈,門以及聯網服務就如扁擔挑子兩頭的籮筐,而語音識別平台和智能家居標準就如中間的挑子。極致的智能音響應當是大籮筐搭配中間堅韌的挑子。

這是一個龐大的生態系統,由於各自優勢的不同,Amazon和JD的切入點和擴展路徑還是不相同的。

Amazon的切入路徑是先打造一副好挑子。從Nuance等公司挖來了語音識別專家,經過3年的研發,開發出了業界領先的Alexa平台。關鍵性能如語音反饋時長達到1.5秒,領先業界的2秒標準。同時並行開發智能硬體,先開發Echo,然後推出內置電池的Echo Tab和入門版的Dot。 在這個軟硬體平台上,接入眾多的第三方服務和智能家居硬體。服務的多樣性驚人。在智能家居上,也支持了幾家主流的廠家。

基於這幅好挑子,Amazon迅速擴展。通過 Alexa Voice Service給第三方提供了APIs。第三方可以調用這些APIs快速部署語音服務。目前Invoxia已經開放了支持Alexa的Triby音響。這是一種類Android的套路。Echo系列就如Nexus手機一樣,打造了支持語音識別無線音響的樣板工程,同時有把Alexa如Android般開放授權,支持別的硬體。

JD的切入路徑是攜手科大訊飛成立靈隆科技公司,採用科大訊飛的語音處理平台。同時積極布局音響終端。首先自己做了一款DingDong音箱,有點類似於Google Nexus的玩法,打造了一個樣板項目,然後開始做基於硬體模組的擴展。沿襲傳統手機,平板的玩法,做好可嵌入的模組,尋找音響廠家合作。音響廠家直接硬體升級就可以接入這個生態系統。例如JBL發布的Go Smart支持語音識別。從scaling的有效性來說,選擇傳統音響廠家作為合作夥伴,受限於這些廠家在語音識別上的技術積累,例如目標音檢測,遠距離聲音識別等。選擇這些合作夥伴,在這個時間點做scaling是否合適。

做產品就如左宗棠所說「擇高處立,就平處坐,向寬處行」。項目立意要「擇高處立」。量產的產品要「就平處坐」,考慮上市時間,成本定價和渠道。生態系統的擴展要「向寬處行」。常見的問題是高處未立好,平處未坐穩,就向寬處行了,這其中的節奏,至關重要。長期來看,幾大玩家都想布局隨處可見的終端,豐富的應用,以及高質的語音平台。再獲取這平台上海量的流量。相對而言,Amazon的立意甚高,自主研發扁擔挑子Alexa,和Echo音響。上市的產品用戶體驗很好。而擴展時,選擇了開放Alexa的介面,讓第三方軟體集成。這是一套柔而快的打法。 JD的做法是趕著碎步上場,發布自己的終端。支持的服務有限,逐步迭代增加。同時通過硬體模組擴展生態鏈。這樣的問題是用戶體驗容易陷入良莠不齊。生態系統容易陷入低效。

其實業界另一位大腕也有一副好挑子。Google是看到了流媒體的興起,在音頻和視頻的流媒體上發力。Google Cast Audio基本上是和Echo同步上市的。Cast可以看做是Google版的AirPlay,支持了Spotify,Netflix等流行的應用。Google Now的語音平台也早已部署。只是這回棋差一招。忽視了語音識別的在音響上的重要性。放著自家的Google Now不用,沒有將二者結合起來,被Echo獨佔鰲頭。傳聞Google已經開始代號Chirp的項目,打造類Echo的音響。此外Google Now也已經開放了APIs,供第三方調用。 在未來的一到兩年中,我們可以看到的是這幾大玩家對無線智能音響用戶體驗的提升。會有更多的好產品發布。


推薦閱讀:

關於無損音質
三年研發的驚世之作,美國麥景圖全新旗艦SACD數碼轉盤
從杜比影院到《半場無戰事》

TAG:智能家居 | 音響 | 語音識別 |