樹葉過江全靠浪之智能音箱篇

聽相聲,郭德綱懟岳雲鵬是樹葉過江全靠浪,諸位業內的兄弟們,大家又何嘗不是,區別可能只是在於有人浪起來了,有人還在等著浪 :)

近一段時期一直在反思、復盤過去這三、四年來發生在智能音箱上的種種,供應鏈的一灘爛事都一樣咱不說了,單說從解決連接和內容源問題的 WiFi 音箱,到加入了語音識別、深度學習的智能音箱,一路走來,我們也從做產品轉型到了做方案,Slogan 也從開始的「讓音樂像空氣和水一樣自由流動」到了「讓設備說話」,一個明顯的區別是整個業界對智能音箱這個 SKU 的期望從一個簡單的音箱升級產品轉變到了替代百度「框計算」的那個框,能不能框住不清楚,反正是思路不同就完全不同了,比如前者的代表叮咚音箱和後者的代表 DuerOS、DUI的落地產品長得差不多,但本質上他們已經完全不是一個產品,肩負的使命也完全不同。孰是孰非,現在定論還為時尚早。但可以看清的是,樹葉過江,大部分團隊其實是那片樹葉。

對一片樹葉來說,智能音箱這個事情,本質上是一個一魚三吃的問題:

  1. 魚頭是語音技術,語音識別ASR、語音激活VAD、TTS等等,傳說中的語音入口,基本是思必馳、雲知聲、科大訊飛、聲智等廠商的菜,別說自己搞個 kaldi 跑也行,誰試誰知道,要是有足夠的語料訓練模型,you can you up。
  2. 魚尾是大數據,你說機器學習也好、搜索引擎演進也罷,如果沒有數據,就變成了巧婦難為無米之炊。這塊是百度、搜狗、騰訊、阿里們的菜,對小團隊來說,辦個培訓班,打著機器學習的旗號撈一波培訓費也就罷了,真以為自己可以21天精通 Python、C++,學了幾天 TensorFlow、CNTK、Torch、MXNet... 就可以自己搞一個 AI service,老規矩,you can you up。
  3. 魚身上有兩面的肉可以吃,一面是品牌;一面是上量。

音箱是暴利行業,當然我是指活下來並有品牌的音箱。品牌既銷量、品牌既消費者,有了品牌就可以挾消費者以令魚頭、魚尾,語音入口也好、大數據也罷,都需要落地才能完成最終的商業閉環,而有品牌的產品自然是不二之選,從頭在音箱領域創建一個品牌不是不可能,只是非常困難而已,這個思路按下不表;另一個聰明的思路是,一手接入 AI Service,一手去親近現有品牌豈不也很美?BUT,凡事總有個BUT,but 這條路也不一定好走,可以參見下京東跟哈曼、創新甚至漫步者、聯想合作的產品,對一款超長供應鏈、用戶期望超高的產品來說,松耦合的合作基本上註定就是費力不討好。

上量這個事情,一直以來業內的思路就是走藍牙音箱的路,讓藍牙無路可走。從 13 年起我們就垂涎藍牙音箱一個月三千萬的銷量,但在 AI 體驗本身並沒有特別突出浪點的情況下,AI 元素在這個思路的產品中只能作為買藍牙送 AI 的贈品存在,既然是贈品,那麼成本必然要低到接近為 0,但目前的方案是,只要有遠場語音識別的方案就必然需要一顆單獨的、相對藍牙方案來說價格不菲的處理器來支持,SO,這塊基本上就看 RDA 和 ESP 們這些 IC 廠商的進展了(RDA、ESP不用謝,廣告費我就不收了,加油幹活吧)。

綜上,對有志於智能音箱行業的淘金開發者們來說,魚頭、魚尾就別惦記了(需要特別提醒的一點是,這次的機器學習浪潮,不是當年的移動互聯網,沒有 App Store,沒有成熟的分紅模式,對普通開發者來說,你折騰很多的數學知識、演算法知識、更新一下自己的知識結構是好事,但別想著在這塊賺錢,沒門)。魚身上的兩塊肉,如果你有特別好的運營思路和資源,又有特別牛逼的供應鏈和底層研發能力,那麼恭喜你,你可以基本養活一個20人左右的團隊來開始 show 你的情懷和理想了,如果你特別好的運營思路和資源+你特別牛逼的供應鏈和底層研發竟然融合的非常好,哪么再次恭喜你,你的直接對手 B&O、哈曼世家們等一票朋友已經在不遠的前方等你了。

那是不是這個行業就真的還沒起來就先定好天花板,就沒有希望了呢? 尤其是阿里發布了 499 擊中叮咚的中段(叮咚定價分別是 599 和 399),小米完成華麗絕殺,PPT 預先鎖定 299 之後?前有小米 299,後有百度 DuerOS,阿里 AI Labs,思必馳 DUI,劉備們又要哭了,為之奈何?為之奈何,其實也無需過於擔心,小米 299 的核彈主要還是扔到了京東和阿里頭上,小團隊靈活且所需糧食不多,依然有活路,活下去,以謀未來的名義

活路有兩條

  1. 一條是走出去,做 Alaxa Inside 的代工,像 LinkPlay、Sugr 做的,先活下去以觀後效,壞處是後效也有好壞兩種,如果僅僅滿足於此,也有很大被吃掉的風險。
  2. 第二條是著眼在三個點上下文章:場景化、低成本、多觸點。 一旦具備了以上三點,基本上有如打通了任督二脈,不僅僅可以做國外市場,慘烈的國內市場也可以做起來。
  • 場景化是核心,且已經被實踐過多次,從阿里小智、京東智能時代到現在,真正讓用戶爽的根本不是某一個 WiFi燈泡、智能xx 單品帶來的體驗,用戶要的是精裝房不是毛坯,只有多產品聯動形成場景化,才能打通用戶體驗和產品能力之間的隔閡,這已經成為不爭之事實。
  • 低成本是一個老掉牙的思路,在 AI Inside 無法獨當一面成為一個獨立的賣點之前,低成本將是 AI 打開市場唯一的賣點,別跟我說你家產品可以做到 5 米外激活、7 米外激活,有毛用?相反,市場策略上弱化當前 AI 的弱點,價格上下探到藍牙的成本,在大約 90~150 之間 PK 一下,極有可能激活整個產品的升級換代需求,當然,前提是大家忍住不要都做小米,盡量讓更多的廠商有錢賺,更多的對手確實分走了你的利潤,但多了一位同路人的同時也多了一個思路和探索方向,AI 框計算的框還遠遠沒來,相煎何太急。
  • 多觸點,我們常說,智能音箱發展到現在,基本上變成了一個 AI 服務落地的事情,既然是 AI 服務落地,那麼重點就在於服務和用戶之間的觸點,不要糾結於究竟是音箱、故事機、機頂盒還是電視,甚至手機和 PC 都要照顧到,尤其是手機和 PC,這幾年下來,大家不約而同的感慨 PC 互聯網時代結束,移動互聯網時代結束,但要注意到這個結束只是針對新增廠商,對用戶來說恰恰是 PC 互聯網和移動互聯網成功升級,變成了日常中水電一樣必不可少的存在,作為 AI 服務落地,大家花費巨大的精力、資金來開拓遠場激活的語音入口、佔領更多的攝像頭,希望可以在新時代裡面抓住類似百度的框計算入口,但像這種全球級別的入口,背後必然是要有世界級的錢包和資源支持,有的話就上,沒有趁早別嘚瑟。倒不如把省出來的時間、資金、精力投入到現有的觸點中去反而更有機會。

以上,場景化、低成本、多觸點,翻譯過來就是要有很多很多、很便宜開放又傻瓜化的單品可以連接進來形成統一的場景服務,而且這個背後的服務決不能是能且只能通過新買的設備訪問到,原有的生活方式,比如 PC 客戶端、Web 網頁、手機 App、小程序,一個都不能少。

聽起來很難,做起來其實會更難,雖然很難,並不是沒有機會。

比如亞馬遜的 Dash Wand 和國內 BroadLink 跟進的魔棒,就是一個非常切合 場景化、低成本、多觸點的產品。

這兩個產品各自結合自己生態裡面的眾多成熟單品形成場景化;產品本身無需累贅的遠場識別技術,通過 push-to-talk 接入 AI 服務,極大滿足低成本的要求;在多觸點上面,暫時只有多個設備可形成薄弱的用戶觸點,需要後期增加投入完善現有諸如 PC、Web、App、小程序上的布局。

一旦完成場景化、低成本、多觸點的布局,再加上合理的運營和渠道支持,短期上量,長期形成品牌,只要執行到位將來形成可以跟巨頭一戰的局面也未必沒有機會。

推薦閱讀:

燒餅修改器綜合、深度、模糊、聯合搜索使用技巧是什麼?
人工智慧革命:通向超級智能的路上
【討論】機器人在以後真的能代替人類嗎?
亞馬遜在年會上推出的TTS系統Polly能用24種語言說出47音色的聲音
AI在傳統行業的代表性應用案例

TAG:智能音箱 | 智能家居 | 人工智慧 |