錯過了這次影響全行業的語音智能峰會?這篇文章或許還能搶救一下 | WARE 2017

7 月 15 日,由硬體創新社區深圳灣全程策划出品的「WARE 2017 語音智能平台與應用峰會 第 II 季」在深圳泰華梧桐島拉開序幕。

從初創團隊到行業巨頭,從平台到硬體到內容,從人工智慧公司到硬體設備企業再到傳統音頻企業……超過 400 名語音智能相關領域的先行者和資深人士,紛紛趕往現場,聆聽大咖分享,洞悉潮流趨勢前的先行者的實踐和思考。全程 6 個小時的會議,從語音先行、能力開放、場景應用、百箱爭鳴,共 4 個篇章,首次全方位的解讀這個行業。

本文將帶大家一起回顧這場盛會的精華內容,每一位嘉賓的演講或對話全文,也將在接下來的這一周,陸續推送給大家,請大家持續關注深圳灣(公眾號 ID:shenzhenware)。

前言 | 時隔 3 個月,行業的變化出乎所有人的預料

開場,深圳灣向大家介紹了舉辦這個會議的初衷以及策划上的思考。

早在 3 個月前,當我們已經非常清晰地感覺到了語音結合人工智慧之後所表現出的真實的能量,我們策劃和組織了國內首個語音智能峰會。

在 4 月 15 日的那場峰會上,我們邀請了在這個方向上樹立起標杆的 亞馬遜 Alexa,已經展示出在語音領域的發力的 搜狗,以及圍繞智能音頻的方案提供者、製造商、和朝這個方向轉型的傳統音頻品牌,來探討在這個已經開始起來的新方向上,有哪些新的技術、產品、和商業的可能性。

短短 3 個月的時間過去了,國內語音智能領域所發生的變化,出乎了我們所有人的預料,語音智能的生態在短時間內迅速繁榮。

在平台廠商、解決方案廠商、應用終端廠商、系統集成商、以及上下游企業的推動下,我們思考了將用怎樣的內容和形式,去呈現給大家一個可以解讀行業和相互交流的機會。除了緊跟這股潮流的腳步之外,還希望讓大家看到潮流中的玩家在選擇這個方向背後的思考,看到火熱的語音智能繁榮背後的冷靜思考,讓每一位在周末趕來梧桐島的深圳灣夥伴不虛此行。

四大主題論壇,首次深度呈現,多位重磅嘉賓,喚醒產業生態。我們和你們一起發出了「AI+硬體」開發者社區最強音,我們和你們一起探索著「智能硬體」創新者未來之路。

百度景鯤 | 語音智能市場正在急劇升溫,DuerOS 要為智能產品解決基礎問題

就在本次峰會召開的 10 天前,百度在北京召開了 AI 開發者大會,會上展示了百度集中發力人工智慧以來的階段性成果,對話式人工智慧系統 DuerOS 則是展示的兩大主要成果之一。時隔 10 天,景鯤專程從北京來到深圳灣的活動現場,面向語音智能領域的硬體、內容開發者,進一步從產品落地應用的角度,解讀了 DuerOS 能為硬體產品賦予的能力。

在「WARE 2017 語音智能平台與應用峰會 第 II 季」的活動開場,景鯤用「聽清、聽懂、滿足」三個維度定義了一個優秀語音智能服務體系的基本標準,在聽清、聽懂上,體現的是語音識別和語義理解方面的技術基礎。在自然語言理解能力的優化上,百度在數據上積累優勢得以體現,景鯤說道,DuerOS 給自己設立的目標是要能聽懂「FREESTYLE」,即用戶日常隨意的表達方式,「這是我們的一個短期目標。」

談到 DuerOS 的內容體系,DuerOS 已經擁有豐富的內容與服務,將全部開放給接入 DuerOS 的合作夥伴使用。同時,景鯤強調,包括兩千萬的音樂資源在內的所有內容資源都將全部免費提供,「我們自己承擔內容的成本,就是希望能夠更塊地推進語音交互的發展。」DuerOS 還將集成更多來自第三方合作夥伴以及開發者的優秀內容。

面向不同需求的開發者,DuerOS 提供了三種開發套件。在軟體方面,DuerOS 還開發了包含設備管理、技能商店在內同時具備支付功能的 APP「小度之家」,能夠直接與接入 DuerOS 的設備配套使用,甚至可以讓硬體廠商省去 APP 開發的成本。

值得一提的是,作為繼百度 AI 開發者大會後首次與開發者們面對面交流,景鯤會後仍在現場與開發者們持續討論了一個多小時。開發者的問題集中在如何獲取到開發者資格和套件以儘快開始開發、硬體產品的聯合推廣和未來雲端收入分成模式的相關細節,以及硬體企業在基於 DuerOS 打造批量產品時的具體對接方式等等。

海翼(Anker)陽萌 | 語音智能未來將普及為產品的標配功能,而產品競爭力最終還是要回歸到產品本身

此前,海翼的 Anker 品牌主要是以其充電產品為人們所知曉。實際上,在語音智能領域,恐怕還找不出幾家,像 Anker 一樣,可以同時成為亞馬遜 Alexa、Google Assistant 和百度 DuerOS 的首批合作夥伴。

在本次 WARE 大會上,海翼創始人兼 CEO 陽萌表示,此前 Anker 旗下充電產品的市場布局主要集中在海外,與百度 DuerOS 合作、進軍語音智能產品,將是海翼在國內市場的新起點

陽萌強調,應該更多從「賦能」的角度來理解語音智能,思考語音智能作為一種新的交互方式能為現有的產品和場景帶來哪些體驗上的改進,而不應把它作為單一的孤立概念來看待。

談到基於第三方平台的硬體產品如何做出差異化的問題時,陽萌認為,語音智能未來將普及為產品的標配功能,只是一個額外的加成,產品競爭力最終還是要回歸到產品本身的特徵上來,例如音響產品還是拼好的音質、好的設計,而不能只是靠語音和智能為噱頭吸引眼球。

此外,除了在智能家居領域的布局,Anker 看重語音智能在移動場景下的潛力。不久前,Anker 在 Kickstarter 眾籌了一款可連接 Alexa 等語音助手的藍牙耳機,正體現了這一點。「語音助手可以有兩種形態,一種開放的,像是音箱這樣的家庭中控;另一種則是私人的,供個人使用的,比如耳機。」

Rokid 祝銘明(Misa)| 組了博士團在線下零售店蹲點半個月,就是想知道用戶怎麼看我們的產品

Rokid 將自己定位於一家注重用戶體驗的人工智慧產品公司,如何將技術轉化為能夠提供良好用戶體驗的產品,是 Rokid 思考最多的部分。現在的人工智慧技術的整體水平,可能還無法支撐產品提供 JARVIS 那樣的「完美」或超出預期的體驗,在這樣的技術和體驗的博弈中,Rokid 是怎樣定位一款「足夠好」的人工智慧產品,它的用戶體驗應該達到什麼程度?

祝銘明回答,打造一款用戶體驗好的產品是一件不容易的事情,其中涉及大量的工作,而 Rokid 著重做的事情主要有以下幾件:第一,客觀的認識當前技術的邊界,清楚認識 AI 當前能力的邊界,包括產業、研究、工程、生產上的邊界。第二,盡量讓用戶形成相應的產品使用習慣。第三,AI 產品,尤其是電子消費類產品,主要由軟體、硬體、內容、後端服務等方面組成,每項技術與硬體之間都要在演算法上進行調和,因為,我們要做的是將演算法調優,將邊界點調到最低

如果說,Rokid 的第一代產品 Rokid.Allien 是一款主打極客市場的產品,那麼,第二代的Rokid.Pebble 則是 Rokid 拓展消費市場的象徵。祝銘明認為,這兩類產品所面向的兩類消費群體,極客與大眾,其關鍵差異在於這兩類消費群體對智能的敏感程度,對於 AI 和產品的理解,早期用戶和客戶都已經形成了一定的認識,而新用戶額理解還存在一定的偏差。

關於 AI 產品如何賣的問題,在訪談中,祝銘明用了較大的篇幅,分享了 Rokid 團隊近期組織他們的博士團,在奇客巴士蹲點賣貨的所見所聞和感悟。值得欣喜的是,從這些線下零售店的銷售數字來看,到目前為止,AI 產品(特指 AI 賦能後的消費硬體產品)的月平均銷量,Rokid 是居於榜首的

在與大量真實用戶的面對面交流中,Rokid 發現,要想增加銷量和刺激用戶購買,最好的方式就是讓用戶直接摸到、聽到、感受到。Rokid 產品的線下轉化率高達 10%,也就是 100 個人停下來看產品,有 10 個人買單。而相比 3~5‰的新品類線上銷售轉化率,Rokid 感受到了這個品類(特指像 Rokid 一樣的智能新生命,或者可以通俗的理解為智能語音終端)的市場,雖然不至於成為所謂的超級爆品,但「比大家想像的要樂觀」,只是還需要一點耐心。

思必馳 趙恆藝 | 語音開放平台之戰打響,用對話定製 DUI 平台「賦能」萬物 AI

基於人機對話交互模式的智能音箱成為了行業的熱點,已有大量的語音平台技術廠商與其合作夥伴都做了類似的產品布局。據不完全統計,行業內已有 40 多個人機對話的平台。在啟動 DUI 開放平台項目之前,思必馳副總裁趙恆藝就已經率領團隊對國際和國內的相關領域進行全方位的調研,包括各個語音對話平台的優點和不足之處,以及相關開發者對平台的訴求。

思必馳的調研報告顯示:有 67% 的開發者對這類語音開發平台持觀望態度,部分(30%)不太了解技術的人認為平台不需要具備演算法降噪、回聲消除等功能,有 97% 的開發者希望語音開發平台能有自主定製權,差異化

基於自身構建的框架基礎,思必馳結合了不同客戶、開發者的需求,力求做出擁有競爭優勢、滿足不同需求且能夠定製化的 DUI 開放平台。思必馳打造的 DUI 開放平台提供了一整套完整的自主對話交互內核,開發者只需要做引擎和語義等相關的開發。

DUI 開放平台以任務型對話為核心,重視落地應用體驗。在支持 GUI 與 VUI 良好融合的同時,DUI 平台還支持高度的定製化,包括對話邏輯、技能服務等,開發者可針對特定場景進行特殊定製。另外,DUI 還能實現本地和雲端雙重技能的定製,讓設備在沒有聯網的情況下能執行用戶使用頻率相對較高的任務,如車載場景下的導航等。

DUI 可視化的編輯界面,提供了文字、列表、圖文卡片、音樂播放、內嵌網頁等可視化組件,使得非專業的開發者能快速上手。

為了便於開發者的運營,DUI 還提供一套可呈現實時運維數據的系統,實時了解用戶活躍度、使用時長等平台相關維度信息。

作為「賦能」者,思必馳已將 DUI 開放平台作為公司的重要戰略任務之一,與眾多的合作夥伴、開發者共同打磨、完善產品。為此,思必馳還專門設立了 2 億元的基金,用於鼓勵平台開發者。

富士康 李國瑜 | 不僅是製造王國,還要成為 AI 硬體賦能的生態航母

大眾認知下的富士康是製造業巨頭,是電子產品的代工帝國,是遍布全中國乃至全世界的廠房和 120 萬的流水線工人。在人工智慧浪潮的衝擊下,富士康積極地尋求著轉變,依靠自身強大的製造能力和技術優勢,開始向「AI 的硬體賦能者」轉型。

演講開始,富士康科技集團副總經理李國瑜博士首先向觀眾展示了一個富士康作為「製造王國」的實力:從最早的 iPod,到 iPhone、iMac,再到 iPad、 HomePod,富士康幾乎承包了蘋果的整條產品線。經過多年與蘋果、亞馬遜及一些世界頂級 3C 品牌廠商的合作與磨合,富士康的製造水準已經代表了當今製造業的最高水平。

然後,富士康的團隊走到台前,最重要的使命就是向業界展示富士康「創新」的力量。富士康將在中國大陸事業的起點——富士康在深圳的第一棟廠房,交給以設計、創新見長的 B 次集團,擔起重振夏普白色家電的使命,改造成為夏普全球智能家電產品研發設計中心,全力進軍創新產業,重新設計和定義了夏普的智能家居產品。

在談及智能語音是否是下一個人機交互入口時,富士康認為,語音+屏幕才會是未來的主流,未來硬體的智能化,應該是能夠擁有集視覺與聽覺於一體的立體感知系統。富士康將其智能產品的研發基礎定位於「平板+」,基於觸屏體驗為出發點,富士康重新打造了夏普空氣清新器、智能冰箱等一系列產品。而其中最為核心的,則是一款完全原創、具有音屏的智能互動能力的家庭智能管家「曉樂」

與此同時,富士康還聯合智能語音企業 思必馳、三角獸 推出了名為「大伙兒」的聲屏交互體驗生態系統。該平台融聲屏開發技術創新孵化與開放式營銷平台於一體,對智能硬體進行表情加聲紋的雙重定製,提高硬體的智能度。

富士康將打造一條「從產品到平台思維的軟硬整合商運模式的價值生態鏈」,同時也將是一艘能廣納軟硬技術行業各路英豪的巨型商業航母,從硬體整合、軟體整合、數據融合、服務接入四個部分,實現複雜的跨領域跨學科資源整合。

最後,李國瑜博士表示:「AI 賦能硬體,硬體實現 AI,富士康所代表的深入的硬體的設計能力,以及軟硬整合的能力,就像是這艘生態航母上的軍火,助力大家走向更遠更美好的未來。」

DeepBrain 李傳豐 | 離語音交互 OS 真正成熟,至少還需要 5~10 年,而作為創業公司,我們專註於語義技能

由於支持語言的限制(目前 Alexa 僅支持英德兩種語音,傳言年內進入印度市場),Alexa 開放生態體系雖然強大,但尚不能覆蓋到中國本土用戶。

作為國內語音智能行業的先行者,DeepBrain 核心團隊是國內最早專註於自然語言處理技術(NLP)領域的團隊之一,曾在 2011 年蘋果發布集成了 Siri 智能語音助手後,推出過國內第一款基於智能手機的中文語音助手——智能 360,並積累了千萬級的用戶。團隊在 2014 年還做出了國內第一款語音智能音箱小智超級音箱,比 Echo 的推出還要早半年。

經過長時間的準備,DeepBrain 於 2017 年 5 月推出了 DeepBrain AI 雲平台,並在國內率先推出了中文語義技能商店,「這或許是打造語義技能生態關鍵的一環」,DeepBrain 李傳豐強調。

此前,深圳灣曾與 DeepBrain 有過深入的訪談和交流,並率先在國內對「技能市場」進行深度解讀。在本次 WARE 大會上,李傳豐對語音智能未來市場進行了預測:「未來基於語音交互的語義技能,其數量應該達到上百萬種,語音交互 OS 才能真正成熟。」鑒於 Alexa 技能商店目前的數量為 15000 個,要達到這個成熟市場的狀態,「在我看來,至少還需要 5~10 年。」DeepBrain 目前已經上線的語義技能超過了 1000 種,以音頻、智能家居、娛樂及兒童教育為主。

在經歷了很多年的研發積澱之後,DeepBrain 已經擁有了語義技能商店、AI 人機對話引擎、機器人功能組件、精細化大數據及家居互聯網服務等五大核心能力。與行業解決方案公司不同的是,DeepBrain 願意與語音交互產業鏈各環節公司形成戰略合作關係,而自己專註於做語義技能平台,共同推進產業 AI 升級。

Sugr 米唐科技 宋少鵬 | Alexa 認證的不是技術方案,而是用戶體驗

米唐科技作為亞馬遜認證的 Alexa 系統解決方案提供商、全球合作夥伴,騰訊語音服務首批戰略合作夥伴,提供從 PTT 按鍵交互到遠場語音交互的完整解決方案,幫助行業快速開發和量產Alexa 兼容產品,構築語音交互生態。

米唐科技(Sugr)創始人兼 CEO 宋少鵬在消費電子和音頻信號處理行業 14 年,在看到 2014 年亞馬遜推出了 Echo 和 Alexa 後,他堅定的認為,語音交互是未來的方向,而智能音箱只是語音交互落地的第一代產品,如同亞馬遜推出 Echo 只是作為 Alexa 的一個參考設計一樣,未來語音交互產品的形態將越來越豐富。

而基於亞馬遜的內容和電商平台,智能音箱不只是一個消費級的硬體產品,智能音箱更重要的使命是承載第三方服務。亞馬遜的數據顯示,用戶使用最多的語音服務,第一是音樂,第二是新聞,第三是鬧鐘和提醒。用戶對於這類音箱的需求,已經不僅僅是聽音樂的需求,智能音箱已經開始成為他們生活的一部分。

在 4 月 15 日舉辦的「WARE 2017 語音智能平台與應用峰會第 I 季」的活動上,深圳灣邀請到了 Alexa 資深架構師做分享,現場與會者有不少是在海外市場發力 Alexa+ 的設備廠商,他們都向深圳灣表達了在 Alexa 認證方面遇到的問題。

關於和亞馬遜 Alexa 的合作以及認證問題,宋少鵬的經驗是:「亞馬遜認證的不是一個技術方案,也不是單一的產品,亞馬遜認證的是一個用戶體驗。它會從頭到尾地檢測你的產品,從開箱體驗、配置網路、聲效、光效等。」鑒於此,宋少鵬強調,Sugr 是一家注重用戶體驗的公司,Sugr 交付的不僅僅是產品,更是完整的用戶體驗。Sugr 團隊中有交付設計師,有設計師的方案團隊,以幫助客戶完善產品體驗,響應亞馬遜對於用戶體驗的高要求。

哈曼 宋柏勛 | 為語音智能系統打造專門的「耳朵」和「嘴巴」

今年 5 月微軟發布了與三星全資子公司哈曼合作、內置微軟 Cortana 語音助理與 Skype 電話服務的 智能音箱 Invoke。當時,「WARE 2017 語音智能平台與應用峰會第 I 季」的與會者哈曼麥克風系統負責人宋柏勛告訴深圳灣,Invoke 背後的遠場語音技術是由哈曼的嵌入式音響事業部提供的。很快,在 6 月初的 CES Asia 上,哈曼舉行了語音識別解決方案 SONIQUE 的發布會。

站在 WARE 大會舞台上的宋柏勛,掩飾不住從台下聽課到台上分享的喜悅,在致謝了深圳灣能夠挖掘社區資源並回饋滋養社區後,他用了較快的語速,一股腦的向與會者分享了哈曼在語音交互和語音智能系統的經驗。

宋柏勛從如何讓人機語音交互更自然的角度,談了現有的語音交互技術在實現從技術到感性的跨越時,還需要哪些方面的努力。

宋柏勛首先談到,相比其他交互方式,語音輸入更加方便,溝通簡易。但對比人與人的對話,人機語音溝通還是有很多差異點。例如聲音的清晰程度和識別率,對對話內容的專註程度,語氣中的情緒傾向,對話對象的可控性等等。

同時,在聲音的接收和識別方式上,機器和人耳的工作機制也有很大的差異。人能夠僅通過兩隻耳朵十分精確的判斷音源位置,這與人的耳道以及神經系統對聲音信息的處理方式密切相關。理解並學習人耳對聲音的處理方式,也是語音識別相關研究一個重要方向。

在語音智能領域,在聲音的處理上擁有豐富經驗的哈曼,專註於為語音智能系統打造足夠的聰明的「耳朵」和「嘴巴」。一方面,哈曼提供高精度的麥克風單元和麥克風陣列,另一方面,哈曼也專門設計了應用於語音產品的低失真喇叭,二者可以組合適用於各種場景的多種方案,為語音智能系統高質量地解決前端輸入和末端輸出的問題。

VINCI 朱大衛 | 在 On The Go 的移動場景下,語音對話式交互,才是耳機未來的交互方式

2015 年,朱大衛和他的 VINCI 智能頭機首次在大眾視野里亮相,這台頂著一塊彩色屏幕、幾乎違背了人們對耳機的所有基本認知的頭戴產品被業界和消費者吐槽得很慘。儘管朱大衛一直試圖強調,VINCI 的頭機是跟耳機不在同一維度的全新品類,但在面世之初,像是語音控制、AI 情景匹配之類的賣點並沒有引起人們的興趣,大家的注意力都放在了這塊看起來功能雞肋又羞恥感爆表的屏幕上,突破常理的大膽設計成了 VINCI 的「原罪」。

這個「原罪」背後的「始作俑者」,就是 VINCE 的創始人朱大衛,也正是這樣一個頗有爭議的人物,受深圳灣的邀請,面對滿堂的業界資深人士,分享垂直場景的全棧式 AI 創新。

2014年,我在查爾斯河旁邊跑步的時候,發現大部分人戴著 iPhone 和有線耳機跑步,這個場景下,人本身還是需要和信息連接的,但是解決的辦法非常奇怪。如何讓 On The Go 場景中的人與信息連接的更緊密?便成了日後我的創業課題。

朱大衛很早就開始思考移動場景的產品變革。過去的聽歌體驗其核心是手動式交互,而 VINCI 智能頭機的核心功能是語音對話式交互。這個產品背後的邏輯是非常簡單的,語音仍是移動場景下最合適的交互方式,現在的語音技術也能夠解決大概 80% 的日常交互需求,但在語音交互受限時仍需要一套彌補方案,在考慮了諸多交互設計之後,VINCI 最終還是選擇了觸摸屏。

關於聲+屏的產品形態,朱大衛的觀點是:「以智能音箱為代表的語音交互界面(VUI)和以智能手機屏幕為代表的圖形交互界面(GUI)之間並不是替代關係,VUI 是另外一種東西,這上面的許多服務是還未被發掘的、只能存在在 VUI 上的。」

LifeSmart 董熠 | 未來的房子是一個有自主意識的機器人,在家庭場景下打造產品,讓 AI 無所不在

作為國內最早的一批智能家居創業企業之一,LifeSmart 經歷過一波智能家居的熱潮,以及一波「偽」智能家居的退潮。讓用戶回家之後掏出手機、打開 APP 的「偽」智能家居產品,其詬病也讓這個行業對智能家居的信心有了不同程度的損傷。

如今,LifeSmart 的產品形態早已超越智能家居套件,在董熠看來,未來房子就是一個有自主意識的機器人。內置很多感測器來了解人的行為和數據,有很多執行部件像四肢一樣控制家挺,有 AI 在雲上調度數據和信息。這樣才能達到完全自動控制的境界。

面對著智能音箱的火爆,LifeSmart 曾經也想開發一款用語音控制的音箱,但後來放棄了,董熠的理解是:語音在家庭環境中應該是無處不在的,可以讓人變得很自由,在任何時候都可以坐在那裡跟房子對話,基於用戶的位置、數據、聲音,給出合適的反饋,最終實現在家庭場景下人工智慧的無所不在。

人工智慧有一個分散式的部署架構,語音也是如此。不光是連接到雲端的時候智能設備有深度學習的能力,在本地的時候,也要有離線技術的支持。董熠說:「人工智慧應該在雲端和本地同時部署,當網路斷開的時候,仍然可以完成很多智能化的功能。當連到雲端的時候,這個時候再具有一種深度學習的能力,這是我們對於未來家庭的理解。」

未來的家庭應該是逐步變成一種有意識的形態,LifeSmart 也是基於這樣的理解,努力讓家變得有「意識」

狗尾草 邱楠 | 知識圖譜是聊天機器人走向強人工智慧的關鍵

本次 WARE 大會,我們試圖從不同場景去探索語音智能的產品形態。教育場景、家居場景、移動場景、移動場景、辦公場景...... 這些是語音技術應用最廣泛的幾個場景。但除此之外,還有新的可能。

狗尾草智能科技(GoWild)已出品多款公子小白智能語音交互機器人,並在消費市場上表現出不俗的成績。去年,狗尾草推出了 Holoera 琥珀·虛顏 AI 3D 全息主機,突破性的將語音技術應用在二次元領域。琥珀·虛顏是一款擁有人工智慧的虛擬藝人,主要「生活」在全息 3D 主機Holoera 中。

邱楠認為,一款聊天機器人要稱為強人工智慧的殺手級應用,還需要面對不少的挑戰。一是,多輪對話的處理;二是,對話場景從垂直領域擴散到開發領域的困難;三是,上下文的結合;四是,識別用戶多樣化的表達和意圖;五是,個性化的對答;最後,還要在對話中體現機器人的情感。

為此,開發者需要基於大數據來構建海量的知識圖譜,並在此基礎上,重點實現語義理解、知識表示、QA、智能對答和用戶建模等 5 個技術的落地。

另外,邱楠認為,我們接觸世界的手段不僅僅是文字,而是結合圖像、語音和文字等多模態來了解外部世界的。因此,我們所構建的知識圖譜也應該從單純的文本擴展到多媒體知識圖譜,而 ImageNet 和 Visual Genome 正在往這方面努力。

百「箱」爭鳴 | 靈隆科技魏強、貓王曾德鈞、超聲劉曉彤,智能音箱探索者「風口」上的思考

在 WARE 2017 語音智能峰會的最後壓軸環節,我們邀請了靈隆科技總經理魏強、貓王創始人曾德鈞、超聲(TYMPHANY)音響總經理劉曉彤,共同分析國內音箱行業現狀,探討未來音箱創業的風口。

魏強,現任京東和科大訊飛合資公司北京靈隆科技有限公司總經理。叮咚音箱的語音交互系統由科大訊飛開發,渠道則由京東負責。從 2015 年 8 月起,已推出 6 款智能音箱,領跑其他智能音箱企業。從叮咚音箱概念誕生、產品設計、生產製造以及市場銷售的整個過程,魏強一路趟過了不少坑。而叮咚音箱也幾乎成為業界示範性的產品——幾乎每一個啟動智能音箱項目的團隊,都有拆解過叮咚音箱

在世界範圍內,幾乎所有的大廠商都在做智能音箱,這是一個很明顯的信號,智能語音產品很可能會成為下一代交互入口。而國內很多公司其實並沒有想清楚智能音箱火起來靠的是哪股風,就一窩蜂全湧上來做產品,爭搶市場,這並不見得是好事。「我們不希望大家一窩蜂上,去做低水平的重複性投入,每家公司應該找恰當的點切入特定的應用場景可能會更合適,而不是毫無目的的湧入。」

作為「貓王」復古收音機品牌的締造者,曾德鈞還有一個更為大眾所了解的抬頭「貓王之父」,自 2015 年創立品牌以來,累計銷量突破 50 萬台。

作為在音響行業混跡幾十年的老兵,深諳這一片藍海要打出一片新品牌之難,因此他選擇了並不智能的藍牙音箱作為創業方向。面對「百箱大戰」的行業「風口」,曾德鈞十分冷靜的並沒有跟風,而是把精力放在最有效的地方,把產品和品牌做好。同時,他還把自己當初幫助靈隆科技研發智能音箱的經驗,無條件的傳授給了有需要的人。此外,他還向百度度秘推薦了自己的設計合作夥伴,共同設計了百度 DuerOS 的參考設計音箱。

劉曉彤,惠州超聲音響總經理、深圳市音響行業協會會長、中國電子音響工業協會專家組成員。在音響 ODM 行業浸淫近 30 年的行業前輩。超聲(TYMPHANY)是幾乎所有國際大牌音響品牌背後的 ODM 廠商,和所有基本上你能想到的品牌都有過緊密的合作。

作為行業領軍企業之一,超聲音響在智能音箱項目上,近幾年持續的投入了很大的人力、物力,在新技術、新方案上進行預研,同時在傳統優勢—聲學研發上,持續加大投入進行配合。就在 WARE 大會召開前的半個月,劉曉彤向深圳灣透露,公司在智能音箱上的業務收入,只佔全部代工業務的 1%。時隔半個月,超聲又因為一筆大生意,而讓這個收入比例,上升至 10% 以上。踩準點,早投入,這或許是超聲為國內傳統音響 ODM 廠商在轉型過程中的最寶貴經驗

對於希望希望進入智能音箱領域的傳統音響行業人士,劉曉彤對他們的建議是:「如果有能力走在前面,那就去嘗試;如果現在還沒有邁進去,不如等一等,等像百度這樣的公司把平台做好,借平台之力完成產品從不智到智能的轉型。」

展覽展示 | 語音智能生態的繁榮,離不開軟硬體平台與應用的極大豐富

在主會場之外,各大參展商的展台從中午 12 點開始,一直熱熱鬧鬧到晚上 7 點才散場。應上下游廠商的需要,配合峰會而開展的「語音智能平台與應用創新展」聚合了 AI 設備及應用、AI 平台及方案,以及 AI 生態及周邊展示。旨在推動人工智慧與硬體創新生態的融合,讓機器賦能。

參展企業包括:富士康科技集團、DeepBrain、圖靈機器人、Sugr 米唐科技、RAK 瑞科慧聯、希巨科技、愛普泰科、雲之訊、靈隆科技、瘋童科技、雲動創響、VINCI 玩起。

富士康收購夏普後,重新設計的智能空氣凈化器。富士康不僅把這款企業內的創新產品帶到了「WARE 2017」大會的現場,還特別贊助了 10 台空凈到大會主會場,為已經座無虛席的主會場空間,解決「空氣污染」問題。在現場實測匯總,這款空凈從最初的警示紅燈,逐漸變成了代表健康空氣的綠色燈。

RAK Wireless 在本次展會展出內嵌 AmazonAlexa AVS 的開源硬體套件 WisCore,幫助產品開發者快速構建支持 Amazon Alexa 的產品。

能夠為智能音箱快速搭建通信能力的雲之訊也吸引了不少開發者。

梧桐 CEO 早茶會 | 精緻活動主題,精準商務社交

值得記錄的精彩瞬間還有在會議當天上午開展的精緻主題私享會。「梧桐 CEO 早茶會」本是深圳灣聯合泰華梧桐島在 2016 年聯合開展的高端社交活動,已經連續舉辦過 4 場頗受好評的活動。借「WARE 2017」的活動,我們將與會的嘉賓邀請到了這個早茶會。

品味過美味茶點之後,我們精選了 30 多個語音智能領域的新聞事件,與嘉賓席地而坐,一起暢聊新聞背後的故事。透過這些新聞事件,大家增進了彼此的了解和認識。

尾聲 | 特別感謝

特別感謝,富士康 B 次集團的團隊,你們的敬業熱情與專業精神,打動了到場的每一位與會者。感謝你們為會場帶來的新鮮氣息和創新力量。

特別感謝,美麗的生態辦公園區,泰華·梧桐島,你們對於產品的專註和用戶體驗的關注,另每一位來到梧桐島的人,都被這裡的美麗所感動。

深圳灣的精彩,我們下一季「WARE 2017」再見!

大會官網持續更新:x.shenzhenware.com

大會客服:微信小炫 warexx

-------- 我是「深圳灣」分割線 ---------

深圳灣 | shenzhenware 長期挖掘物聯網、人工智慧、機器人、無人機、智能駕駛、智能家居等領域的新銳產品和初創團隊,歡迎聯繫我們。微信私人客服:小炫(ID:warexx)。

本文系深圳灣編輯創作發布,轉載、約稿、投稿、團隊報道請聯繫微信公眾號:shenzhenware(回復關鍵字)。


推薦閱讀:

谷歌人工智慧唇讀術完虐人類,僅憑5千小時電視節目!人類古老的技藝再次淪陷
TensorFlow 官方文檔譯者招募
保姆機器人被入侵變殺人機器?網路安全成共享經濟後的大風口!
如何評價udacity(優達學城)的人工智慧工程師課程(納米學位)?
機器學習原來這麼有趣!第三章:圖像識別【鳥or飛機】?深度學習與卷積神經網路

TAG:智能语音 | 人工智能 |