篤信語音交互將成為主流,訊飛向 80 萬開發者展示了升級後的 AI 和 IoT 能力
來自專欄 深圳灣 | shenzhenware
很長一段時間,訊飛的盈利問題都遭到業界的質疑。但昨晚,在訊飛開放平台的「AI·飛無界」新品發布會上,科大訊飛執行總裁胡郁給出了解釋:
訊飛每年在開發者平台和核心技術上的投入是上億級的,2017 年訊飛的技術投入佔總營收比重高達 61.61%,技術開發團隊的人數增長率則高達 56.04%,均大幅度高於 2016 年。
作為一家老牌技術企業,科大訊飛善於源頭技術的系統創新,但是在產品和應用方面的創新,單靠訊飛自身的力量是做不到的。訊飛在開發者平台商不惜代價的投入巨大的財力物力人力,就是希望不斷降低創新門檻,與開發者共同推動語音交互技術的應用創新。
老樣子,首先回顧 AIUI 的發展歷程以及取得的成績,這些更新的數據了解一下
在還沒有 Echo 和 Alexa 的 2010 年,訊飛發布了首個中文語音開發者平台。2015 年,訊飛發布了 AIUI,提出了人機交互的新場景和新理念。歷經三年發展,平台註冊開發者已經達到 80 萬。
科大訊飛消費者事業群執行總裁於繼棟首先對 AIUI 平台商的開發者進行了分析,發現了一些有意思的現象:2017 年,伴隨著 AI 的發展,平台開發者數量增長了 30 萬;移動終端的開發者快速增長,而代表了辦公場景的 Windows 開發者和代表了智能硬體的 Linux 開發者都獲得了快速增長,此外還有微信小程序的 API 開發者和 Java 小程序開發者,這些都是 AI 落地的表現。
過去一年,訊飛也努力的推動著技術走進人們的生活。從訊飛輸入法的數據分析來看,語音輸入作為一個應用,活躍度已經可以躍進手機 TOP 10 應用。用戶每天通過訊飛開放平台與設備的交互次數達到 45 億次,其中智能音箱的日活達到 4000 萬次,車機的語音交互活躍度超過 90%。
而在 AI 硬體設備商的成績,則包括訊飛 AI 翻譯機 2.0、與中國移動聯合發布的咪咕語音助手、與金山居合作推出遊戲手辦、阿爾法蛋系列兒童陪伴機器人、與美團合作推出的騎手智能耳機、與美的合作的無葉風扇、與京東合作的支持視覺交互叮咚 PLAY 智能音箱、與紅星美凱龍合作的智能導購機器人、與快思聰合作的智能家居方案,等等。
加大對智能家居場景的滲透,升級後的魔飛 2.0,解決了多設備同時被喚醒的尷尬
魔飛(MORFEI)是一款成品級的硬體開發平台。在去年發布的雙環八麥智能麥克風的基礎上,訊飛發布了升級版的「魔飛 2.0」。超越了固定的硬體形態的局限,「軟核化」升級後的魔飛可以安裝在各類硬體設備中。同時,融合了 AIUI 的雲函數能力,使開發者可以在雲端直接編寫業務邏輯,實現在一個小時之內完成業務場景的搭建,進一步壓縮開發周期。
魔飛的產品經理塗康宏特彆強調了魔飛 2.0 的兩點創新:
擁有分散式能力。過去,當用戶對多台設備進行喚醒時,命令執行會引發多台設備同時被喚醒的尷尬局面;現在,多台設備在同一個區域網、同一個賬戶號下,當用戶喊出「魔飛魔飛」喚醒詞時,所有在區域網內的設備進行喚醒分值計算,離用戶最近的那一台設備會優先響應用戶喚醒。
擁有能量跟隨能力。過去,當設備被喚醒之後,麥克風陣列會根據聲源的位置指定一個固定的波束方向,除非用戶再次喚醒設備,否則波束方向不會改變;現在,波束可以根據用戶的位置和聲源地移動,動態的調整播出方向,從而給用戶帶來更自然的交互體驗,也給開發者帶來更多的想像空間。
此外,魔飛還開放了包括音頻降噪介面、文本轉寫介面、合成播報介面在內的全鏈路介面,實現了聲紋喚醒能力,開發者可以通過聲紋介面獲取到用戶的身份信息,並給予用戶個性化推薦。
強調精品技能開發,升級後的 AIUI 3.0 完善了技能開發工具和平台能力
AIUI 3.0 集成了語音喚醒、語音識別、語義理解、語音合成、IoT 等核心技術,優化了技能平台,並整合了硬體、SDK、WebAPI、晶元、小程序等接入平台,構成了一張豐富的系統架構全景圖。
訊飛也例行的公布了技能和內容平台的應用數量:120+ 技能和 60+ 內容,但更加強調了打造高活躍的精品技能的重要性。優質內容提供商「工程師爸爸」和「豆果美食」被特別的點名。
為了讓開發者能夠更加高效的開發出個性化的技能,訊飛的技能平台為開發者提供了自定義問答工具、自定義技能工具,以及雲函數即雲端編程的能力、和半監督優化能力。這個頗有創新性的「半監督優化能力」,通俗的來講,就是通過系統分析人機交互日誌,了解各種熱門說法並推薦給開發者,並提供多種響應方式的建議,從而幫助開發者更加高效的捕獲用戶需求和優化技能體驗。
AIUI 3.0 在不斷的豐富著設備的接入方式,即便是不智能的嵌入式設備,只要具有 Wi-Fi 能力,就可以低成本快速的接入 AIUI 的語音能力。
現場,訊飛還舉辦了一場語音技能開發的挑戰,有 4 位開發者僅用了很短的時間,就完成了一項技能的開發,並通過現場配置好的魔飛麥克風,進行了技能演示和驗證。這裡不一一舉例。
發布智能物聯雲 AIoT,旨在實現 20 億智能硬體的互聯互通
2018 年,硬體終端規模已近 20 億,其中,非手機類的智能終端比例,已經從 1% 提高到了 7.6%,智能硬體市場正在崛起。過去 18 個月,訊飛已經接入了近 1.5 億智能硬體終端設備,在安防、智能家居、智能辦公、機器人、智能穿戴等領域的合作夥伴數量都在快速增長。
新發布的智能物聯雲 AIoT 不僅可以實現訊飛自家設備互聯互通,還可以實現自家設備和其他設備的互聯互通,並且還能兼容第三方物聯網。
智能物聯雲 AIoT 有兩大能力:提供開放、聚合、智能的雲服務平台;支持設備在本地的霧計算(邊緣計算)。這些能力被整合到 PaaS 級的開發平台里,為開發者提供 AI 介面和開放設備連接,讓開發者可以定製開發,自由創造個性化的智能場景。
現場,訊飛的團隊也為大家展示了設備互聯互通和多模態人機交互的能力。
發布操作系統 iFLYOS,整合技術和內容,免費提供系統級解決方案
最後一項發布是 iFLYOS,一種更輕量的智能硬體接入方式,一種系統級的語音交互解決方案。
iFLYOS 不僅整合了訊飛語音喚醒、語音識別、語音合成、語義理解這四大基礎技術能力並免費開放給開發者,並且,還整合了 1300 萬首咪咕高清音樂、20 萬部訊飛閱讀有聲內容、以及 3 萬部院線大片。
為了更好的助力開發者,iFLYOS 還提供了 API 開放介面、開源了端代碼、並且兼容亞馬遜 AVS 可以讓亞馬遜設備快速接入訊飛。
篤信基於視覺呈現的語音交互將成為主流交互方式
胡郁的新品發布後,不僅強調了科大訊飛在技術上的策略投入,還和觀眾探討了未來的人機交互方式。
統計表明,90% 信息輸出依靠語音,80% 信息輸入依靠視覺。基於視覺呈現的語音交互,是否能成為觸摸交互之後,最主要的交互方式?胡郁給出的答案是堅定的。未來,將會有更多的帶有視覺呈現的語音交互場景,如跑步等移動場景下,人們佩戴耳機的無視覺呈現的語音交互;在車載環境下,對著後視鏡的弱視覺呈現的語音交互;還有在家庭環境下,在電視、投影等屏幕前的強視覺呈現的語音交互等等。
擁抱軟硬體開發者的姿態
自去年 1024 開發者節後,訊飛不斷的擴大著開發者的受眾範圍,並細化著他們的畫像。訊飛將開發者分為 5 類:能力開發者、方案開發者、產品開發者、技能開發者、內容開發者,並預測今年將突破 100 萬訊飛開放平台的註冊開發者。
在會後的採訪環節,當深圳灣問起常常出差來深圳的於繼棟,如何描繪深圳的開發者時,他說,深圳是一個充滿創新的地方。深圳是北京之外開發者最多的城市,但相比北京的開發者,深圳的開發者的兼容性略顯不足。
基於這兩年對語音智能生態的觀察,我們發現,具有技術能力的軟硬體開發者和方案商、終端設備的開發者、以及具有軟體開發和內容整合能力的應用開發者,都被或正在被捲入到語音智能這個大生態。而在各大巨頭和實力派系都在競相搭平台「秀肌肉」的時候,開發者的活躍度也超過了以往任何時候。應該以怎樣的姿態擁抱開發者,則是這些大平台長遠的課題。
圖源:科大訊飛
作者:陳壹零 / 深圳灣
審校:大樹 / 深圳灣
深圳灣(微信公眾號 ID:shenzhenware)長期挖掘物聯網、人工智慧、機器人、無人機、智能駕駛、智能家居等領域的新銳產品和初創團隊,歡迎聯繫我們。微信私人客服:小炫(ID:warexx)。
版權聲明:本文系深圳灣編輯創作發布,轉載、約稿、投稿、團隊報道請聯繫微信公眾號:shenzhenware(回復關鍵字)
推薦閱讀:
※升級用戶體驗的制勝法寶——硅語電話機器人
※小編親測:開售即遭「瘋搶」的小度在家憑什麼成了網紅?
※防水可便攜:小問音箱Tichome Mini體驗測評
※基於阿里雲API打造「Kim智能語音助理」