篤信語音交互將成為主流，訊飛向 80 萬開發者展示了升級後的 AI 和 IoT 能力

05-25

來自專欄深圳灣 | shenzhenware

很長一段時間，訊飛的盈利問題都遭到業界的質疑。但昨晚，在訊飛開放平台的「AI·飛無界」新品發布會上，科大訊飛執行總裁胡郁給出了解釋：

訊飛每年在開發者平台和核心技術上的投入是上億級的，2017 年訊飛的技術投入佔總營收比重高達 61.61%，技術開發團隊的人數增長率則高達 56.04%，均大幅度高於 2016 年。

作為一家老牌技術企業，科大訊飛善於源頭技術的系統創新，但是在產品和應用方面的創新，單靠訊飛自身的力量是做不到的。訊飛在開發者平台商不惜代價的投入巨大的財力物力人力，就是希望不斷降低創新門檻，與開發者共同推動語音交互技術的應用創新。

科大訊飛執行總裁胡郁

老樣子，首先回顧 AIUI 的發展歷程以及取得的成績，這些更新的數據了解一下

在還沒有 Echo 和 Alexa 的 2010 年，訊飛發布了首個中文語音開發者平台。2015 年，訊飛發布了 AIUI，提出了人機交互的新場景和新理念。歷經三年發展，平台註冊開發者已經達到 80 萬。

科大訊飛消費者事業群執行總裁於繼棟首先對 AIUI 平台商的開發者進行了分析，發現了一些有意思的現象：2017 年，伴隨著 AI 的發展，平台開發者數量增長了 30 萬；移動終端的開發者快速增長，而代表了辦公場景的 Windows 開發者和代表了智能硬體的 Linux 開發者都獲得了快速增長，此外還有微信小程序的 API 開發者和 Java 小程序開發者，這些都是 AI 落地的表現。

現場展示的訊飛 AIUI 賦能的設備

過去一年，訊飛也努力的推動著技術走進人們的生活。從訊飛輸入法的數據分析來看，語音輸入作為一個應用，活躍度已經可以躍進手機 TOP 10 應用。用戶每天通過訊飛開放平台與設備的交互次數達到 45 億次，其中智能音箱的日活達到 4000 萬次，車機的語音交互活躍度超過 90%。

而在 AI 硬體設備商的成績，則包括訊飛 AI 翻譯機 2.0、與中國移動聯合發布的咪咕語音助手、與金山居合作推出遊戲手辦、阿爾法蛋系列兒童陪伴機器人、與美團合作推出的騎手智能耳機、與美的合作的無葉風扇、與京東合作的支持視覺交互叮咚 PLAY 智能音箱、與紅星美凱龍合作的智能導購機器人、與快思聰合作的智能家居方案，等等。

現場觀眾體驗剛剛發布的叮咚 PLAY，訊飛聯合京東出品

加大對智能家居場景的滲透，升級後的魔飛 2.0，解決了多設備同時被喚醒的尷尬

魔飛（MORFEI）是一款成品級的硬體開發平台。在去年發布的雙環八麥智能麥克風的基礎上，訊飛發布了升級版的「魔飛 2.0」。超越了固定的硬體形態的局限，「軟核化」升級後的魔飛可以安裝在各類硬體設備中。同時，融合了 AIUI 的雲函數能力，使開發者可以在雲端直接編寫業務邏輯，實現在一個小時之內完成業務場景的搭建，進一步壓縮開發周期。

魔飛的產品經理塗康宏特彆強調了魔飛 2.0 的兩點創新：

擁有分散式能力。過去，當用戶對多台設備進行喚醒時，命令執行會引發多台設備同時被喚醒的尷尬局面；現在，多台設備在同一個區域網、同一個賬戶號下，當用戶喊出「魔飛魔飛」喚醒詞時，所有在區域網內的設備進行喚醒分值計算，離用戶最近的那一台設備會優先響應用戶喚醒。

擁有能量跟隨能力。過去，當設備被喚醒之後，麥克風陣列會根據聲源的位置指定一個固定的波束方向，除非用戶再次喚醒設備，否則波束方向不會改變；現在，波束可以根據用戶的位置和聲源地移動，動態的調整播出方向，從而給用戶帶來更自然的交互體驗，也給開發者帶來更多的想像空間。

此外，魔飛還開放了包括音頻降噪介面、文本轉寫介面、合成播報介面在內的全鏈路介面，實現了聲紋喚醒能力，開發者可以通過聲紋介面獲取到用戶的身份信息，並給予用戶個性化推薦。

與魔飛聯動的設備

強調精品技能開發，升級後的 AIUI 3.0 完善了技能開發工具和平台能力

AIUI 3.0 集成了語音喚醒、語音識別、語義理解、語音合成、IoT 等核心技術，優化了技能平台，並整合了硬體、SDK、WebAPI、晶元、小程序等接入平台，構成了一張豐富的系統架構全景圖。

訊飛也例行的公布了技能和內容平台的應用數量：120+ 技能和 60+ 內容，但更加強調了打造高活躍的精品技能的重要性。優質內容提供商「工程師爸爸」和「豆果美食」被特別的點名。

為了讓開發者能夠更加高效的開發出個性化的技能，訊飛的技能平台為開發者提供了自定義問答工具、自定義技能工具，以及雲函數即雲端編程的能力、和半監督優化能力。這個頗有創新性的「半監督優化能力」，通俗的來講，就是通過系統分析人機交互日誌，了解各種熱門說法並推薦給開發者，並提供多種響應方式的建議，從而幫助開發者更加高效的捕獲用戶需求和優化技能體驗。

AIUI 3.0 在不斷的豐富著設備的接入方式，即便是不智能的嵌入式設備，只要具有 Wi-Fi 能力，就可以低成本快速的接入 AIUI 的語音能力。

現場，訊飛還舉辦了一場語音技能開發的挑戰，有 4 位開發者僅用了很短的時間，就完成了一項技能的開發，並通過現場配置好的魔飛麥克風，進行了技能演示和驗證。這裡不一一舉例。

參與現場技能開發挑戰的深圳的開發者

發布智能物聯雲 AIoT，旨在實現 20 億智能硬體的互聯互通

2018 年，硬體終端規模已近 20 億，其中，非手機類的智能終端比例，已經從 1% 提高到了 7.6%，智能硬體市場正在崛起。過去 18 個月，訊飛已經接入了近 1.5 億智能硬體終端設備，在安防、智能家居、智能辦公、機器人、智能穿戴等領域的合作夥伴數量都在快速增長。

新發布的智能物聯雲 AIoT 不僅可以實現訊飛自家設備互聯互通，還可以實現自家設備和其他設備的互聯互通，並且還能兼容第三方物聯網。

智能物聯雲 AIoT 有兩大能力：提供開放、聚合、智能的雲服務平台；支持設備在本地的霧計算（邊緣計算）。這些能力被整合到 PaaS 級的開發平台里，為開發者提供 AI 介面和開放設備連接，讓開發者可以定製開發，自由創造個性化的智能場景。

現場，訊飛的團隊也為大家展示了設備互聯互通和多模態人機交互的能力。

現場演示廚房場景的設備交互

發布操作系統 iFLYOS，整合技術和內容，免費提供系統級解決方案

最後一項發布是 iFLYOS，一種更輕量的智能硬體接入方式，一種系統級的語音交互解決方案。

iFLYOS 不僅整合了訊飛語音喚醒、語音識別、語音合成、語義理解這四大基礎技術能力並免費開放給開發者，並且，還整合了 1300 萬首咪咕高清音樂、20 萬部訊飛閱讀有聲內容、以及 3 萬部院線大片。

為了更好的助力開發者，iFLYOS 還提供了 API 開放介面、開源了端代碼、並且兼容亞馬遜 AVS 可以讓亞馬遜設備快速接入訊飛。

訊飛單點 AI 能力秀

篤信基於視覺呈現的語音交互將成為主流交互方式

胡郁的新品發布後，不僅強調了科大訊飛在技術上的策略投入，還和觀眾探討了未來的人機交互方式。

統計表明，90% 信息輸出依靠語音，80% 信息輸入依靠視覺。基於視覺呈現的語音交互，是否能成為觸摸交互之後，最主要的交互方式？胡郁給出的答案是堅定的。未來，將會有更多的帶有視覺呈現的語音交互場景，如跑步等移動場景下，人們佩戴耳機的無視覺呈現的語音交互；在車載環境下，對著後視鏡的弱視覺呈現的語音交互；還有在家庭環境下，在電視、投影等屏幕前的強視覺呈現的語音交互等等。

擁抱軟硬體開發者的姿態

自去年 1024 開發者節後，訊飛不斷的擴大著開發者的受眾範圍，並細化著他們的畫像。訊飛將開發者分為 5 類：能力開發者、方案開發者、產品開發者、技能開發者、內容開發者，並預測今年將突破 100 萬訊飛開放平台的註冊開發者。

璀璨的發布會現場聚集了 2000 位開發者

在會後的採訪環節，當深圳灣問起常常出差來深圳的於繼棟，如何描繪深圳的開發者時，他說，深圳是一個充滿創新的地方。深圳是北京之外開發者最多的城市，但相比北京的開發者，深圳的開發者的兼容性略顯不足。

基於這兩年對語音智能生態的觀察，我們發現，具有技術能力的軟硬體開發者和方案商、終端設備的開發者、以及具有軟體開發和內容整合能力的應用開發者，都被或正在被捲入到語音智能這個大生態。而在各大巨頭和實力派系都在競相搭平台「秀肌肉」的時候，開發者的活躍度也超過了以往任何時候。應該以怎樣的姿態擁抱開發者，則是這些大平台長遠的課題。

圖源：科大訊飛

作者：陳壹零 / 深圳灣

審校：大樹 / 深圳灣

深圳灣（微信公眾號 ID：shenzhenware）長期挖掘物聯網、人工智慧、機器人、無人機、智能駕駛、智能家居等領域的新銳產品和初創團隊，歡迎聯繫我們。微信私人客服：小炫（ID：warexx）。