不再依賴平台廠商的伺服器,Snips 讓你給自己定製一個全新的語音助手
在「語音是人機互動最直觀的方式」成為行業共識的今天,小到燈泡、玩具、音箱,大到家電、汽車等,承擔智能體驗升級任務的語音服務幾乎無處不在。
對於廠商、個人開發者來說,如想讓自己的產品具備語音交互的能力,亞馬遜 AVS、Google Assistant SDK 等品牌廠商提供的介面和開發套件是個不錯的選擇。
這些實現方案相對成熟、集成難度比較低,但其採用的雲端處理信息的方式難免會讓用戶對隱私、信息安全存在擔憂。
來自法國的初創企業 Snips 在近期推出一款了全新的語音平台,供企業、個人建立自己的語音助手。該平台最大的好處在於,語音信號處理可離線完成,直接避開將信息傳輸至雲端這一過程。同時,在 Snips 語音平台上創建一個語音助手的步驟也非常簡單。
自定義喚醒詞:
廠商或者個人開發者可根據自己的喜好給語音助手定義喚醒詞。Snips 平台已內置深度學習引擎,能準確判斷用戶是否在呼喚語音助手。
目前,Snips 僅支持英語和法語,有需要的開發者可藉助第三方的自動語音識別 API 來轉換成其他語言。
離線使用:
普通語音助手一般將拾取到人聲傳輸到雲端伺服器當中進行文本處理,再將反饋結果合成語音輸出給用戶(這個過程被稱為 TTS)。Snips 則可以在本地離線完成這一過程。
基於知識圖譜的自然語言理解:
可以說,對用戶的提問做出回應是語音助手最基本的能力。因語言使用習慣的差異性,對於同一個問題,不同用戶、同一用戶在不同時間都會產生不同的問法。
針對這一需求,Snips 已經有一套用於建立離線「知識圖譜」的數據生成伺服器。廠商和開發者可以在這個伺服器系統上建立問答資料庫。比如「could you please turn on the bedroom light?」這個問題,你只要將「light + bedroom + on」這三個詞語設置為關鍵詞,並在這個基礎上衍生出一些問句即可。
但如果你不想花費那麼多時間手動輸入大量的提問示例,大可以花費 100 到 800 美元,讓 Snips 幫你把問題投射到 Amazon Mechanical Turk 或其他資料庫集成平台,最終將打包好的數據發送給你。
至於這些知識圖譜資料庫,你可以將其運用到自己的語音助手或者其他聊天機器人產品上。另外,你還可以將這些預先受到訓練的數據開放出來供其他開發者使用。
易更新:
基於 Snips 這個平台,語音助手的更新工作也十分的便捷:在設備上已經下載了 Snips 應用的情況下,你只需要一個更新的壓縮包即可完成升級。
雖然 Snips 平台上已經有不少開發者,包括家庭多媒體機器人廠商 Keecker 也已經在他們的產品中使用其在 Snips 上開發的語音助手。但 Snips 還有一個更遠大的願望,就是讓 Snips 平台應用到產品化程度更高的未來產品中,比如部署到自動咖啡機,你只需要跟語音助手進行簡單對話,就能讓它為你準備出一杯咖啡。
「去中控」也是 Snips 語音平台的設計思路。目前市面上大多數智能門鎖、智能燈泡、安全攝像頭等需要綁定 Echo、Google Home 這樣的一個中控設備才能接收到語音的指令,這也是物聯網布局的慣有做法。不過,當每一個設備都擁有語音助手的對話能力後,用戶的指令也就可以指向設備本身,而不需要經過中控。
相對於亞馬遜 Alexa 和 Google Assistant 這類基本滿足家居、車載、移動等所有場景應用的語音助手不同,Snips 更希望針對各個垂直場景打造一個語音交互「離線包」,而不是一個全能助手。例如,掃地機只需要了解關於「掃地」這一本職工作的指令方式即可,因為你一般不會命令一個掃地機給你播放音樂。
目前,Snips 正繼續探索前沿性的技術和工具。公司於今年上半年獲得 1300 萬美元融資,截至目前,Snips 共計獲得融資 2100 萬美元。公司在法國巴黎、美國紐約兩地均設有辦事處。
主筆:Jes @ShenzhenWare
原文:不再依賴平台廠商的伺服器,Snips 讓你給自己定製一個全新的語音助手
-------- 關於深圳灣 shenzhenware -------
深圳灣 shenzhenware 是最早也是最活躍的硬體創新社區和媒體。深圳灣連接全球硬體創新者,連接硬體生態鏈上下游,連接跨界產品的設計、技術、生產、渠道、商業、創新。深圳灣關注「AI+硬體」帶來的場景和交互創新,以及與平台和應用相連的全產業鏈升級。
推薦閱讀:
※知乎Live總結:機器人與傳媒業的未來
※13萬人都在看的東京機器人展,你覺得能打幾分?
※人工智慧「人臉識別」系統成功逮25名網上逃犯