AI時代取代手機:語音交互設計漫談

文章翻譯自Lyndon Cerejo發表於SMASHING MAGAZINE的Designing Voice Experiences,全文通過構建一個語音問答類的益智遊戲來分享了作者關於語音體驗設計的經驗,涵蓋了一個語音應用程序從設計到開發測試及上線的整個流程。


基於語音的界面正變得司空見慣。 Siri和Cortana等語音助手也已經出現好幾年了,但在過去的這個假期,亞馬遜和谷歌的語音驅動型設備進入了數百萬個家庭。

VoiceLabs最近的分析估計,今年將有2450萬個語音驅動型設備出貨,這幾乎是去年的四倍。 作為體驗設計師,我們現在有機會去設計語音體驗和語音界面了!

設計一個全新類型的界面並不意味著我們必須拋棄以前已經成功應用到界面設計中的所有經驗。我們需要根據語音驅動界面的細微差別來調整我們的設計流程,包括會話交互的加入以及可視化屏幕的缺失。我們將研究那些典型的語音類產品的工作原理、討論設計語音體驗的步驟,並通過為Amazon的Alexa平台設計一個語音應用程序(Amazon稱在Alexa平台上的語音應用為 Skills)來說明這些步驟。

了解語音界面之間的關聯

就像移動應用在操作系統和設備上運行一樣,三個層次必須一起工作才能實現語音交互:

1. 語音應用程序(Amazon Skills 和 Google Actions);

2. 人工智慧平台(Amazon Alexa,Google Assistant,Apple Siri,Microsoft Cortana);

3. 智能設備 (Echo, Home, smartphones, computers).

每個層級都依賴下一層級,並支撐上一層級。 語音界面位於上面兩層,兩者都駐留在雲端,而不是在物理設備上。

插播

最近把各個互聯網領悟的經典技術書和資源整理了一下,涵蓋34個領悟,143家公司的面試真題,以及常見互聯網技術領悟經典書和面試書和知名互聯網公司校招薪資匯總表。

下載地址:

jianshu.com/p/4a9599a23

讓我們以Alexa平台上一個名為 Jeopardy!的Skill(應用)為例,來看看這些層級之間是如何協同工作的

諸如Amazon Echo和Google Home之類的語音驅動設備不斷地在等待喚醒詞(「Alexa …」或「OK,Google …」)從而進入操作狀態。 一旦激活,設備會將隨後接收到的音頻發送到雲端的AI平台(「… play jeopardy!」)。 該平台使用自動語音識別(ASR)和自然語言理解(NLU)的組合來識別用戶的意圖(開始益智遊戲)並將其發送到支持應用程序(Jeopardy!J6 Skill on Alexa)。 應用程序處理請求並通過文本進行響應(如果支持則提供可視化信息)。 該平台將文本轉換為語音並通過設備播放(「歡迎來到Jeopardy J6,這是今天的線索……」)。 這一切只需幾秒鐘。

建立語音體驗

去年,馬克·扎克伯格(Mark Zuckerberg)接受了一個個人的挑戰,去建立一個簡單的AI來管理他的家。 他做到了,它被叫做Jarvis,還擁有了Morgan Freeman的聲音。

當然,大多數人沒有能力或資源去做同樣的事情,但是我們可以通過在已經搭建好的第三方AI平台上運行我們的語音應用程序來減少工作量。 這讓我們只需要擔心語音應用程序的設計和開發,大大簡化了開發工作。 Amazon和Google已經公開提供了相應的模板、代碼以及詳細的使用步奏,幫助開發者構建不同類型的語音應用程序,即使非開發人員也可以在一個小時內開發一個應用程序!

他們在簡化應用程序開發方面的投資正在得到回報,每個月都有數千個新的語音應用程序正在啟動。 語音應用的增長帶來了大家對於90年代網路淘金熱的回憶,以及應用商店推出後移動應用爆炸式增長景象的聯想。

在擁擠的語音市場中,良好的設計將使您的語音應用程序與其他數百個類似的應用程序區分開來。

語音體驗設計

要設計一個良好的語音用戶體驗在開始開發之前應該經歷五個步驟(發現 -> 定義 -> 細化 -> 描述 -> 提煉)。 雖然直接進入開發可能是誘人的,但在探索如何進行正確的設計上花費時間也是值得的。

我們將討論和應用每個步驟來設計一個語音應用程序,這可以很容易地使用Alexa的許多技能模板之一開發。

  • 發現

設計之旅始於「這個語音應用程序如何為用戶提供價值」這個問題。無論您是在開發一個獨立的語音應用程序(如我們的示例)還是您的語音應用程序只是您的顧客使用的許多接觸方式之一。您要 考慮的是人們為什麼和在哪裡使用語音應用程序。 正如Mary Meeker的「2016互聯網趨勢報告」所顯示的那樣,人們使用語音介面是因為免提互動的好處,交互的速度和易用性,同時主要在家中或在汽車中使用。

關鍵是要找到那些相比使用電話或計算機來說語音應用更易用、更便捷的用戶需求。例如銀行提供的帳戶信息或電影觀眾在附近尋找新的電影這樣的場景。

如果您有已經有語音應用的競爭對手,請審視他們正在做的事情以及他們的應用在應用市場(例如亞馬遜的Alexa Skill商店)收到的評論和反饋。 其目的不是盲目模仿,而是去了解他們已經設定的功能模塊,以及目標用戶的期望。

(在寫這篇文章的時候,有超過1500個「益智遊戲」 相關的的Alexa Skills,這使它成為了數量最多的 Skill類別,但是這其中沒有一個是迎合了用戶體的Skill。 在 接下來的語音設計過程中,我們將創建一個用戶體驗設計相關的Skill,讓讀者測試他們設計相關知識,你甚至可以從中學到新的東西。)

  • 定義

在這一步中,我們將定義我們的應用程序的個性和它將具有的功能。

個性

在設計語音界面時,我們沒辦法通過網頁和移動界面中大量使用的視覺元素來展現個性。 語音界面中的個性必須通過口頭交流的聲音和語氣來實現。 跟能聽到Freeman舒緩聲音的Zuckerberg不一樣,我們聽到的只能是設備默認的聲音。 這使得在傳達我們想傳達的個性時,語調和措辭至關重要。

好消息是,這個領域的大部分基礎工作應該已經完成並記錄在企業品牌指南或網站風格指南中(提示:尋找「語調」部分)。 為您的語音應用程序充分利用這些指導原則,並在各個任務路徑和接觸點之間保持一致的個性。

當我想到個性和語調時,「維珍集團」立即映入了我的眼帘。 他們清楚地界定了他們是誰以及如何將這些傳達給用戶。 對於「維珍美國」來說,理想的語氣是「時髦、隨和、非正式、俏皮以及口齒伶俐」,這些在所有的交流中都清晰的傳達了出來。

來源:(Virgin America)

如果你曾經要求過Alexa唱歌或嘗試過任意一個Alexa內置的復活節彩蛋,那麼你會知道她有自己的個性。 當我好奇的向負責她個性構建的團隊了解時,他們是這樣說的:

當構建Alexa的聲音時,我們嘗試著給她設計了自己的個性,它包含了亞馬遜最重視的那些特質。 我們希望她在樂於助人,謙虛和聰明的同時還能保持有趣。 這是一個循序漸進的過程,我們期望隨著更多開發者投入其中,使她變得更聰明的同時Alexa的聲音也能隨之演變。

個性還可以反映在應用列表中顯示的應用名稱、圖標、說明,以及用於喚起應用程序的名稱(調用指令)中。 所以,在發布你的應用程序的時候,要確保它顯而易見。

對於我們的用戶體驗設計技巧,我們可以採取一個簡單或有趣的方法,這將反映在我們測驗問答選項的措辭中。

一個正常音調的例子是:

哪一種UX設計原則偏向簡單而不是複雜?

    1. 奧卡姆剃刀原理
    2. 希克定律
    3. 美即好用效應
    4. 滿意度

而一個有趣音調的例子是:

顯然,有一個UX的設計原則,偏向於簡單而不是複雜。 真的! 你能猜到它叫什麼嗎?

    1. 奧卡姆的剃刀原理:一個用戶體驗設計獅可以得到的最好的。
    2. 希克定律:聽起來像一個用戶體驗土鱉想出來的東西。
    3. 美即好用效應:這是一些奇特的UX術語。
    4. 滿意度(satisficing):I can』t get no satisficing…對滾石道歉。(滾石樂隊的歌曲《(I Can』t Get No) Satisfaction》)

還是讓我們堅持正常吧。

功能

這是您仔細思考哪些功能是對您語音程序用戶有用的地方。 從第一步重新審視您的工作,以確定與您業務相關的核心能力。 有時提供核心功能是一件不容易的事情,例如銀行提供與餘額、交易和到期日相關的信息。 其他產品則以相關功能的形式提供價值,比如汰漬的去污指南語音應用程序,或者Glad(食品存儲和垃圾袋製造商)的語音應用程序,其中一個幫助用戶記住他們存放剩菜的地方,另 一個允許用戶檢查哪些物品應該被回收或丟棄在垃圾箱中。

如果你在從網路到手機的時候做了類似的練習,那可以作為起點。 對於語音功能,請考慮到在公共場合語音設備的哪些功能可以為用戶提供便利。 如果一個Skill有安全或隱私方面的顧慮,可以考慮增加一個保護級別(Capital One Alexa Skill允許用戶為賬戶訪問創建一個個人密鑰)。 雖然您最終可能會通過語音使用一系列功能,但您可以從一到五個核心功能開始,並在啟動後使用語音分析功能從用戶習慣著手進行更新和改進。

用戶體驗設計Skill的核心功能可能是:

    1. 在需要時提供用戶體驗設計原則查詢;
    2. 隨機挑選一些用戶體驗(UX)原則來測驗用戶(單人玩家);
    3. 用多個用戶體驗(UX)原則來測驗用戶(單人玩家),並保存分數;
    4. 與多名玩家舉行UX知識測驗競賽。

因為我們正在使用亞馬遜的技能模板來構建這個用戶體驗設計Skill,我們的選擇目前僅限於上面的第一個(fact Skill模板)或第三個(益智遊戲Skill模板)選項。 假設我們的研究表明,我們的用戶發現測驗遊戲比單純聽取用戶體驗原則知識更有價值,那我們的核心功能就應該是使用用戶體驗原則來測驗用戶並保存得分。

  • 細化會話流程

現在您已經將語音應用程序的功能列入候選名單,開始關注應用程序與用戶的詳細對話流程。人的交談很複雜,它往往有許多波折,隨時可能轉動,人們經常從一個主題跳到另一個主題。語音AI平台還有很長的路要走,以適應這種複雜程度,所以你必須訓練你的Skill如何回應用戶。

您的語音應用程序只能支持您在上一步中定義的功能,但用戶始終可以以任何格式詢問應用程序。對話流程的詳細設計可以讓您正確響應用戶,或者將對話推向那些應用程序可以為用戶做的事情。

對於語音應用程序將支持的每種功能,開始在用戶和應用程序之間創建會話對話,類似於劇本中的對話。當你寫這些對話時,請記住預設的個性以及語音和音調的特點。然後就可以開始創建和管理您的語音應用程序的實際內容了;對於我們將要創建的測驗應用程序,這將意味著建立測驗問題的列表。

從「開心路線」開始 - 語音應用可以在沒有任何異常或錯誤的情況下響應用戶請求的會話流程。然後,繼續詳細說明會話流程中的例外情況(用戶不提供完整的信息)和錯誤(語音應用程序不理解或不能完成用戶要求的內容)。

因為談話會被聽到而不能被閱讀,所以一個好的做法是大聲讀出來,看看它是不是一個自然的口頭談話,並檢查它是否傳達了你預設的語氣。

如果您的語音應用程序需要使用手機App中顯示的內容來補充對話,請將這些交互設計在一起,以便用戶能將它們無縫的關聯起來。例如,如果新Echo上配備了觸摸屏的傳言是真的,那麼除了聽取說明之外,汰漬的除污Skill還應該告知用戶他們也可以參照Alexa應用程序在屏幕上展示的除污步驟。

以下是我們用戶體驗設計Skill中快樂路徑的示例對話的核心能力:

    • 用戶:「Alexa,啟動用戶體驗設計測驗」。
    • Alexa:「我會問你五個問題,多選答案。試著儘可能多的正確。 只要說出答案的數字即可。 讓我們開始。 問題1 …「
    • 用戶:[正確回應]
    • Alexa:「這是正確的! 你的分數是1.這是問題2 …「
    • 用戶:[反應不正確]
    • Alexa:「糟糕,這是錯誤的答案。正確答案是[正確答案]。 你的分數是1.這是問題3 …「
    • Alexa(在五個問題的末尾):「這是正確的! 五個問題中有四個是正確的。 謝謝你來玩!」
  • 描述備用片語

人們並不總是用相同的辭彙來表達同樣的東西,因此語音應用需要被教導。短語映射是訓練語音應用程序以適應用戶短語請求方式的變化的練習。

對於上一步中詳述的每個對話路徑,請考慮用戶可以用不同方式發起這些請求。然後分解每個請求的措詞,並識別可能使用的單詞變體和同義詞,並考慮到不同地區的差異以及方言。如果您的語音應用程序涉及甜的碳酸飲料(蘇打水,流行音樂,可樂,滋補品,軟飲料,碳酸飲料),長三明治(分,磨床,華蓋,英雄,窮小子,轟炸機,義大利三明治,麵包)或運動鞋(運動鞋,鞋子,運動鞋,沙鞋,跳投,網球鞋,跑步鞋,跑步者,運動鞋)。

讓這個變體列表儘可能完整和詳盡,以便您的語音應用程序可以理解用戶請求。Alexa需要以「話語」的形式進行這些變化,並建議提供「……儘可能多的代表性短語」。根據語音應用程序的功能,語音的數量可以很容易地達到幾百,但有一些方法可以簡化話語的產生。

下面是我們用戶體驗設計測驗功能的示例片語映射。Alexa的AI平台在根據模板轉換用戶的技能意圖方面做得很好。但是,如果你做出了改變(比如我們把「益智遊戲」改成了「測驗」),那麼這些短語就必須添加了。

  • 提煉

設計過程的最後一步是驗證和優化語音應用程序,然後花費時間和精力進行開發。在「細節」步驟中,大聲閱讀對話流程,有助於確保聽起來自然和口語化。目前的步驟還涉及到了與用戶測試語音界面。

最簡單的測試方法是使用「綠野仙蹤」技術,一個人扮演聲音驅動設備的角色,並根據語音介面腳本來響應用戶。 另一個選擇是使用SaySpring等原型軟體來創建和測試互動式原型。

如果您的語音應用程序是使用代碼模板(如我們的應用程序)構建的,那麼創建應用程序後使用Amazon和Google提供的測試工具在Skill開發空間內測試(如下),或者使用真實設備的測試模式進行測試可能會更容易一些。

這個測試會給你一個像現實世界中的語音體驗一樣的良好感覺,還包括錯誤處理,重複響應,以及不自然的,強迫的或機械似的回復。

開發

現在語音體驗已經設計好了,是時候進入構建測試提交階段了。每個平台都有詳細的指南和教程,以幫助任何人建立和測試Skill,包括Alexa技能套件,為Google開發的Actions,以及支持Alexa Skill代碼重用的Cortana!

考慮一下你的反饋機制,完善的分析將有助於了解語音應用的使用情況。在你的開發者帳戶內,你可以獲取到Skill的各項指標(用戶,會話,發音,意圖),並且不需任何額外的編碼,你還可以通過使用如VoiceLabs(我沒法讓它運行起來,可能是由於我缺乏編碼經驗或缺少VoiceLabs for Dummies設置指南)這樣的免費服務,獲取到先進的分析方法。

在你的語音應用完成構建和測試後,最後一步是便捷的提交過程。由於Alexa Skill市場迅速增長,發現新的和有用的應用變得越來越困難。在亞馬遜改進之前,使用語音應用列表中的可見元素來幫助用戶找到並使用你的Skill,包括吸引人的Skill圖標,相關的名稱和說明。

本篇文章的示例Skill可以在亞馬遜Alexa Skill商店:UX設計測驗獲取並試用。

指導原則

以下是設計語音體驗的一些指導原則。 亞馬遜和谷歌提供了更多的原則來詳細的指出哪些該做哪些不該做。

  • 引導並幫助用戶開始使用

介紹應用程序以及用戶可以使用的方式。

歡迎來到UX設計測驗。 我會問你關於用戶體驗設計的五個問題,看你有多少正確的。 如果您需要,您可以要求我重複提問或暫停。 你想開始一個新的測驗嗎?

  • 保持對話交流簡潔,以減少認知負荷。
  • ### 例子比指令更有效
  • ### 不干擾任務能使人愉悅

    這是一個平衡性的行為。 太多了,很快就會讓人厭煩。

  • ### 對於重要的操作使用顯式的確認,而隱含的風險較小。

    如果您要求Alexa關閉燈光,您可以看到發生這種情況,不需要口頭確認,雖然她有時會用簡短的「確定」進行確認。
  • ### 考慮出錯情況下的設計
  • ### 尊重用戶的隱私安全

結語

無論何時你正試圖與人交往,你都必須將人視為非常先進的操作系統。 你的最高目標是試圖模仿他們。

–K.K Barrett,電影《她》的藝術指導,寫於2014

如果你還沒有看過她的電影,花幾個小時看這部關於一個孤獨的作家誰發展與操作系統的關係的未來派電影。 雖然是科幻小說,但在當今世界,隨著採用獨立的語音驅動設備(如Amazon Echo家族和Google Home),語音體驗正在不斷增加。 開發一個語音應用程序是一個相對簡單的,模板驅動的過程,由亞馬遜和谷歌提供的類似於IKEA的說明,試圖建立他們的平台。 雖然跳入開發可能是誘人的,但良好的語音用戶體驗不會發生, 必須按照本文所述的步驟進行設計。

歡迎在評論區與大家分享您的想法、觀點和資源。

引用

AI工具平台

  • Alexa技能工具包 - Amazon
  • Google Actions 平台
  • 「Alexa技能包語音設計最佳實踐」 - Amazon
  • Google Actions 設計資源

語音語調

  • 「語氣對用戶品牌知覺的影響」 - 來自Nielsen Norman Group 的 Kate Meyer
  • 「找到你的語調」 - Robert Mills,《Smashing Magazine》
  • 「發現你的品牌之聲」 - Harriet Cummings,《Smashing Magazine》

短語和方言

  • 「How Y』all, Youse and You Guys Talk (interactive quiz)」 - New York Times
  • 定義語音界面(以及Alexa的話語) - Amazon
  • 「為Alexa技能工具包定義話語」(包括示例工具)- Maker Musings

原型和測試

  • SaySpring - 「免費的語音原型軟體」
  • Echosim.io

    「Alexa技能測試工具」
  • 「Web模擬器」 - 針對Google Actions使用

報告、書以及電影

  • 「VoiceLabs的2017年聲音報告」
  • 設計語音用戶界面:會話體驗原則 - Cathy Pearl,O』Reilly Media
  • 《她》(電影)

版權聲明:本文為博主原創文章,未經博主允許不得轉載。

推薦閱讀:

「AI醫療」的下一個熱點是……
「提直降代」加速,航司聚焦打造以客戶為中心的營銷渠道
數據分析核心語言Python
AI智能投顧,第一性原理與kensho
智能硬體:AI給智能硬體帶來了第二春還是第二個大泡沫?| 2018展望

TAG:人工智慧AI醬 | 手機 |