Shall We Talk? —— 會話式界面的應用漫談

很長一段時間,我一直在默默關注一類頗有意思的應用。

它們功能各異,共通點是看起來像IM,實際上卻不是。

它們只是藉助人類自然語言模擬會話,通過「會話式界面」(Conversational UI,簡稱CUI),來實現一些我們再熟悉不過的功能。

會話式界面聽起來似乎是一個有點故弄玄虛的名詞,實際上是我們一個再熟悉不過的陌生人。

往近的看,十幾年前就在QQ上經常出現的各類聊天機器人,今天各種生活服務、企業應用中簡單關鍵詞答疑助手功能,乃至更熟悉的例子——公眾號的自動回復系統,都是Chatbot形式的會話式界面。

只不過,助手功能能響應的關鍵詞往往過於單一,而純粹的聊天機器人則由於沒有明確的業務背景和足夠豐富的應答套路,往往一番尬聊下來只有被用戶調戲的份。因此都沒能走進主流應用的視野,淪為傳統應用錦上添花的點綴。

往遠的說,從DOS時代長大的一代人最熟悉不過的命令行,本質上就是一種最原始的會話式界面,用戶噼里啪啦輸入一行命令,系統轉譯後給出他的反饋。

經歷了從命令行到GUI的漫長變遷,普通用戶對越來越豐富、友好的GUI控制項早已成習以為常。為什麼今天會話式界面又似乎以一個新生事務的姿態重新出現在我們的視野中?

莫非就像習慣了精緻食物的現代人把父輩的粗糧視為珍寶,只是圖個新鮮?

自然不是。

命令行時代的對話,用的是電腦才聽得懂的代碼。

如今的會話式界面中,用的是新手用戶也看得懂的人類生活語言,同時也有越來越多的優秀產品在切入細分的場景,化「尬聊」為幫用戶解決實際需求。

從用戶遷就計算機,到計算機真正做到用會話服務用戶、服務場景,一個看似繞回原點的大圈子,背後卻是體驗層面上質的變化。

1. 會話式交互的價值

客觀地說,會話式界面仍然只是一個看似時髦但過於小眾的交互形式,畢竟我們很難隨口說出一個高頻應用是採用會話式界面的。個人也一直認為,會話式界面即使會誕生成功的應用,也只會成功在垂直度非常高的小場景中。

然而個人覺得,會話式界面應用的價值並不限於一個應用本身。

因為會話式界面的終局一定不會是一個「界面看起來像IM的應用」。

「會話式界面」是「會話式交互」的一個子類別,而會話式交互的另一個沒有界面的子類,就是如今炙手可熱的智能語音。會話式界面和它這位孿生兄弟的差別,僅在於傳達信息的是圖形文字界面還是語音。

這就決定了會話式界面是如今主流的交互界面和智能語音之間一個很好的橋樑,或者說過渡形態。許多可能在未來帶來一波風口的語音交互場景,在會話式界面都是一個成本可控的概念與場景檢驗手段。

如果將智能語音交互分為用戶語音輸入、輸入識別、應答判斷演算法、轉譯為自然語言、語音合成(TTS)輸出這5個階段,那麼會話式界面則相當於去頭去尾,只需要完成第2到第4個階段的工作,就可以藉助婦孺皆知的會話界面,很好地承載場景中所需的功能。

畢竟在精準的語音識別和情緒自然的TTS達到一定水平之前,圖形和文本仍然是現階段人機交互最好的載體。

2. 會話式界面的應用現狀

如前文所說的,會話式界面還是一個相當小眾的交互形式。市面上的會話式界面應用一方面總量不大,另一方面,很鮮明地集聚在少數幾個非常小的垂直場景中。下面以iOS端五個最主要的應用類型為例,介紹會話式界面在移動端的應用現狀。

2.1 新聞客戶端

無論紙媒還是網路新聞平台,當前面對的一個共性問題就是用戶已經被越來越多的被動體驗「慣壞了」,至少相比以往,更加不願意去主動篩選和過濾感興趣的信息。傳統紙媒在這點上的危機自然不必多說,而Web端的新聞網站也不例外地要想方設法應對這樣的趨勢。

大西洋傳媒的Quartz是一家主打國際商界高質量精選新聞的網站,在Web端手握積澱已久、精心挖掘的高質量內容資源。對於這樣的趨勢,他們選擇的應對方式,是在移動端首創性地採用了基於會話式界面的推送模式。

Quartz以消息氣泡的形式為用戶推送精選新聞的標題和摘要,在拆分為多條消息連續發送時,會模仿IM中「正在輸入」的反饋,讓用戶有時間逐條閱讀拆分後的單條信息,也更有與一個真正的人類互發消息的感覺。

用戶可以在「對話」過程中根據自己的興趣,選擇「anything else」深入了解具體內容,還是「next?」繼續看下一條。點擊帶有「>」箭頭的對話氣泡,則可以打開內置瀏覽器,進入網頁版的內容詳情頁。

不過由於跳轉去向是各大新聞源網站,並沒有經過內置瀏覽器統一樣式的轉碼,界面上也缺乏一致性,不像微信的內置瀏覽器,可以通過統一的頂欄,讓用戶產生「還在同一個應用內」的感覺。

除了這些中規中矩的推送類對話外,Quartz還會根據新聞的重點或笑點,像一個真實的朋友一樣發送動圖表情,或者用一個小問題開啟一個新的話題,很大程度上提高了應用的溫度感。

國內也不乏跟進的應用,例如「下文」。「下文」相比專註財經時政的Quartz,內容更貼近國內互聯網圈子中的實時熱點,內容質量雖然參差不齊,但某種意義上對國內用戶而言更接地氣。

「下文」的交互方式上也很大程度上模仿了Quartz的做法。不過,細節體驗上仍然有一些明顯的問題。

以模仿IM中「正在輸入」的反饋為例,「下文」也會在逐條消息間以「…」營造「正在輸入」的感覺,但由於分段過長,而間隔過短,造成用戶往往一大段文字還沒看清楚,就迅速蹦出來下一條,最終只能等幾條消息完全顯示完畢後再從頭看起——這又與閱讀完整的新聞頁面又有多大差異呢?

因此,對於這類基於會話式界面的精選新聞推送產品來說,嚴格把控文本量和閱讀節奏非常重要。一旦犧牲瀏覽完整性換來的新穎體驗都淪為雞肋,是很難留住用戶的。

2.2 會話式小說

當年輕人的時間被各種移動應用切成了無數的碎片,閱讀行為更多地從紙媒向電子設備轉移。而在電子設備上,能堅持閱讀大段文字的人變得越來越少,有多少人買來Kindle卻閑置在床頭就是最好的例子。

一些文學創作平台和作者則抓住這樣的趨勢,將會話式界面與小說相結合,創造了旨在帶來「5分鐘閱讀」體驗的會話式小說這一新體裁。用「主人公」與不同角色的問答互動串起了整個故事情節的推進,用戶點擊屏幕就可以看下一條「消息」。文本、圖像、語音甚至音頻、視頻通話等在IM中非常熟悉的信息傳達形式,為這類小說的陳述提供了豐富的表達方式和想像空間。

美國創作與閱讀社交平台Wattpad旗下的Tap是這類應用中最優秀的代表之一。創作題材方面,驚悚懸疑類是最適合用充滿未知的會話式展現的題材,可以看到無論是Tap還是各國的同類產品,懸疑故事都佔據了熱門作品的半壁江山。

當然也不乏愛情、幽默等更輕鬆有趣的類型,在我體驗過的幾個同類競品中,Tap是難得的能在作品豐富度如此之高的情況下仍能維持高水準的社區之一。

美區同類型且質量接近的還有Hooked和Yarn,這兩款應用加上Tap,包攬了美區AppStore圖書類免費榜的3-5名——前兩名是大名鼎鼎的Audible和Kindle。日本最火熱的平台Teller則在ピッコマ等一票漫畫平台的擠壓下,仍堅挺在日區免費榜第5(均為2018年2月3日數據)。

上述產品中,基於會話式界面的閱讀頁面設計大同小異,不過Teller顯然有意靠攏Line的界面風格,而美區幾大產品則沒有刻意向IM的體驗看齊。產品的差異點主要還是在於作品風格和導航、推薦策略,在此就不一一展開介紹了。

「會話式小說」創作相比傳統的小說,無需過多考慮敘述轉接、心理描寫、景色描述的行文,因而只要設定好角色就可以快速進行創作,極大地降低了創作門檻。

與低門檻帶來的高活躍度相應的,作品質量也參差不齊,不過Tap和Teller等國外平台都比較重視內容質量的把控,偶有質量一般的作品,也不會影響到平台整體的調性。畢竟誰心裡都清楚,在交互形式大同小異的情況下,內容質量就成了殘酷競爭中成敗的決定性因素。

國內雖然有大批產品迅速跟進——嘎吱、輕點小說、快點閱讀、Kilakila、迷說、牛嗶的對話、有毒、話本小說、旁趣、在嗎、白鯨、觸閱、看吧、爽點、點點、午夜對話……不勝枚舉,可作品質量只能各位讀者說見仁見智了。這裡只以AppStore搜索「對話小說」排名前兩位的嘎吱和輕點小說為例,其餘產品有興趣的話可以自行體驗。

……

怎麼說呢,我既非這些作品的受眾,又不了解產品和運營的內情,沒資格過多評價。

只能從旁觀者角度感嘆一句,做內容太難。

尤其是一個新興創作體裁的興起,往往需要一批(甚至只要一個就足夠)標杆式的優秀作品作為宣導,為跟進的創作者們帶進一個良性的循環,很遺憾國內並沒有。

2.3 會話式遊戲

如果說會話式小說是沿著作者規定的單一流程,完成故事的全程體驗。那麼,如果在一些關鍵節點上,允許用戶自主選擇「主人公」的回應,以決定不同的劇情走向分支呢?

在會話式小說的基礎上,以消息對話的形式,輔以可以影響(或者並不影響)結局走向的龐大選項樹,讓用戶可以切身影響到故事中角色的命運,就催生了一種新的遊戲類型——會話式遊戲。

講到這裡大概很多朋友都想到了,會話式遊戲和GUI同樣不是什麼新生事物,大量戀愛養成類的文字冒險遊戲(AVG)都屬於這一類型。即使拋開PC端擁有廣泛二次元市場的Galgame不計,移動端耳熟能詳的例子也屢見不鮮,在蛙兒子之前乃至現在,長期佔據女生手機使用時長的「戀與製作人」就是一個例子。

但本文想講的,更多還是基於傳統純文字對話形式的遊戲。

這其中最知名的自然是3 Minutes團隊的Lifeline系列,App Store編輯給予了非常高的評價:

「遊戲全程的溫情與懸念讓人難以割捨,時刻牽掛著孤立無援的宇航員泰勒發來的下一條信息。這位被困在某個星球的宇航員會藉助文字訊息描述當前狀態,你講幫忙出謀劃策,指引前進方向,選擇是否探索廢棄的飛船,以及其他關鍵決策。泰勒的命運倚賴於你的雙手,每一步選擇都講引出不同故事走向和結局,可倒回重選的極致讓遊戲更為精彩和耐玩」。

從本篇到Bloodline、SN和Whiteout,頗為成功的續篇一次次地為系列積澱著口碑,也逐漸樹立了在同類型遊戲中的標杆地位。

作為一個遊戲,界面自然無需太向一個IM應用靠攏,根據遊戲背景的不同,有許多更好的選擇可以與遊戲場景契合、增強代入感,當然,大多還是脫離不了一個「對講機」的設定。

但這裡想稍微展開介紹的一個例子,是一個比較小眾,但個人認為在沉浸感和代入感上遠遠勝過Lifeline的例子:「The Girl Who Sold The World」,直譯大概是「出賣世界的女孩」,下文簡稱「出賣」(官方縮寫是TGWSTW,好像並不怎麼「簡」,就暫且這麼稱呼吧)。

你會通過一個類似對講機的設備「Skyler」,與孤身一人身陷一個陌生世界的失憶女孩Frances保持聯絡,「Skyler」實際上就是遊戲唯一的界面。

你和Frances手中各持一台同樣的設備,因此Frances也一直稱呼你為「Skyler」。

雖然對界面設計而言,可以用簡陋來形容,除了設備頂部印著的「Skyler」和三個簡單的操作控制項外,幾乎全部空間都讓給了對話和選項區域。

你是Frances在那個危機四伏的世界中唯一的傾訴對象,伴隨她冒險旅程和找回記憶、接近真相的全程。隨著她對你越來越信任,你的安慰和幽默感是她戰勝恐懼的唯一依靠,你的建議往往決定了她的下一步行動,一些錯誤的答覆甚至會讓Frances喪命。當然,在此期間她的可愛的吐槽與碎碎念、抱怨與小脾氣,也將伴隨你們的聊天始終——一個副作用就是,有用戶甚至在評論里提到「已經愛上Frances發小脾氣的語氣了」。

「出賣」卓越的沉浸感和代入感主要來自兩方面。

一是質量極高的全程語音和音效,唯一配音演員Sara完美地詮釋了Frances這個角色鮮明的性格,音效方面,無論雪夜還是沙漠,無論在小溪取水的聲音、柴火的噼啪聲還是拍掉身上沙土的聲音,所有環境音都是製作團隊在自然環境中實際採集的,且採集的樣本量之大讓你很難感覺到重複和循環。

另一方面,則來自與實際時間完全同步的時間線,例如Frances在精疲力盡地昏睡前和你道別後,只有等她睡醒後再次聯繫你(通過Push)遊戲才能繼續,在此之前打開遊戲會提示連接失敗。Lifeline也有類似機制,但個人覺得「出賣」處理得更加真實。

高質量的劇本為基礎,選項和分支帶來充分的參與感,語音則將作品的代入感和吸引力一下子升級了不止一個檔次。

這也是為什麼看似不起眼的會話式界面一旦在某一場景被驗證成熟,輔以可靠的語音識別和TTS,前途不可限量的一個例證。

英語過關的朋友強烈建議體驗一下這個遊戲,可惜現在只出到第一章。

2.4 工具應用

翻譯工具,大概是工具類中能想到範圍內最適合以對話方式呈現的。騰訊翻譯君就充分利用了翻譯這樣一種對話往來的天然特性,用對話氣泡承載翻譯內容,而用卡片氣泡引入更多豐富的推送。

騰訊翻譯君的對話氣泡設計主要是針對這樣一類場景:中國人A和美國人B面對面,A按住「按住說話」按鈕說話,氣泡從左側冒出,給出中文原句和英文翻譯,美國人B看到後,按住「Hold to Talk」說話,氣泡從右側冒出,給出英文原句和中文翻譯。

但當一個用戶獨自將其當做翻譯工具使用時,這樣的氣泡邏輯就比較奇怪了。以漢譯英為例,氣泡會不斷地從左側冒出,這種場景下更容易理解的氣泡邏輯應該是:用戶的原句氣泡從右側冒出,系統給出的譯文氣泡從左側冒出。

這個例子說明,翻譯工具中氣泡邏輯要符合用戶在IM中培養出的既有心智,並不像乍一想那麼簡單,往往和使用場景有直接關係。

和翻譯工具的對話化思路類似的,還有同樣具有「一問一答」屬性的搜索引擎。

Google在2016年推出的語音助手Assistant,為Google生態提供了強有力的語音識別能力支持。許多用戶在是喲和功能中意外發現,當希望快速獲取以某個關鍵詞為中心的關聯信息時,Assistant甚至比直接用Google更加高效,尤其在後來在支持文字輸入之後,更好地支持了不便語音的場景。

例如在搜索一個電影作品後,可以通過語音或文字輸入下一步希望了解的細節,也可以快速通過卡片氣泡下方的選項按鈕,查看預告篇、演職員表等關聯信息。

Assistant通過卡片內嵌了人物、電影、書籍、視頻片段、小遊戲、餐飲推薦等豐富的內容類型,與Google自身強大的搜索能力結合,將許多行為簡化成互動式界面中的寥寥數語,可以說是基於會話式界面的工具應用中最優秀的代表之一。

3. 會話式界面的優勢與短板

看過這麼多的例子,我們回想開頭提到的這個現象——為什麼會話式界面註定無法脫離「小眾」這個標籤,只能在高垂直化的子領域中扎堆,並沒有廣泛地應用開來?或者說,為什麼會話式界面在一些領域具有天然的優勢,在一些領域卻始終無法施展拳腳?

3.1 優勢

1. 交互形式統一

對用戶而言——學習成本非常低。當消息界面已經被QQ、微信等IM巨無霸培養了天然的熟悉度時,一個此前只會微信的中老年人,也可以快速適應一個會話式的生活服務產品,例如公交查詢、水電繳費等以往需要複雜交互界面才能完成的行為,可以大大簡化為「一問一答」的形式。

對產品而言——卡片具有極強的可擴展性和包容性,同一套交互形式可廣泛復用在應用內的多個場景,例如新聞內容無論是文本、圖片還是短視頻,都可以借用IM應用中常見的卡片氣泡形式,以最小的認知差異實現較為豐富的功能。此外,小遊戲、地圖、富媒體、直播等功能同樣可以有效地嵌入在卡片式氣泡中。下面是一個公交查詢場景的例子(只是示例交互形式,就不過多糾結視覺細節了)。

2. 信息密度低,體驗輕量化

原本高信息密度的頁面被一個個熟悉的消息氣泡切分成了低密度的信息碎片,有助於降低理解成本和打開應用的心理負擔,更容易搶佔用戶的碎片時間。有如一位永遠在等著你的朋友,即聊即走。

3. 擬人化、情感化的加成

再優秀的導航和搜索功能,也不如一句貼心的、像來自朋友的問候更有溫度感。例如一個音樂推薦應用,當判斷用戶表達了沮喪情緒後,在推送一首治癒的歌的同時,說上幾句暖心的話,也許就能讓用戶永遠記住這一瞬間的感動。

而一個趣聞推送應用,字裡行間夾雜比較「皮」的吐槽和時下最熱門的表情包,可以有效拉進與用戶的距離,甚至引起在社交媒體上的二次傳播。

4. 瀏覽記錄以聊天記錄的形式存儲,可以按時間和類目維度便捷地回溯

在會話式界面中沉澱下來的訪問記錄,天生具有「聊天記錄」的屬性,有賴於主流IM工具的培養,用戶幾乎不需要任何學習成本,就已經對「聊天記錄」的回溯功能瞭若指掌。這點可以一定程度上彌補會話式界面的最大短板——信息檢索效率,等價新聞、音樂、電商類應用中的「足跡」功能。以一個文藝類推薦平台的為例,按「聊天記錄」形式回溯訪問歷史將會非常方便。

3.2 劣勢

概括會話式界面的的劣勢,一句話就足夠——效率太低了。低信息密度是會話式界面的優勢,卻也決定了瀏覽效率的天花板。

1. 導航檢索效率

會話式界面中缺乏層級的概念,難以主動檢索層次複雜的信息結構。而如果每個都通過選項去遍歷,又像極了電話自助服務「×××請按1……×××請按9」的糟糕體驗。

用戶或許願意為會話式界面更友好的體驗承擔一定範圍內的效率損失,但絕不會願意看到損失如此巨大。

雖然在優勢的部分提到過,按時間類目回溯是會話式界面的優勢,但按信息層級流轉和回溯,在缺乏導航的會話式界面中難度非常大。例如,可以按對話一步步為用戶推薦符合「文學/小說/日本/懸疑」的書單,但如果用戶想回退到「文學」類目,會話式界面中即使能相出相對輕的解決方案,也遠不如層級導航來得方便。

2. 信息比選效率

對一個用戶需要頻繁地對全部信息進行主動排序、比選、篩選的場景,會話式界面是難堪大任的,比如一些高信息密度的綜合性平台。

曾經倍受期待的「顧問式對話購物平台」Operator如今已經下架,在國內只剩下曾經為人津津樂道的Demo圖。

其實,從我們的生活經驗中就很容易想到,店員推薦的東西,即使能做到非常準確的量身定製,仍然不可避免地引起「為什麼不給我看看其他的,是不是把滯銷的推薦給我」這樣的疑問。國人購物喜歡的關鍵詞是:「東西全」,「貨比三家」,「別跟著我」,Operator的會話式購物幾乎三樣都是逆著來的。更何況一個過於簡化的購物流程,在訂單處理、售後等方面會帶來用戶很自然的不安全感。

至於其他例子,金融理財類工具更無須多說,一個表格和簡單的篩選、排序控制項就可以完成的基金比選功能,想在會話式界面中實現簡直有如登天。

3. 深入配置效率

例如創建一個會邀,在會話式界面中,系統只能先按照默認設置創建一個符合時間要求的邀約,很難一次性設置清楚會議主題、會議室、參與人數、會前提醒、是否需要投影等信息。逐一以一問一答的形式完成這些設置,效率上遠不如一個設置表單來得簡單直接。

點擊卡片後進入一個表單內頁進行設置,大概是最可行的辦法,可本質上只是一個礙於會話式界面效率限制,不得已的折中方案。

4. 語義識別效率

並非所有場合下,都適合把用戶的表達限定在窮舉的幾個選項中,很多情況下用戶都不可避免地需要通過文本或語音直接輸入自己的意圖。

而問題在於,目前的語義識別能力遠沒有達到理想的水平,對複雜的漢語體系更是如此。同一句話可能對應不同含義,不同種說法又可能對應同一種意思。

「輸入識別為主,分支選項為輔」可以在主體語義理解正確的前提下,用數目有限的選項解決末端「臨門一腳」的分支確認,但對非常模糊的情況,仍然很難處理。

4. 哪些場景適合採用會話式界面?

結合優缺點分析,我們可以試著得出這樣的結論:會話式界面適用的,多是信息密度低、無需主動比選/是按選,且被動瀏覽時間大於主動檢索時間的場景。

回想一下目前扎堆的幾大類型,新聞客戶端、會話式小說與遊戲、翻譯和搜索工具,無一不符合上述特徵。

那麼,按照這樣的指標,我們可以嘗試反推,還有哪些新的場景可能有會話式界面的用武之地?

其實在剛才分析優勢時的一些示例里,已經簡單(不負責任地)開了一些腦洞。例如,由Quartz、「下文」這類精選新聞推送很容易想到,在新聞之外還有許多內容類型都可以暢想類似的推送形式,像書影音的個性化推薦,隨聊天時用戶的心情具有高度應變能力的音樂推薦,根據用戶偏好進行熱門的短視頻推薦,體育或遊戲的戰報推薦等等,都是可以切入的細分領域角度。

此外,實時信息(例如公交、餐飲排位與訂餐)的查詢,都符合低信息密度且無需過多比選的要求。諸如此類的腦洞,不再過多的列舉。感興趣的讀者也可以根據會話式界面的特點,自己嘗試思考一些可行的場景。

至於個性化演算法是否這麼給力,回答時根據用戶語氣的應變能力是否能真的如Demo中那樣貼心,這些問題個人覺得永遠不是產品設計者需要在腦暴階段思考過多的。

許多技術變更是由產品訴求驅動的,一直走在技術後面的產品不會是什麼好產品。

5. 未來

對會話式界面這個優勢和短板都非常鮮明的交互形式而言,未來方向一定是萬變不離其宗的「揚長避短」。

先談「避短」。

信息傳達效率是一個註定無法迴避的短板,且這種植根於優勢另一面的劣勢,很難徹底地優化改進——真的改掉了,也就不是真正的會話式界面了。可以考慮用巧妙的方式將圖文卡片、音視頻、小遊戲或其他輕量級的交互事件嵌入氣泡卡片,在一定限度內增強對話氣泡的承載力。但這裡想講的一個觀點是,不要缺乏克制地把什麼功能都往氣泡上做,過猶不及,信息過載的氣泡失去了氣泡本身輕量友善的特質,又無論如何不如一個完整的GUI頁面效率更高,兩頭不討好。

再談「揚長」,三個關鍵詞,分別是溫度感、真實感和準確度

1. 溫度感

首要的,就是在上文已經強調了很多次的「溫度感」。如果說「讓機器說人話」的課題其實在單純的Chatbot時代已經解決了的話,「讓機器說朋友般的話」的課題,就是會話式界面乃至智能語音領域接下來要面對的課題。

  • 為什麼用戶明知會話式界面的種種局限,要捨棄成熟、高大全功能,來使用你的產品呢?還不是相比那些精確但冷冰冰的導航,一句句或貼心或有趣的對話更有溫度感、更友好,對廣袤天地間一個個時常感到孤獨的靈魂來說,有一個懂自己的獨家摯友是多麼棒的一件事。
  • 要做到「溫度感」,要求機器對自己的表達有出色的潤色能力,個性化應答背後的演算法,和懂用戶的文案(會話)設計同樣重要。
  • 主動聯繫用戶:會話式界面是一定要求產品主動去聯繫用戶的,因此保證用戶喜歡(至少不排斥)產品的推送至關重要,對培養用戶黏性。尤其要通過特別提醒防止用戶在一開始就關掉了推送。

2. 真實感

  • 對話本身的真實感:用一個不怎麼恰當但很通俗的詞來說,就是要教會機器「見風使舵」,語義識別的準確度只是一方面,對同一分支有足夠數量的應答方式同樣很重要。還是以針對不同心情的音樂推送為例,不要讓用戶每次表達失落情緒時,得到的都是一模一樣的回答。至少要保證除非用戶刻意測試,不應該讓用戶輕易摸清應答套路。這一點說起來簡單,而如果回答通過整句實現的話,很難在文案設計成本有限的情況下,準備無窮多種答句。因此,用「組詞成句」的方式讓機器用不同的排列組合造句,是一個更有效的解決之道。
  • 訂閱推薦數量的真實感:對訂閱推薦類的會話式界面應用而言,可以考慮通過限定一定時間段內的條目數,營造稀缺感。參考真實生活中就很容易理解,即使再好的朋友,也不會是無窮無盡的話嘮。即使再有趣、博學的人,也不會如搜索引擎般具有無限的存貨。適時地告訴用戶「暫時沒有更多推薦了,等我想到了再來聯繫你哦」,而不是無止境、機械地滿足用戶的推薦要求。
  • 推送的真實感:推送內容莫非真實IM中的消息,口吻模仿相熟友人的語氣。時間間隔也要參照真實情況,避免缺乏情感、難以吸引用戶興趣,或推送過於頻繁、時間點(半夜)錯誤,導致過度打擾用戶,促使用戶關閉推送。

3. 準確度

溫度感和真實感針對的都是機器的表達,而表達的前置條件是更好地理解人類自然語言。

一個會話式界面應用要適應更多變的場景,單靠選項的局限性是非常大的。未來向智能語音發展的遠景,也勢必要求機器能正確地識別並理解人類的自然語言。

  • 已經卓見成效的第一步:對語義識別的第一步——正確判斷領域和基本意圖來說,許多產品目前現在已經做得不錯了。
  • 關鍵屬性提取:而接下來,如何根據語法和關鍵詞,提取各種有效的屬性?時間、地點、心情描述這些「傻瓜都知道的」關鍵詞自然是基礎中的基礎,而靈活多變的人類語言中更多隱性信息的提取,則是語義識別中需要持續面對的難關。例如,語氣詞「喲呵」帶有質疑的成分,顏文字「→_→」、emoji「微笑」和(我最愛用的)金館長熊貓表情包,都表達了豐富的隱含信息。
  • 提升容錯率:結合上下文,提高容錯率,讓更符合日常習慣的模糊口語化輸入也能被正確理解,是另一個難點。
  • 用選項解決末端問題:前面提到會話式界面應用如果純粹依靠選項,局限性會非常大。但不代表選項沒有用處,Google Assistant就為選項的用法提供了一個極其簡單但正確的範例。在用語義識別確定了90%的真實意圖後,用選項解決「最後10%的距離」可以有效縮減分支、減輕語義分析負擔。

關於會話式界面,或者脫離界面束縛的會話式語音交互,有什麼問題和暢想,都歡迎在評論或者留言中一起討論。期待聽到更多腦洞,沒準這就是一個有趣的應用誕生的起點:)


推薦閱讀:

設計師和產品經理誰重要
Audi acion-APPUXUI Design
首發 | 這 5 個關於用戶體驗設計的觀念,都不是正確的 #037
一瞬是多少秒

TAG:交互設計 | 用戶體驗設計 | 人工智慧 |