做手機語音助手太難了

解決用戶找爸爸的問題

有一天,我女朋友問我,你們在做些什麼事情,我說:我們在幫一個用戶找他的爸爸是誰。對,是的,有一個用戶,對著我們的語音助手說,我爸爸是誰?,就這個需求,我當時帶的一個實習生說,我們可以給他彈一個騰訊公益的網頁,說不定上面有找找親人的欄目可以幫到他,聰明,也許是一個解決方法。

但是我們看著這個東西,我們很好奇,到底還有哪些語句是用戶經常說,但是我們覺得他不會說,一些我們意料之外的東西呢?我們發現這樣的情況非常多,舉幾個簡單的例子:

「我的小狗叫什麼名字?」

「怎麼稱呼姥姥的妹妹?」

「世界上最好的智能手機是哪一台?

NBA西決哪隊會贏?」

在這些例子裡面,很多人的第一反應是這些語句都很瘋狂,都很少見,不是用戶的主要需求。或者會認為這些只是用戶想要閑聊的語句,給用戶回一句俏皮話就可以了。但是這些語句卻讓我思考這樣一個問題,手機語音助手的需求邊界在哪?

需求

關於需求,先問大家幾個問題。

第一個問題,你是否認為語音助手可以幫你打電話,發簡訊?

第二個問題,你是否認為語音助手可以幫你檢索並播放一首歌的或者一部電影?

第三個問題,你是否認為語音助手可以幫你打車 / 導航 甚至轉賬?

在回答這些問題後,你會發現語音助手沒有一個明確的需求範圍。

其實在剛剛的問題中,我們把手機移動端的需求分成了三個圈,第一個是基礎的通訊需求,比如手機 / 簡訊,第二個是娛樂化需求,比如播放視頻,播放一首歌。第三是提高生產力的需求,比如轉賬 / 打車 / 導航。

在這個維度上對語音助手進行歸類的話,語音助手應該處於這三個圈的交集。如果把手機語音助手一天的用戶 Query 列出來, 我們不難得出相同的結論。

我們回過頭看其他的 App,比如說提到滴滴,你會想到打車。提到今天頭條,你會想到看新聞。但是對於語音助手來說,這些都是用戶認為你應該滿足的需求。所以,手機語音助手難做的第一點是在於,語音助手相比其他 App 承載了給多的需求。

交互方式的不設限

自然而然地,我們會去想,為什麼用戶對手機語音助手的需求會這麼多呢?

我認為這是交互方式的改變是主要原因,這種改變帶來的是用戶自由度的變化

我們先來看一下 GUI(圖形用戶界面) ,現在打開任何一個手機 App ,你大概會開到這樣一個頁面,底下是幾個 Tab ,主頁面顯示當前 Tab 內容,右上角是更多按鈕。這樣的設計對於用戶來說,充滿了層次感,我們把這個 App 拆開,就可以發現他們功能之前的層次關係,最主要的功能在層級最上方,然後低頻的需求被隱藏到更多或者設置裡面。但是在 VUI(語音用戶界面) 裡面,它對用戶是不設限的,所有的功能都是依靠用戶獨自來觸發,對於用戶來說,這些功能是平鋪的,不帶指引性的。也正是因為這種不設限的方式給予了用戶住夠多的自由,讓這些在 GUI 下得不到釋放的需求在語音助手得到釋放。而這些需求轉化為語句,在我們看來就變成了那些意料之外的語句。

比如「飛去廣州,從北京飛還是從天津飛便宜一點」,這樣的語句,其實不是 GUI App 不能做,而是操作太複雜了,但是在 VUI 裡面,用戶會認為這就是一句話的事兒。

所以語音助手第二個難點在於 VUI 這種交互方式給予用戶更大的「發揮」空間。

信息

其實主要還是因為語音助手不智能,或者說nlp做的不好...

這句話其實對了一半,『 不智能 』的確是現狀,但卻不僅僅是 NLP 這一個方面。而更多的是『 語音助手擁有信息的豐富程度 』。

Hound - Say It. Get it.Hound - Say It. Get it. 是一家語音助手的公司,他們的產品 demo 視頻非常精彩,如『 告訴我在西雅圖四星到五星的酒店,我想住三個晚上,費用是$150-$250 』這樣的長句。這樣的句子已經能被機器所能『 理解 』,那剩下的問題是如何向用戶提供這些信息?

還是上面的例子,如果需要『 知道 』符合這些條件的酒店信息,首先語音助手得有這些信息。有了信息之後你才能找到『 在西雅圖的 』、『四星到五星的』等等符合這些條件的。現在的做法是用 Yelp Api 或者其他的 Api 來獲取這些信息。那麼一個語音助手擁有多少信息很大程度上依賴於它集成了多少 Api,以及這些 Api 能提供信息的豐富程度。

酒店只是其中一個例子,機票、電影票、日程安排、打車等等所有的這些服務信息幾乎都源於『 非語音助手內 』

這樣的信息,我們稱為『 非中心信息 』。

上面這段文字是我之前在 未來語音技術或者語音智能助手的發展方向是什麼? 這個問題下的回答,這段文字的主要觀點就是,語音助手用來滿足用戶需求的信息往往不是自己的。

而這樣的現狀會導致的問題是語音助手對初始信息沒有很強的控制能力,但又必須要求語音助手要對信息有很強的分析能力,以來滿足用戶的需求。好比你知道你要做什麼菜,但是又不知道別人給你的材料能不能用。兩個字:難受。

所以手機語音助手難做的另外一個點在於需要對信息有很強的把控能力。

寫在最後

《做手機語音助手太難了》這篇文章是在一個分享會上我的演講稿,起初寫這個稿子,定這個題目,目的並不是在於抱怨做手機語音助手很難,當然這些困難都是有對應的解決方法的(這畢竟是 PM 存在的原因),而我選擇不去講這些對應困難的解決方法,是因為,無論這些解決方法有多麼的精妙,都必須回歸與對於產品,對於用戶的理解。而我所寫的困難就是我對語音助手這樣一款產品最本質的思考。

我們需要銘記那些問題的根源,而不是它的答案。

作者小昭,前手機語音助手產品經理

題圖 Photo by Hal Gatewood on Unsplash

推薦閱讀:

辱罵語音助手
Win10怎麼開啟Cortana語音助手?
你不知道的智能音箱

TAG:語音助手 | 人工智慧 | 產品經理 |