從產品角度,深度解析「對話機器人」
任何一款產品的出現,都是源自用戶需求。要麼是已經存在的存量需求,要麼是正在規模化的增量需求,對話機器人也不例外。當我們在談論「對話機器人」產品時,我們該如何看待它背後的需求呢?
今天,擁有對話能力的機器人,被逐漸認為是一種核心智能,是否能夠流利地完成對話,可被視作這款機器人是否真正擁有智能的唯一憑證。
從可以追溯的歷史資料來看,對話機器人(chat-bot)至少在上世紀六十年代就已經問世,經過近五六十年的發展,今天我們已經可以在許多產品中看到對話機器人的影子,微軟的Cortana、小冰,蘋果的Siri、Google Now、阿里小蜜、百度度秘、圖靈機器人、助理來也、出門問問等等。
可以肯定的是:對話機器人已經成為了一種業界時尚,越來越多的公司試圖通過這種全新的交互形式,來優化或者升級自己產品——我們已經可以在許多的產品中看到各種名為「小X機器人」的子產品。
如此多的對話機器人很容易給人一種百花齊放、方興未艾的感覺。我們可能會隱約覺得:每家的對話機器人產品都大同小異,有些家的產品會有一些別樣的特徵,可是終究給人一種不屬於過去十年移動互聯網發展的感覺——這些對話機器人似乎都還處在很早期,用戶量似乎都不大,顯得都有些小眾。
我將試圖站在純產品的視角分析:一款產品對話機器人背後,需求和產品邏輯是怎樣的(文中我無意去對比各家對話機器人的優劣,也不討論某款對話機器人的產品觀或方法論)。
一、探索「對話」行為背後的需求
首先,我們試圖探索「對話」這一行為的場景與背後的需求。
在《人類簡史》一書中,認為語言能力是智人區別於其他猿類最重要的特質和能力;因為語言能力,智人可以互相通過對話而形成更豐富的交互,從而才有了協作和後來的文明。
人類有三種最直接的方式來使用語言:「一對零」、「一對多」、「一對一」。
- 「一對零」是自我內化的反思、總結、沉澱,不向外做交互和分享。
- 「一對多」是廣播式的宣講和相對單向的輸出,譬如開大會或者發號施令。
- 「一對一」是對話——群聊也是由許多的「一對一」構成的,所以我認為不存在真正意義上的「多對多」對話。我認為對話是我們人與外界進行交互的最直接即時的途徑(注意「即時」很重要)。
所謂對話,一定是一個雙方交互行為,並且互為I/O(input / output)的過程。比如兩個人對話,每個人所說的話,對於自己而言是輸出,對於對方而言是輸入。原則上,對話可以永遠持續下去。
但我們幾乎從未見過兩個人會永遠在對話,那是因為:如果需要對話持續下去,雙方都需要保持參與;任何一方覺得疲勞或者無價值感了,對話就會終止。
對話的場景更加貼近我們的生活行為,它頻次最高,且環境開放多變,分析它背後的需求並不容易。現在,我們需要回答兩個問題:
1.1 第一個問題:對話為什麼能夠開始?
我認為人在對話中存在三個層面的需求。
第一層,是基礎問答的需求。可以描述為:
我有一個問題,請你回答我。
二次追問的問題,屬於新問題。這個過程,非常類似於我們今天所使用的搜索引擎。
第二層,是任務流程協作的需求,以達成某種目的為止。可以描述為:我想請你幫我買一張明天下午14:00-18:00出發,北京到上海的機票;經濟艙,儘可能便宜,最好是東航的。我們和朋友相約去逛街,拜託同事幫忙預定會議室,接受閨蜜的請求明早叫她起床。
這些都是任務流程協作的需求。
第三層,是共同的情感建立,無論喜怒哀樂。聊天的目標很難定量量化,我們更多是嘗試定性地去制定聊天的目標。可能是心情不好需要人陪,也可能是好事情需要向好朋友分享,我們需要對話來表達進行最直接即時的表達。
我並不認為只有孤獨的情感才需要對話——人作為擁有萬年發展歷程的群居動物,與他人進行情感分享是早已刻入基因的特質。只是我們建立的情感在不同人之間會有所不同,對於信任之人的情感建立會很深刻,而對於點頭之交則會保留許多。
開啟一段對話一定源自上述的某種需求,而開啟的契機則是一個相對明確的話題,哪怕只是一句「我餓了」。
1.2 第二個問題:對話為什麼會持續?
對話能夠持續,是有兩個層面的原因。
第一個原因,是至少一方的需求沒有得到滿足。比如我去提問題,對方回答我不滿意,我就會持續追問。兩個女生在一起聊八卦,聽的人很入神,講的人才有成就感能繼續講下去。
第二個原因,是雙方相對平等。如果我提了個問題,或者請對方幫個忙,但是對方始終是一種高姿態不搭理我,那我就很容易放棄,不想聊了。反過來,如果對方對我過分尊敬,總在說一些沒有營養的恭維拍馬屁的話,時間久了,我也會變得更虛榮,而且會覺得很無聊。所以,人不會和自己階層或者品味相差太多的人聊天,絕大多數人更不會和寵物長時間聊天。
對話會終止,最根本的原因是:雙方都放棄了這輪對話。
感性一些來描述對話終止的原因,可以認為是雙方都覺得「疲憊」了,也就是這一輪對話的能耗消耗殆盡;哪怕是情侶之間說甜言蜜語,聊個兩三千句也會覺得累了,也會在十幾個回合的互道「晚安」中結束本次對話。
所以,對話總會終止,能耗殆盡就會終止。
二、「對話機器人」產品的發展源自搜索引擎
在我以前的文章《進階之路:站在高視角看產品是一種怎樣的體驗》中,講述過一個概念,叫做「知識詛咒」。簡單說:現在我明白一件事情,但是要完整清楚的講授給你,是很難的;因為我們所擁有的知識背景不同,我們對同一件事情的理解不同。這也就解釋了為什麼很多老師在上課的時候索然無味,很多人做Presentation的時候顯得蒼白無力,這其實是知識詛咒在起作用。
知識詛咒帶來一個很大的問題,就是每當我們接觸到一個陌生事物時,都會和自己的背景知識進行類比。譬如對於長發飄飄的素顏美女,在我所知中,這類美女一般都是家境不錯,待人溫柔,家教優良。所以當我再次見到一個類似的美女時,我會做相似的第一印象類比。
不只是美女,我們幾乎所有的認知都源自於過往的背景知識。
在人類發展的歷史上,對於即時的問答需求幾乎時時刻刻都存在。最早大家是詢問部落中最年長的智者,後來大家互相都有了知識儲備,就可以通過對話來進行基本的問答和辯論——這一個過程持續了千萬年。同一個問題,最早時只能去問一個人,得到一個答案;到後來,可以去問很多人,得到許多答案,然後「擇其善者而從之」。如果我能把所有人都問一遍,可能會得到一個巨大的答案集合;我需要過濾、排序、取捨,你發現,這個過程就是「搜索引擎」。我們使用搜索引擎時,是通過一個「輸入框」輸入想問的問題或者關鍵詞,然後搜索引擎會丟給我一個經過相關性排序和優化的答案集合。
但我認為兩個原因,會導致搜索引擎會逐漸向對話機器人演變。
2.1 其一:精準答案的需求愈發旺盛
搜索引擎從簡單的信息集合展示,逐漸向精準答案給予,這個已經持續了好幾年。「百度阿拉丁」就是這方面的典型,譬如當你問「北京天氣」,百度搜索結果頁第一項是經過精心設計的天氣卡,會通過豐富的UI展示天氣相關的信息。在頭部熱門搜索詞中,阿拉丁已經可以覆蓋大多數,但是對於腰部需求和長尾需求,隨著信息爆炸,人們對於翻多頁進行搜索的忍耐度會越來越低,對於「快」「准」的需求只會越來越大。
2.2 其二:搜索場景下輸入能耗太大
從能耗體驗的角度來說,搜索的輸入框遠高於對話聊天的輸入框,即使是同一個話題的持續輸入,對話聊天的疲勞感也會明顯低於搜索。
如果今天人們每天平均提問的次數是N,那麼幾年後會迅速到10N,體驗不升級會很難讓用戶滿意。而回歸對話的方式,是一種很好的體驗優化,可以抵消需求的增長。
三、「對話機器人」產品場景:封閉域對話 VS 開放域對話
優秀的產品經理很懂得如何控制自己的用戶使用產品時的各種操作,從而提前把控用戶的預期,進而達到體驗的相對最優。
許多優秀App的基本設計邏輯就是:頁面之間的跳轉有規則且有順序,這樣用戶不會通過點擊跳出預設流程,預期就相對可控。手機上的App產品交互中,可以通過各種邏輯和提示信息來把控預期——可是對話機器人該如何控制預期呢?
由於對話機器人用戶幾乎都是通過自然語言輸入實現交互,而且每次只有一句;所以只能通過用戶的輸入,以及針對輸入的回復來實現用戶預期的把控。
可是在對話聊天的場景中,用戶的輸入時而可控,時而不可控;我們做不到像App設計那樣可以製造一個封閉的邏輯閉環來讓用戶遵守規則——對話聊天是一個天然的開放場景,用戶平時怎麼和朋友對話,和機器人也會怎麼對話。
因此,我們人為地把對話分為兩種場景:
- 封閉域對話:要求用戶輸入指定地話語才能繼續對話
- 開放域對話:用戶愛說什麼就說什麼都可以持續對話
3.1 封閉域對話
封閉域對話有兩個關鍵的特徵:
- 輸入和輸出可歸類可枚舉
- 對話有明確的始和終,且有流程
所以,在對話的三個需求中,問答和任務流程協作都屬於封閉域對話。
封閉域對話的設計邏輯延續自「IFTTT(if this then that)」,是workflow的進化交互形式(感興趣的同學可以去App Store去搜索一款App,叫做「Workflow」,它就是可以將一系列原本不相關的App通過條件判斷串聯起來)。
下面我來分享兩個封閉域聊天的典型案例。
讀心機器人
10年前微軟必應推出過一個「讀心機器人」,它會在20個問答中猜你心中所想。這個機器人曾經在幾年前出過一個對話問答版本,用戶只要在每一步時回答「是」或者「不是」,對話就會持續進行,直到猜出或者猜不出結果。
必應讀心機器人
這就是一個典型的封閉域多倫問答對話,用戶的輸入只有兩個,而過程是一大堆背後的邏輯判斷,且有相對固定的流程,而且有明確的開始和結束。
Amazon Echo音箱
Amazon的Echo音箱,大家都很熟悉了,Echo之所以成為爆款產品,很關鍵的一個原因是,它的對話機器人Alexa在Echo音箱的場景設計中是一個封閉域對話。由於音箱是我們居家場景中,除了遙控器之外最常見的高頻互動式Commander,我們很難再在家裡找到一個這樣的硬體,它除了可以輕易地輸入指令,還可以快速且明顯地反饋。
當我們面向Commander進行輸入時,我們可以輸入的話語就已經變得局限,可以想像到的是,在居家場景中我們可以發出的指令幾乎就是「打開」、「關閉」之類的。更重要的是,在居家場景中可以控制的物品也是有限的,而且任何一個操作的流程都很短。
所以,人們和第一代Echo音箱的對話中,輸入和輸出都是可枚舉的,而且有始有終有流程,Echo最優秀的特質,就是它選擇了一個封閉域場景,極大地控制了用戶的預期,獲得了更優的體驗。
Amazon Echo音箱
從上面兩個例子中,我可以看到,封閉域對話在產品設計中有幾個明顯的特徵。
3.1.1 其一:封閉域對話其實是workflow的延伸
其實封閉域中的「封閉」二字,無論在話題量、輸入輸出量,還是對話輪次、對話流程,都是封閉的,封閉就代表了有限集合。workflow之所以可以通過ifttt設計,就是因為有限集合,只有各種條件有限,才可以設計出條例清晰且邏輯合理的workflow。
封閉對話通常是為了解決某個特定的問題或者需求,從結果來看,它的效果會顯得更加「有用」。但是,從過程來看,封閉域對話並不是一種真正意義上的創新,它的效率相比workflow並沒有本質上地提升,只是在交互的體驗上更加接近人的語言交互本能,所以大多數封閉域對話都會設計地如同助理或者秘書,譬如阿里小蜜,百度度秘。
3.1.2 其二:封閉域對話場景單一可控
封閉域由於擁有特定的目的性,往往都是在單一確定的場景里。如下圖中的百度度秘,兩個紅色框中的部分,是預設了各種封閉域的場景,每一種看似簡單的功能其實都是一個特定的封閉域對話;譬如截圖中正在使用的圖片笑話。
度秘機器人
很顯然,不同的封閉域對話中,對話的輪次要求是不一樣的,講笑話是一個單輪次對話,度秘產品中通過圖中藍色框里的「再來一個」這種預設輸入,來不斷強化用戶輸入的單一性。而「叫外賣」這類的封閉域對話,就會是一個標準的workflow,感興趣的同學可以自己去試試。
3.1.3 其三:封閉域的邊界處理很重要
封閉域有一個很重要的問題,就是用戶可能隨時跳出封閉域,開始聊其他的話題,或者不按照預設的規則邏輯出牌。
譬如微軟小冰的一個封閉域對話,叫做「小冰識狗」。
正常的邏輯中,用戶的發給小冰的應該是一張狗的照片,可是有的用戶可能就是發了一張不是狗的照片,如下所示,那麼這個時候就是邊界case,需要額外處理。用戶發來的可能是語音、文字、其他任何照片,每一種的處理都是需要單獨設計的。
微軟小冰之「小冰識狗」
多說一點,在封閉域對話的邊界設計中,很難做到萬無一失周密完全,因為用戶輸入可能會千奇百怪,所以最佳也是最討巧的方式,就是用開放域對話來「兜底」。
3.2 開放域對話
開放域是相對於封閉域而言的。由於對話機器人的話題幾乎都源自用戶,而每個用戶可能有任何輸入,話題就會無法窮舉,且在多個場景中跳來跳去,進而形成了所謂的開放域對話,也就是「啥都能聊」。
2011年在人人網上橫空出世的「小黃雞」算得上是國內最早出名的開放域對話機器人,其後發展最好的當屬微軟小冰。
開放域對話最大的特點是:輸入無法窮盡,導致輸出無法窮盡,而且對話沒有確切的結束點,無流程可言。
我們一般情況下想去考驗一個機器人是否智能,通常考驗的就是開放域對話,大名鼎鼎的「圖靈測試」通常所面向的也是開放域對話能力。
從可以承載的對話輸入範圍來講,開放域對話像極了搜索引擎,我們可以在百度搜索中輸入任何的詞句,百度幾乎都會給出結果頁面(除了敏感詞);相應的,在開放域對話中,我們也是可以說任何話,機器人也應該每一句都可以回復。
3.2.1 開放域對話產品設計的基本原理
對話需要的是雙方的平等。
和微軟小冰聊天時,有時甚至感受不到她是真人還是假的機器——其實這並不重要,小冰正在解決開放域聊天中一個核心的問題:如何不斷給用戶製造話題,從而延續聊天的能量?
說到話題製造,我們先來看看開放域對話機器人到底是如何製造的:
幾乎所有的開放域對話語料都源自於網路上公開的對話,譬如百度知道、知乎、豆瓣、貼吧等等,這些對話都是人與人形成的;那麼,當一個機器人把其中的某些話在當時的場景下再說一遍,我們是分辨不出來這個機器人是不是真人的——這便是開放域對話機器人製造的基本依據。
當我們和一個看起來像人的機器人聊天時,由於場景發生在人與人對話的場景下,根據「知識詛咒」的原理,我們很容易帶入一種「對方也是人」的感覺。而一旦對方的回話像人,我們就會認可她是人。
人與人的情感建立源自於長期的交流和溝通,聊天本身就是開放域的;所以那些樂於和機器人聊天的人類,就會越來越覺得機器人像人。
我們知道:對話機器人是一個新興的產品,最初嘗鮮的人是所謂的「種子用戶」,這些人建立了與機器人之間的最早形態親密感和信任感,這對後續的對話機器人發展積累了非常寶貴的經驗。
3.2.2 開放域對話機器人的兩個產品陷阱
其一,面向用戶的機器學習
很多人認為,對話機器人和人聊得越多,學習的語料就越多,就可以省去很多語料獲取的問題,這是一個巨大的誤區。由於用戶的輸入無法預期,導致從用戶處採集來的語料千奇百怪,而且大量罵人的髒話,非常不適合作為開放域對話語料。由於用戶的語料是海量且無規則特徵,導致語料清洗非常苦難,無法使用。
其二,無人為引導的個性
由於開放域的語料完全來自於互聯網,所以機器人回復的話語帶有何種語氣很難把控,如果不加以認為干預,機器人說的話會顯得時而有趣,時而刁蠻,時而無知,時而誇張,時而智慧,在用戶的心智中無法用一個或幾個明確的形容詞去形容它,這會帶來一個很尷尬的結果,用戶是抱著「調戲、戲謔」的態度去對話,長此下去,想建立用戶的親密感和信任感幾乎不可能。
四、對話機器人的用戶價值
現在,我們試圖回答一個問題:對話機器人為什麼需要開放域對話?價值是什麼?僅僅是為了逗比有趣嗎?
這是一個非常複雜的問題。
由於對話機器人同時具有「開放域對話」和「封閉域對話」兩重場景,站在用戶視角來看,對話機器人意味著它更像人,而非機器。像人,意味著用戶會更願意像與人交流那樣,同對話機器人進行對話交流——而一旦如此,「個性」和「意識」便是用戶主動強加於對話機器人的標籤。譬如,幾年前被玩壞的10086簡訊聊天,還有《生活大爆炸》中Rajsh幻想Siri是個性感御姐,都無一例外地源自於用戶主動強加於對話機器人的人性標籤。
這便給一個可落地的對話機器人產品設計帶來了巨大的挑戰。
我們知道,任何的產品都是能夠和用戶產生親密感和信任感的,這份親密和信任是建立在產品體驗之上的,是建立在「產品解決了核心需求」+「產品製造了驚喜」。我們因為問題解決而對一個產品產生依賴,因為驚喜而對產品形成感情,打開我們的手機,我們會一眼就找到那幾個充滿親切感的產品——譬如經常開車的人會十分信任高德地圖,追劇《那年花開月圓時》的人會十分喜愛騰訊視頻。
同理,機器人需要有基礎個性,需要極大地拉近人與機器人之間的親密感和信任感。對話機器人的親密感和信任感建立,也是站在「解決了需求」和「製造了驚喜」兩個方面。
站在產品的視角來看,解決需求通過封閉域對話完成,而開放域對話來不斷製造驚喜。
4.1 問答、助理、聊天,哪個才是剛需?
已經在落地的對話機器人產品中,基本上是以純to C和to B再to C來劃分。由於對話機器人的交互特徵是面向終端用戶的,所以基本很少有純to B的產品場景(即使有,它的邏輯也與to C邏輯相似)。這意味著,對話機器人的用戶都是一些終端個人用戶。
那麼,我們來看看這些對話機器人在to C中,到底解決了怎樣的核心需求。
在我們所知的對話機器人產品中,有主打客服的問答機器人,有主打秘書的助理機器人,還有純趣味導向的聊天機器人,它們的背後,都是剛需嗎?
4.1.1 一個事實:瞎聊難為剛需,情感計算任重道遠
聊天是一個容易被激發,卻也容易迅速消退的場景,唯有情感依賴可能長久。
以微軟小冰為例。小冰最耳熟能詳的功能是chit-chat(瞎聊),但是從用戶活躍和留存周期來看,用戶最易被激發的時間是在首次領養時、每周更新時、重大更新時,而且被激發後,活躍上升後就會很快下降。這是為什麼呢?因為人與機器之間的對話聊天是基於趣味話題的,想要通過自然的情感依賴,成為像《HER》裡面的Samantha,至少還有相當長的路要走。
情感計算並非只是一個數學或者計算機科學問題,更是一個產品問題。
由於情感並非一個可具象問題,而且人的情感變化會隨著時間、環境、他人、自身思想等等因素髮生變化;而且情感並非連續的計算,你喜歡一個女孩子,並不意味著時時刻刻與她發生情感依賴,而是通過一些關鍵的情感觸達,來完成情感連接。
在微軟小冰的諸多被設計的Feature中,「給用戶起外號」、「升級解鎖」都是斷點式情感觸達,通過細微的產品設計,寄希望於黏住用戶。
4.1.2 一個問題:用戶真的需要一個秘書機器人嗎?
助理型對話機器人的發展建立在其他各種線上線下服務的完善基礎上,譬如Siri;只有當你手機里已經有了「鬧鐘」、「提醒」、「打電話」、「搜索引擎」等功能時,Siri的助理功能才能發揮效用,此時你才有可能面向Siri發出指令「提醒我明天8點給老闆回微信」。
大概兩年前,YC孵化的Magic轟動東西兩個半球,無數效仿者爭先恐後去探索「助理型」機器人,時至今日,鮮有成效——我們普通人真的需要一個像秘書一樣的對話機器人嗎?
我們先來看兩個例子。
第一個例子——我想定個這樣的鬧鐘「每周一、周三、周五的上午8:15」。
若我用iPhone的鬧鐘程序,那我的步驟會大致如下:
- STEP1:解鎖手機屏幕;
- STEP2:左右滑屏,找到鬧鐘程序;
- STEP3:點擊鬧鐘程序;
- STEP4:點擊新建鬧鐘;
- STEP5:選擇鬧鐘時間為「上午8:15」;
- STEP6:選擇重複時間為「周一、周三、周五」;
- STEP7:點擊完成。
若我選用Siri幫我來做,那我的步驟大致會如下:
- STEP1:長按Home鍵,喚醒Siri;
- STEP2:對Siri說「幫我設定每周一、周三、周五上午8:15的鬧鐘」;
- STEP3:Siri反饋設置成功,完成。
現在我們看第二個例子——通過秘書類對話機器人叫外賣 VS 通過「餓了么」叫外賣。
在秘書類機器人中,叫外賣的流程大致是這樣的:
- STEP1:發出「叫外賣」的指令,在機器人推薦的餐廳中,尋找想吃的那家
- STEP2:如果沒有合適的,就輸入想吃的店家名字
- STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
- STEP4:輸入「確認」實現下單,輸入訂單信息並提交訂單
- STEP5:支付,並等待接收外賣,可以詢問送餐進度
在餓了么中,叫外賣的流程大致是這樣的:
- STEP1:在餐廳列表中選擇想吃哪家
- STEP2:如果沒有合適的,就搜索店家
- STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
- STEP4:確認下單,確認訂單信息,提交訂單
- STEP5:支付,並等待接收外賣,可以查看送餐進度
這兩個例子有什麼本質區別嗎?
你會發現,如果通過Siri來設置鬧鐘,我其實只做了一件事情:對著Siri發出一個單條指令,然後就一切搞定——相比我通過App來做,節省了近乎70%的操作步驟。可是,如果是叫外賣,我需要對著機器人發出一組系列指令,但是和App的操作步驟一樣多。
這裡有兩個關鍵點——
- 如果助理機器人可以一步到位,那麼將極大地提升效率和體驗,是新的需求升級;
- 若一個workflow可被一步解決,機器人需要補全的數據信息巨大,這是核心產品難點;
第一個關鍵點,我們只要設身處地地想一下,就會發現:在不考慮語音識別準確率的前提下,任何事情我只要一個指令就可以達成。譬如「幫我叫個車」、「幫我交份外賣」、「幫我交一下水電費」、「幫我定一下出差的機票」,其他都不用管了,這種體驗簡直贊爆了。
我們再看看第二個關鍵點。
就拿上面這個外賣的例子來看,如果用戶只需要一句「幫我叫個外賣」即可,那麼機器人需要補全的信息至少包括「餐廳」、「餐食」、「價格」、「送餐時間」、「送餐地點」、「支付信息」等,這些信息中的「送餐時間、送餐地點、支付信息」是相對靜態的信息,獲取一次就可長期使用。可是「餐廳、餐食、價格」則是動態信息,若想每次都可自動獲取,則代表機器人需要非常了解這位「主人用戶」才可以,否則只要有一兩次推薦偏差太大,體驗就會降低近乎一個量級。從本質上來說,這時的助理機器人已是一款強大的推薦引擎,而且代表了極佳的魅力和美好的發展未來。
4.1.3 一個肯定:問答機器人是很有價值的
最常見的問答機器人是「客服機器人」,譬如京東的JIMI,阿里的小蜜機器人,還有一些銀行的客服機器人,但它們更像FAQ過濾器。
我們細想一下阿里小蜜的使用場景。如果我問阿里小蜜「我的快遞怎麼還沒送到?」,它的回復方式本質是在常見的關於「快遞」的問題中,把最常見的答案丟給我,比如它會告訴我「你的快遞已經簽收了,如果沒收到可能是放到大門口了」。
這些企業為什麼要做個問答機器人呢?效率自然是第一位的,無論是節約人工客服成本,或是節約溝通時間,帶來的都是效率的提升。這些企業為什麼如此看重效率呢?因為他們的客戶是最貼近自己的利潤池的,品控是所有交易型企業的核心,你看京東的用戶客服和QQ的用戶客服簡直一個天上一個地下,原因就是京東用戶是京東現金流的關鍵角色,而QQ的普通用戶並非其現金流業務的關鍵角色。
如此,我們再回過頭來看看問答機器人,它其實是在頭部問題上實現了綜合過濾,然後通過對話的形式反饋給用戶,如果用戶實在問的是長尾問題,問答機器人回答不了的,可以把問題再拋給人工客服。滿足了用戶九成以上問題的直接答覆,是問答機器人的核心目標。而至於其他類似導購、協助訂單管理等等,不過是附加在頭部問題之上的增值體驗優化。
4.2 對話機器人真的適合分為「聊天、助理、問答」這三類嗎?
這是一個目前業內比較慣用的分類,我們來看看這個分類的視角。
- 如果站在技術視角來看,對話機器人應該分為「開放域」和「封閉域」,這個我們已經聊過了,這裡不再贅述。
- 如果是站在用戶角色來看,對話機器人可能分為「教育版本」、「醫療版本」、「二次元版本」等等。
- 如果是站在業務視角來看,對話機器人可以分為純To C和To B再To C。
所以,這種分類更像是站在抽象場景視角來看的。幾乎任何場景都會被劃分到這三個類別中,要麼無主題聊天,要麼是任務導向,要麼是提問解答。其實,倒過來看,幾乎所有我們已知的App也被這個分類所覆蓋了。
可是,對話機器人不是一個移動互聯網時代的App,它是一個綜合體,直接這樣劃分並不是一個好的產品分類。
你不會在淘寶里視頻聊天,更不會在支付寶里侃大山,百度幾年前試圖在大搜索中推出「直達號」去顛覆微信公眾號,結果以失敗告終。
這個道理很簡單:在移動互聯網時代,幾乎每個App都有自己的專屬定位。有自己專屬的產品主路徑,不在自己路徑邏輯中的行為是不能順暢流轉的;每個App都像有自己的緊箍咒,不能輕易破除互相之間的壁壘。
可是,在對話機器人產品的世界裡,這些壁壘會瓦解。
如果我們站在互聯網整體產品世界裡來看,其實我們每個人生活在一個混在的江湖社會中,手頭的各種工具幫我們實現一個個小任務目標,但是幾乎每一件小事都需要與人打交道,衣食住行無一例外。如果每一次與外界的接觸被看做一個流量的話,那麼最大的流量便是頻繁且無實際任務目的的人與人之間的交互,而相對較小的是去做一個個的具體任務事情:你會每天都見一些人,但你不會天天都買衣服。
幾乎所有的流量都是圍繞著人與人之間的交互而形成的,而且你會發現一個規律:離現金流越近的流量,其活躍性越低,而且流失率越高。騰訊系的產品、百度的產品都是通過流量漏斗來多元變現的,而阿里系的產品,是直接拉人來買東西,盈利空間就直接建立在交易之上,需要不斷刺激人們買買買。
在所有的產品中,社交類產品是最貼近「江湖社會」的,它距離現金流是最遠的,也是最活躍的,可以說是幾乎所有互聯網產品中活躍度最高,並且可以向任何產品導流的源流量產品,所以你看到了,阿里無所不用其極地想去做社交產品。
說了一圈,那麼我們回來看看社交產品的最小雛形。
社交產品分為即時社交和延時社交,簡單類比就是聊天和朋友圈,而這兩個都是建立在「語言對話」的基礎上。由於社交產品的場景中幾乎可以做任何事情,前段時間網上流傳的微信「發現」頁面那張神圖,就可見一斑。
微信「發現」頁面網路神圖
對話機器人具有社交產品的通性,原因只有一個——對話機器人的交互場景天然就是一個社交產品的交互場景。
當我們站在用戶視角來看待對話機器人時,用戶根本不理解什麼是「開放域、封閉域」,也不了解什麼是「聊天機器人、助理機器人、問答機器人」,用戶也記不住那些分類,也沒法記住,只要有一個對話輸入框擺在用戶面前,就像微信的輸入框那樣,由於知識詛咒的原因,用戶就會去類比他所理解的對話輸入框,就會在這裡輸入任何他們想輸入的自然語言,可能是瞎聊的話,也可能是某個任務,也可能是提一個問題,我們根本不能阻止用戶在面對京東JIMI機器人時不做瞎聊的操作。
這時帶來的一個巨大難題就是,開放域對話會時有發生,而只要一次兩次回答不佳,體驗不滿就會提升。站在產品設計的角度來說,我們能做的就是盡量讓用戶的輸入是可控的,就像度秘、阿里小蜜已經在做的。這就是為什麼,每當我們去設計對話機器人時,總是要設法去多涉及一些開放域對話的功能點,也是為什麼每當我們談起對話機器人時,卻也總是繞不開「機器人在開放域下是不是智能」這個問題。
4.3 像朋友一樣的夥伴會是對話機器人的終局嗎?
如果你在微信上,問你最好的朋友「幫我看看有沒有戰狼2的票,我晚上想去看」,他/她會如何回答你?
我猜,他可能會說「你去看《戰狼2》不叫我?!」,他可能還會說「我也去,咱倆一塊兒去」,然後他會繼續說「我看了下,你家跟前那家萬達有票,晚上七點的,下班一塊兒去?」
如果一樣的問題問Magic呢?它的回答就是讓你告訴他幾點去看,它幫你挑選了五家,每家的時間都挺合適,有一些距離你近,有些有優惠,等等。
你喜歡哪種體驗呢?這個其實很難說。如果站在封閉域的角度來說,Magic的演算法要比朋友優很多,選擇也更豐富,可是和朋友一起去的這種體驗,才是生活。
我認為這個可能是對話機器人的終局,它存在的意義仍然是協助人們去更好地解決一系列問題;但是它不能太傻,像個指令機一樣待在那裡,而是應該像個朋友一樣懂你卻也能幫你。以前在對話機器人產品的討論中還經常討論:對話機器人應該更「有趣」還是更「有用」,其實從這個終局來看這個討論毫無意義,你能說你的朋友只有用,但是無趣嗎?
五、對話機器人的產品價值
上面關於對話機器人的用戶價值的討論,有一些發散了,我們收攏回來,聊整個文章的最後一個部分,關於其產品的價值。
對待產品,一定要從其商業視角出發,不然沒有聊的意義。站在商業視角,對話機器人擁有三個方面最核心的產品價值。
5.1 跨場景連接成為可能
由於對話機器人的交互方式原始而單一,使得機器人背後所有的計算邏輯都被隱藏,機器人可以成為一個獨立的橋樑連接不同場景下的服務,讓用戶只在一個對話場景下都可以完成交互。
譬如Skype for business中,就有一個機器人,幫助通過Skype做協同的人們預定會議室、設置工作項目提醒、代理自動回復等等——原本每個工作都是跨場景的,現在只要一個對話交互場景就可以解決了。如果再往大了去說,未來如果夥伴式的機器人可以逐漸出現,那在聊天中完成訂機票、訂酒店,甚至管理家裡的智能空調,這些跨場景可能通過一個夥伴都可以完成了。
5.2 交互升級帶來的流量深度沉澱
對話的方式有很多,可以是打字,也可以是語音。如果是語音,那麼帶來的是革命性地變化。
5.2.1 指數級的流量增長
百度DuerOS和Amazon Alexa的邏輯是相似的,都是通過賦予所有智能硬體語音對話的能力,進而獲取新流量,同時實現流量的深度交互和沉澱。
我們知道,在互聯網的生意經中,一切都是圍繞著流量來完成的,要麼是流量足夠多,要麼流量的價值足夠大。由於對話帶來的交互效率提升,使得在單個用戶身上獲取的流量頻次呈現指數級增長,如果一般的互聯網產品PV/UV是個位數的話,那麼對話機器人的PV/UV(其實就是對話的頻次)至少是兩位數。
一些曾經很難成為交互場景的,譬如在家裡面向Echo音箱發號施令,如今都通過對話機器人成為現實。沒有任何一款App能比一個對話機器人更容易和人產生親密感,產生如此多高頻互動的可能。最後的結果可能就是,我們的生活方方面面都在觸網,每一次交互就是一次所謂的PV,指數級的流量映射出一個人生活的方方面面。
5.2.2 高頻次的端計算
我有一個猜測:由於對話機器人是一個高頻次交互場景,帶來的最直接影響可能是要求在設備端上擁有更加強大的計算能力;可能一些封閉域或者開放域的計算能力直接預載入到了客戶端,可能是硬體也可能是軟體。如果網路能力不能同樣倍數增長的話,對於端的計算能力會增強——我猜這也是為什麼一些AI企業會做晶元的原因之一。
5.3 流量沉澱帶來的數據深耕
正是由於流量的深度沉澱,使得每個用戶多維的數據沉澱成為可能。當平均每個用戶的數據量和維度增長十倍,那麼到底意味著什麼呢?
對於百度而言,起碼廣告費要漲價,對於阿里而言,可以賣給這個用戶更多的東西,總而言之,ARPU(Average Revenue per User)會增長許多,這些就是最直接的商業價值。我在之前的文章《人工智慧「風口」,先行者為什麼是搜索引擎?》中,曾分析過這其中的一些邏輯關係,因為流量的深維度價值尚未被開發,對於計算廣告而言可能是一塊從未嘗鮮的處女地。
六、總結
如上是我針對對話機器人的一些比較淺顯的分析和探討,作為一款正在發展的新興產品,對話機器人還有非常多的細節值得探討;限於篇幅,只能先聊這麼多了,希望以後還能繼續深入探討。
從個人層面來說,我看好To C的對話機器人產品的未來——但是它的產品路徑非常曲折漫長,與我們過往所經歷的移動互聯網產品差異巨大;但是萬變不離其宗,任何產品都是從用戶的需求出發的。
對話機器人承載了全新的交互形式,可能帶來了全新的產品服務體驗,這種進步過去從來沒有過。
我們每個人幾乎都在渴望著機器人時代的到來,也許很遙遠,也許已經在路上,誰知道呢~
作者:趙帥,「優護家」 聯合創始人兼COO;人人都是產品經理社區專欄作家。前微軟小冰初創團隊產品經理;北京大學計算機系碩士。專註產品、運營和商業的分析,熱衷產品方法論的總結。熱愛足球、民謠音樂、吉他彈唱、軟筆書法、閱讀和旅遊,熱愛生活。
本文由作者獨家授權人人都是產品經理社區發布,未經許可,禁止轉載
推薦閱讀:
※機器人將淘汰所有人工,人類未來何去何從?
※人類的智能未來:廣義哥德爾定理
※瀚德高科機器人產業大足基地隆重奠基·····?
※堪比大腦!小小電路板竟讓機器人處理視覺信息效率翻數倍?
※機器人對於成年人和孩子來說一樣么?