聊聊chatbot對話機器人的設計
做了個對話機器人的項目,一直想寫一個項目總結,刪刪減減很多次,總是不滿意,直到看到「Done is better than perfect」,終於下定決心完成。會用兩篇文章去描述chatbot,這是第一篇,相對高維度,從交互方式、應用領域、實現方式以及未來的發展等進行概述;第二篇,實踐性更強一些的交互總結,從全局把控設計對話機器人。敬請期待。
什麼是Chatbot?
chatbot,很多人稱之為聊天機器人,我更喜歡叫它對話機器人,聊天只是其中的一個功能,而對話不僅限於聊天,還可以有更多的比如指令、操作、教育等可開拓的方式。總之,以人機對話為主要方式,在一問一答的對話過程中完成用戶指令、提供用戶所需要的幫助或者簡單閑聊等功能,以達到信息溝通的目的。從基本使用而言,產品的交互方式與之前的交互方式有了很大的差異,簡略比較如下:
- 物理操作是最基本的產品交互方式,每次交互會有相應的物理反饋,比如按下電話的數字按鍵,可以感受到按鍵的觸感、下壓、回彈、聲音、顏色等反饋,以撥出電話;
- 軟體界面操作,模擬物理世界的操作轉移到屏幕上,少了更直接的觸覺反饋,更加強化了視覺元素的反饋,比如撥打電話的App界面;
- 對話交互,通過一來一往的對話形式,完成某一個具體的操作和指令,給出的反饋也是和對話的形式,比如「打電話給張三」,「好的,正在撥打電話給張三」,一種新瓶裝舊酒的人機交互方式。
對話作為新的人機交互形式必然會帶來變革,尤其是具體到某些使用場景,對話的交互一定會有它的優勢。
Chatbot的應用領域
從對話的形式來說,有文字和語音,文字對話由於聊天APP的發展,已經讓大部分人養成了文字對話的習慣;而語言的對話更可以算一種本能,語音指令如「小明,把客廳燈打開」,我們每天都會接收和發出很多類似的語音指令。因此交互形式上,用戶的學習和使用成本是較低的,無疑是chatbot一個很好的發展前提。
分析目前chatbot的應用市場,沒有去年的如火如荼大肆發展,但是依舊餘溫未了,大致可以分為四大類: 陪伴機器人、業務機器人、資訊機器人和指令型機器人:
- 陪伴機器人主要市場在於個人助手、閑聊和兒童陪伴,
- 助手類包括siri、Google Asisstant、Contana、Echo等手機和硬體搭載的個人助手;
- 閑聊主要存在微信、QQ、Facebook等社交平台上使用;
- 兒童陪伴類一般都會有實體機器人。
- 業務機器人主要是垂直業務類和第三方整合類業務,
- 公司或企業搭載在公開平台(APP、網站)如slack、Facebook Messager上的品牌機器人;
- Slack上的各種工作bot助手,專註監督/完成某一件事情;
- 放置於自家APP或網站上使用解決基本業務問題的機器人,如阿里小蜜;
- 專註解決深度垂直業務的chatbot,比如財務智能機器人解決費用報銷審查過程漫長且反覆的問題;
- 資訊機器人包括有社交平台的諮詢機器人和新聞資訊機器人,代表產品Quartz,通過定製和熟悉用戶喜好,以對話的方式推送新聞。
- 指令型機器人的典型應用領域是智能硬體類,比如通過語音指令操作關聯智能音箱的其它智能家居設備。
Chatbot的實現方式
前段時間傳聞FACEBOOK的兩個機器人會用人類看不懂的語音方式互相對話,然後闢謠了;去年微軟放在Tweet上的Tay,在不到24小時內學壞,被關小黑屋。這兩個是對話機器人中的輿論網紅,將輿論提高到了「AI威脅論」。
還有很多普通的芸芸眾生對話機器人,比如電商智能助手,社交平台機器人,智能音箱中的對話系統等,離我們生活觸手可及,但是總感覺笨笨傻傻的,「離真正的智能還很遠」。
究竟是威脅還是笨,可以使用圖靈測試,不過從技術角度看,目前的chatbot實現方案主要有兩種,檢索匹配模型和生成模型。
- 檢索匹配模型需要有一個問題庫和對應的回答知識庫及回答模板。在用戶發出信息後,分析用戶表達的內容,通過一定的匹配規則,匹配到和問題庫最相近的問題,再給出相應的回答。匹配的過程中通過自然語言處理、機器學習等技術優化匹配方式,盡量給到合理的回答。
- 生成模型則不需要預設問題庫和知識庫,是通過大量的語料數據訓練,以學習語言元素的組成和表達方式,再分析組合生成回答。類似於我們學習說話的方式,自然地根據對方的話,生成回答。
生成模型的對話更靈活,更像人,但是依賴的語料數據的訓練、語言模型的建構、意圖的分析、生成的語言結構等不是特別完善,容易出現語言結構混亂語無倫次看不懂的問題;而檢索匹配式,需要更多的精力去維護問答知識庫,同時也會存在意圖識別不準,問東答西的情況,但由於實現邏輯相較而言容易實現,且問答是可控的,不會出現語言結構錯亂的問題。
根據各自的優勢,生成模型內容涉及可以很泛很廣,不局限於不斷維護的問答知識庫,目前看來更適用於閑聊娛樂等模式,檢索匹配模型,更適用於垂直領域信息的集合和知識的匯總,在一定的領域內,建立龐大的知識體系,完成特定的業務。
因此,從目前實現方式的原理和完整度而言,威脅談不上,「笨笨的」很難避免,但是找到好的適用場景,就可以有它的用武之地。
Chatbot的發展
chatbot在2016年有了爆髮式大發展,原因有很多,比如人工智慧的大熱門,尤其是AlphaGo的表現,讓普通民眾看到了AI的存在和發出的挑釁,進而帶來了市場強烈的關注度。
一般來說市場的爆發點需要有四大因素:話題、資金、痛點和技術能力,就此而言,chatbot的市場發展包括以下幾個因素:
- AlphaGo的話題效應,人工智慧概念的宣傳;
- 亞馬遜Echo的大賣,Facebook、slack等公司推出的bot服務和平台,資本找到一個新的追逐點;
- 大數據的積累、深度學習技術和自然語言處理技術的發展;
- 移動應用的封閉造成的信息孤島,App直接的跳轉和信息的切換不便利,需要有一個大整合;
能夠發展因素不僅限於此,但這些同時也是chatbot很難深入發展的因素:
- 人工智慧概念說太多,然而效果一般,熱鬧完也就平淡了;
- 市場成就的還是Echo,不時跳出的新品,過段時間逐漸隱匿;
- 數據量多但是沒有經過很好清晰,深度學習和自然語言處理沒有理想中的完美;
- 移動應用雖然封閉,但用戶已養成了跳轉的耐性,而chatbot還沒有好到讓用戶不需要耐性。
因此,在目前來說,chatbot的優勢也是它的劣勢,有很好的場景倡導,但是還需要逐步完善場景的完整實現。
小結
chatbot搭著人工智慧的順風車,在巨頭們的牽引下火了一把,從剛開始的新鮮,到後來的雞肋,用戶的評價從好玩到無聊,說明了很多事情,用戶需要新鮮感,期待著聊天機器人能帶來不一樣的感覺,期待它能像人一樣交談,但發現回答質量不如人意之後逐漸拋棄,並且形成刻板印象。
這在現階段技術和內容都亟待突破的情況下情有可原,但是我依舊非常看好chatbot的未來,從交互方式來說有天然的優勢,甚至不需要教育用戶去如何使用,對話就是最好的溝通和交互方式。
推薦閱讀:
※如今的C-3PO
※直播預告:基於動態詞表的對話生成研究 | PaperWeekly x 微軟亞洲研究院
※Chatbot專題閱讀小組 | 每周一起讀 #08
※Conversational UI / Conversational Robot 雜談
※NLP 專題論文解讀:從 Chatbot 到 NER(文末有彩蛋)