可解釋推薦系統:身懷絕技,一招擊中用戶心理
編者按:推薦系統被廣泛應用在電商網站、社交網路、生活服務網站、搜索引擎等平台。一個好的推薦系統不僅需要準確地把握用戶的需求,推薦給用戶想要的內容,更需要學會與用戶溝通,了解用戶心理,以用戶容易接受的方式給出適當的推薦。
本文中,微軟亞洲研究院的研究員王希廷和謝幸將為大家詳解可解釋推薦系統的分類、推薦解釋生成方法以及面臨的機遇和挑戰。
《戰國策》中有個有趣的故事:當年趙國被入侵,只有送出質子才能求來救兵。但是趙太后特別疼愛小兒子,怎麼也不願意讓他當質子。大臣們越是勸諫,趙太后就越是憤怒。這時候觸龍出面,成功說服了趙太后,讓她的愛子出質於齊,換來救兵。他到底是如何做到的呢?
這個故事其實跟我們最近進行的推薦系統的研究非常相關。如果把「送出質子」當作一個推薦給太后的策略,那麼故事的關鍵不在於推薦內容的好壞,而在於對推薦內容的解釋。如果要讓趙太后這樣頑固的用戶接受這個推薦,關鍵點是什麼?
觸龍給出的答案是:溝通方式、用戶心理、合適例證。讓我們詳細看看他是怎麼做的。
觸龍剛見到趙太后就開始話家常,說:「我老啦,有個小兒子年齡很小,真是擔心他的未來啊。」趙太后問:「你們男人也很寵愛小兒子嗎?」觸龍說:「比女人更寵呀。我認為趙太后更喜歡您的女兒,而不是小兒子。」趙太后表示不認同。觸龍解釋道:「您送公主出嫁的時候,儘管傷心,但也希望她不要被趕回來。這還不是為她的長遠未來打算?」趙太后同意。觸龍又說:「但是您卻沒怎麼為長安君計劃未來。您看趙國剛建立時的諸侯王,他們的子孫還有享受爵位的嗎?其他國家的呢?」趙太后想了想,表示沒有。觸龍又說:「那是因為他們榮華富貴太甚,又沒有什麼功勞的緣故。您現在讓長安君有如此高的地位,卻不讓他有功於國,一旦您駕崩了,長安君憑什麼在趙國立足呢?」聽了這番話後,趙太后同意了將長安君作為人質。
我們可以在這個故事裡看到兩類推薦系統。一類是朝廷大臣這種傳統的推薦系統(下圖(a)),將重心放在提高推薦準確性上,與推薦對象的溝通考慮得不夠;而另一類是觸龍這種可解釋的推薦系統(下圖(b)),能夠以用戶容易接受的方式(話家常),充分抓住用戶心理(父母愛自己的小孩,應該為他們長遠未來考慮),給出適當的例子(趙太后送公主出嫁)與用戶溝通。研究發現,這樣的系統不僅能夠提升系統透明度,還能夠提高用戶對系統的信任和接受程度 、用戶選擇體驗推薦產品的概率以及用戶滿意程度等等。
(a) 傳統推薦系統
(b) 可解釋推薦系統
設計一個像觸龍這樣可解釋的推薦系統是我們的終極目標。目前,這個方向進展如何呢?未來,有什麼比較好的研究課題呢?下面,我來介紹一下可解釋推薦的分類、推薦解釋生成方法以及可解釋推薦面臨的機遇和挑戰。
可解釋推薦的分類
一般來說,可解釋的推薦分為下圖所示的三大類:以物品為媒介、以用戶為媒介、以及以特徵為媒介。
三大類推薦解釋:以物品、用戶、特徵為媒介
以物品為媒介的推薦解釋用一句話表述是「這個推薦物品和您喜歡的其他物品相似」。在趙太后的故事中,觸龍用了類似的推薦解釋: 「派長安君做人質」這個推薦策略與趙太后曾經採用過的策略(送公主出嫁)相似。這類解釋在各大網站上如亞馬遜、Netflix等有較為廣泛的應用。它的展現方式常常是一個曾經購買、評論或者瀏覽物品的列表,列表中的物品和目前推薦的物品比較相似。研究表明這類方法能夠增加系統的被接收程度。但是這類推薦解釋的問題是用戶有時可能難以找到物品之間的關聯,另外用戶有時可能希望看到一些自己沒有購買過的、不一樣的物品。
以用戶為媒介的推薦解釋用一句話表述是「跟您相似的用戶都喜歡該推薦物品」。在趙太后的故事中,這個與趙太后相似的用戶就是也寵愛小兒子的觸龍。這類推薦解釋展現形式多種多樣,生成解釋時也往往用到社交信息。微軟研究員Amit Sharma等人對四種社交理由進行了用戶測試,這四類理由是整體熱度(2,612,211位Facebook 用戶喜歡它)、朋友熱度(您的朋友中有7人喜歡它)、好朋友(張三喜歡它)、好朋友及個數(張三和其他5位您的朋友喜歡它)。最終發現後兩種解釋方式效果對提升說服力效果最好。使用這兩種解釋方式時,選擇一個正確的朋友非常重要。如果只是隨機選擇一個朋友,說服力反而會降低。以用戶為媒介的推薦解釋與以物品、特徵為媒介的推薦解釋相比,最能說服用戶對推薦物品進行評估,但是對用戶實際使用物品後喜愛程度影響比較小。如果推薦的物品用戶不夠喜歡,反而會降低用戶的滿意程度。
以特徵為媒介的推薦解釋用一句話表述是「您可能喜歡推薦物品的這些特徵」。在趙太后的故事中,觸龍抓住了趙太后最關心的特徵——子孫的長遠利益——進行推薦,從而使得趙太后接受了推薦。這類推薦解釋常見的表現形式是將推薦物品中用戶感興趣的主要特徵進行列舉(如下圖)。研究表明這類推薦解釋有助於用戶準確判斷是否喜歡推薦物品,與前兩類推薦解釋相比,用戶對這類推薦的滿意度更高。這類推薦需要判斷物品特徵以及用戶對不同特徵的感興趣程度,從而找到最適合用於解釋的特徵,因此建模粒度更細,也是目前的研究熱點。
以特徵為媒介的推薦解釋
除了上述三種推薦解釋以外,還有結構化概覽式推薦以及對話式推薦等。其中,結構化概覽式推薦將推薦物品用有組織的、可視化的形式呈現給用戶,讓用戶可以看到各個推薦物品的特性和分布,從而在充分了解以後做出挑選。對話式推薦是在與用戶聊天時進行推薦、解釋、收集用戶反饋,有著較高的接受度,也可以很好地解決冷啟動問題。這是一個新興的研究方向,我們也在做一些嘗試,將在後文進行討論。
推薦解釋生成方法
剛剛我們談到了幾類推薦解釋,其中以特徵為媒介的推薦解釋建模粒度較細,模型也日趨成熟。接下來重點介紹一下這類推薦解釋的生成方法。
生成基於特徵的推薦解釋時,關鍵是特徵的提取。早期的方法藉助一些顯式的物品特徵,例如事先確定的物品分類、關鍵詞、以及標籤信息。在挑選特徵進行解釋時,主要是綜合兩個指標:第一是用戶對特徵的感興趣程度,第二是推薦商品與特徵的相關程度。第一點需要非常了解用戶心理,第二點需要對商品進行精確建模,綜合兩點考慮,才能像觸龍一樣擊中用戶內心。早期方法對這兩者分別計算之後進行合併,從而找出推薦物品以及解釋。這類方法的問題之一是特徵的可描述性(Descriptiveness)可能不夠。另外這些方法採用的推薦模型還比較簡單,一些精巧的、複雜的推薦系統難以用這樣的方法進行解釋。
為了解決上面的問題,近期一些工作開始利用網上豐富的評論文本進行可解釋性的推薦。他們的主要思想是從評論中抽取用戶最感興趣的物品特徵,並且將這些特徵加入到目前的推薦系統中進行統一建模。其中一個較新的方法是Explicit Factor Model(EFM)。如上圖所示,這個方法首先利用詞級別的情感分析找出用戶評論中提到物品的顯式特徵(Explicit Features,如Screen、Earphone、Battery)及用戶對這些特徵的情感傾向(正面或者負面)。利用這個信息,可以構建用戶-特徵矩陣X以及物品-特徵矩陣Y。這兩個稀疏矩陣可以用三個低維矩陣U1、U2、V進行建模。這裡V中每一行記錄了一個顯式特徵的隱式表達(Latent Representations)。U1(U2)即記錄用戶(物品)與顯式特徵隱式表達之間的關係。除了顯式特徵以外,還有一些隱含特徵(Hidden Factors)可能是評論中沒有提到的,這些特徵用額外的H1、H2矩陣表示。將U1、H1進行拼接就構成了用戶與物品所有特徵的隱式表達之間的關係,U2、H2也是類似的。該模型希望能夠通過這些矩陣擬合用戶-物品的評價矩陣A。
JMARS(Jointly ModelingAspects, Ratings and Sentiments)框架
可解釋推薦的機遇與挑戰
作為推薦領域被探索得較少的一個方向,可解釋推薦的很多方面值得研究與探索。目前,我們在考慮從下面三個方面進行研究。
解釋含有深度神經網路的推薦模型。目前可解釋推薦的系統往往是基於較淺層的圖模型或者矩陣分解模型,對於含有深度神經網路的複雜、混合模型的解釋能力還不夠。我們在考慮借鑒對深層卷積神經網路進行解釋、分析的技術,將複雜、高級的推薦系統升級為可解釋的推薦。
利用知識圖譜打通不同媒介之間的關聯。現有的可解釋推薦所生成的推薦解釋往往只局限於以物品為媒介、以用戶為媒介或者以特徵為媒介中的某一種,對這三類媒介之間的關聯挖掘得還不夠。我們希望能夠利用知識圖譜,打通這三類媒介之間的關聯,根據具體情況靈活選擇其中最合適的媒介對用戶進行推薦與解釋。這樣,我們還可以產生形式更豐富的推薦解釋,例如將用戶感興趣的圖片也進行展示。
結合生成模型進行對話式推薦。目前的推薦解釋往往形式是預先設定、千篇一律的(如預先設定推薦解釋是以用戶為媒介的)。這樣儘管也能根據用戶心理舉出一些例證,但是在溝通方式上還過於呆板,離觸龍那樣話家常式的推薦還有很大距離。如果能用生成模型讓推薦系統「自創」一句通順甚至高情商的話,就可以在與用戶聊天的過程中進行靈活、多變地推薦解釋了。我們團隊已經與微軟小冰合作,在這方面進行了一些嘗試,為小冰生成音樂推薦解釋。推薦過程如下圖所示:
微軟小冰的對話式音樂推薦
我們會從這幾個方向出發,不斷拓展可解釋推薦的深度和廣度。希望不久後的某一天,推薦系統都能像觸龍那樣厲害。
感謝大家的閱讀。
本賬號為微軟亞洲研究院的官方知乎賬號。本賬號立足於計算機領域,特別是人工智慧相關的前沿研究,旨在為人工智慧的相關研究提供範例,從專業的角度促進公眾對人工智慧的理解,並為研究人員提供討論和參與的開放平台,從而共建計算機領域的未來。
微軟亞洲研究院的每一位專家都是我們的智囊團,你在這個賬號可以閱讀到來自計算機科學領域各個不同方向的專家們的見解。請大家不要吝惜手裡的「邀請」,讓我們在分享中共同進步。
也歡迎大家關注我們的微博和微信(ID: MSRAsia)賬號,了解更多我們研究。
推薦閱讀:
※揭秘武林絕學——「聽聲辨位」 | AI公開課
※AI同傳PK人類同傳,這或許是兩個職業
※Keras作者力推開源框架Lore:15分鐘搞定深度學習模型從配置到部署
※【原著解讀】丹尼特的《心靈的演化》:文化演化的演化
※基於對抗學習的生成式對話模型的堅實第一步 —— 始於直觀思維的曲折探索
TAG:人工智慧 |