推薦系統圈的高端聚會這十年在談些什麼?

ACM(國際計算機學會)主辦的推薦系統專場(Recsys)是推薦系統圈子的頂級會議,從2007年開始,至今已經十年,這十年中每年都有Tutorial公布,本文整理出來,可以一探推薦系統的業界和學界興趣點的遷移。

十年回顧

2007

本年度並沒有公開的Tutorial,但從會議收錄的文章主題,可以看到本屆會議重點討論的話題是:隱私和信任,協同過濾

2008

1. Robust Recommender Systems

作者:Robin Burke (DePaul University)

主題:關於推薦系統的健壯性,主要有:對推薦模型的攻擊種類,量化分析攻擊產生的影響,推薦演算法替代方案,留住用戶的信任,對攻擊方的檢測。

關鍵詞:健壯性,推薦系統安全

2. Recent Progress in Collaborative Filtering

作者:Yehuda Koren (Bell Labs)

主題:以Netflix Prize比賽為主線,回顧了協同過濾相關演算法的前世今生。同時,強調推薦系統是一個多目標優化的系統,所以也對多種效果評價指標做了對比。

關鍵詞:協同過濾,多目標優化,效果評價

3. Context-Aware Recommender Systems

作者:Gedas Adomavicius (University of Minnesota) and Alex Tuzhilin (NYU)

主題:傳統推薦系統致力於給用戶找出相關的物品,但是僅僅是這樣已經不夠了,現在(注意這時候是2008年)需要根據當時所在時間和位置給出更合適宜的推薦,比如旅行推薦。這就是所謂考慮上下文信息或者說場景的推薦系統。

關鍵詞:場景信息

2009

1. Important Research Challenges in Recommenders

作者:John Riedl (University of Minnesota), John Sanders (Netflix) and Todd Beaupre (Yahoo!)

主題:回顧了個人在從事推薦系統研究過程中所遇到的挑戰:透明度,EE問題,防沉迷,興趣遷移,長短期興趣融合,讀懂用戶行為的含義,效果評價。

關鍵詞:透明度,EE問題,效果評價。

2. Bayesian Modeling for Recommender Systems

作者:Asim Ansari (Columbia University)

主題:關於在推薦系統建模中的貝葉斯身影。

關鍵詞:貝葉斯

3. Using Social Trust for Recommender Systems

作者:Jennifer Golbeck (University of Maryland)

主題:在推薦系統中引入社交關係以增強推薦結果的信任度,從而提升推薦系統的效果。

關鍵詞:社交推薦,信任度

2010

1. Evaluating Recommender Systems

作者:Guy Shani

主題:關於如何評價推薦系統的問題,分為在線和離線兩部分。分別詳細降到了離線階段如何模擬用戶行為做一個實驗,在現階段如何做一個實驗,並討論了用戶研究、用戶體驗等泛技術領域話題。

關鍵詞:效果評價

2. HCI for Recommender Systems: An Introduction

作者:Joseph A. Konstan

主題:介紹人機交互概念、技術,討論推薦系統中關於交互設計的影響。

關鍵詞:人機交互

3. Query Intent Prediction and Recommendation

作者:Ricardo Baeza-Yates

主題:查詢意圖是搜索引擎的技術範疇,但用戶明確提交一個查詢本身就反映了非常明確的用戶需求和興趣,所以本人就探討了查詢意圖識別在推薦系統中的應用。同時,還在搜索中嘗試了相關搜索推薦。

關鍵詞:查詢意圖,搜索引擎

2011

1. Music Recommendation and Discovery Revisited

作者: òscar Celma (BMAT) and Paul Lamere (The Echo Nest)

主題:回顧總結了在線音樂應用的推薦系統原理,挑戰,以及那些可能用於在未來(站在2011年)提升音樂推薦系統效果的技術。

關鍵詞:音樂推薦

2. Robustness of Recommender Systems

作者:Neil Hurley (UCD)

主題:討論推薦系統的攻擊,列舉了近十年來(站在2011年)真實發生的推薦系統攻擊案例,總結其中的特點,為了更好的加強推薦系統的健壯性。

關鍵詞:健壯性,推薦系統安全

3. Recommendations as a Conversation with the User

作者:Daniel Tunkelang (LinkedIn)

主題:把推薦系統看成是用戶和信息獲取平台之間的對話通道,會是什麼樣的情形?

關鍵詞:人機交互,對話系統

2012

1. Conducting User Experiments in Recommender Systems

作者:Bart Knijnenburg (UC Irvine)

主題:我們一直以來就是聚焦於離線階段用量化的指標去評價推薦系統的演算法效果,但是如何去評價用戶體驗呢?用戶體驗是主觀的,畢竟我們無法知道每個人內心的感受。本文主要討論推薦系統中如何考慮用戶體驗。

關鍵詞:用戶體驗,效果評價

2. Personality-based Recommender Systems: An Overview

作者: Maria Augusta S. N. Nunes (UF Sergipe) Rong Hu (EPFL)

主題:介紹了人這種非理性動物在做決策時的個性因素,及其對推薦系統的啟發,把「個性化」和「推薦系統」放在一起考量,同時介紹了實現個性化的推薦系統需要哪些關鍵技術,以及會遇到哪些挑戰。

關鍵詞:個性化

3. Building Industrial-scale Real-world Recommender Systems

作者:Xavier Amatriain (Netflix)

主題:這是當時的Netflix演算法總監(現在已經是Quora主管工程的副總裁)總結的工業級推薦系統經驗。推薦系統每年的論文層出不窮,但如何才能在自己的商業系統中將其落地,是很多人關心的頭等大事,對此本文總結了若干要點。可擴展性,低延遲等工業級系統的要求要考慮,模型方面,除了準確性,還有新鮮度,新奇度,透明度也是工業級推薦系統要考慮的。以Netflix的生產系統為例將這些問題做了逐一梳理。

關鍵詞:工業級

4. Best Practices Tutorial and Panel Discussion: The Challenge of Recommender Systems Challenges

作者:Alan Said (TU Berlin), Domonkos Tikk (Gravity) and Andreas Hotho (U Wurzburg)

主題:近年來組織的推薦系統相關比賽很多,以Netflix Prize, KDD Cup為典型代表,這些比賽為推薦系統領域貢獻了很多優秀的開發經驗,那麼到底贏得一場這樣的比賽有哪些關鍵點要做好呢?本文就此討論了一番。

關鍵詞:推薦系統比賽,最佳實踐

2013

1. Invited Tutorial: Mining Social Networks for Recommendation

作者: Martin Ester (Simon Fraser University, Canada)

主題:社交信息可以為推薦系統帶來貢獻,這幾乎是共識,但到底帶來什麼貢獻?怎麼帶來貢獻?為冷啟動問題貢獻用戶個人信息,是一個典型的應用。社交網路上的好友推薦也是個典型應用。未來有哪些方向可以嘗試或者挑戰?把社交網路看成一個分散式網路,P2P網路,以及如何保護隱私的問題。

關鍵詞:社交網路

2. Learning to Rank

作者: Alexandros Karatzoglou (Telefonica Research, Spain), Linas Baltrunas (Telefonica Research, Spain) & Yue Shi (Delft University of Technology, Netherlands)

主題: 本文討論排序模型在推薦系統的應用,現有模型的優劣區別,未來的可能發展方向。

關鍵詞:LTR,排序模型

3. Beyond Friendship:- The Art, Science and Applications of Recommending People to People in Social Networks

作者:Luiz Augusto Pizzato (University of Sydney, Australia) & Anmol Bhasin (LinkedIn, USA)

主題:關於社交網路推薦系統,不只是建立社交關係那麼簡單。本文深入討論了這個問題,首先描述了經典方法如鏈接分析和協同過濾方法,接著深入討論了諸如相互作用,基於用戶之間的社交圖譜的好友推薦,內容來自作者在LinkedIn的第一線工作內容。

關鍵詞:社交網路

3. Preference Handling

作者: Alexis Tsoukiàs (Université Paris Dauphine, France) & Paolo Viappiani (Université Pierre et Marie Curie, France)

主題:關於用戶偏好研究。用戶偏好不止是推薦系統的研究對象,它是很多其他領域的關注點:博弈論,決策論等。文中還討論了在推薦系統中,用戶偏好如何學習和融合。

關鍵詞:用戶偏好

2014

1. The Recommender Problem Revisited

作者:Xavier Amatriain (Netflix Inc., USA)

主題:本文回顧了Netflix Prize比賽用均方根誤差簡化了推薦系統的問題,實際上一個現代的商業推薦系統中,還要考慮:個性化排序,相似度,推薦解釋,場景信息(上下文信息),和搜索引擎的結合。還回顧了一些重要的推薦模型,Factorization Machines, Restricted Boltzmann Machines, SimRank, Deep Neural Networks, Listwise Learning-to-rank。

關鍵詞:工業級,場景信息

2. Personalized Location Recommendation on Location-based Social Networks

作者:Huiji Gao, Jiliang Tang, and Huan Liu (Arizona State University, USA)

主題:移動互聯網的崛起,推薦系統可以接入的數據更多,應對的場景更豐富,上傳地理位置,隨時隨地在社交網路上分享內容,這些都可以引入到社交推薦中了。本文從數據挖掘的角度去介紹當這些數據引入後有哪些新的嘗試。

關鍵詞:社交網路,地理位置

3. Cross-Domain Recommender Systems

作者:Ivan Cantador (Universidad Autónoma de Madrid, Spain) and Paolo Cremonesi (Politecnico di Milano, Italy)

主題:社交電商中,用戶提供的信息是跨領域的。用戶在不同系統中產生的反饋,填寫的資料可以互相交叉使用,尤其是:解決冷啟動問題得到更好的推薦效果,解決數據稀疏問題得到更好的用戶模型。本文針對跨領域的推薦系統,分別從用戶建模、推薦系統、機器學習等角度討論了這一問題。

關鍵詞:跨領域,冷啟動

4. Social Recommender Systems

作者:Ido Guy (Yahoo! Labs) and Werner Geyer (IBM Research)

主題:本文是全面梳理社交網路推薦系統的一篇綜述性Tutorial。

關鍵詞:社交網路

2015

1. Replicable Evaluation of Recommender Systems

作者:Alan Said (Recorded Future, Sweden) and Alejandro Bellogín (Universidad Autónoma de Madrid, Spain)

主題:推薦系統的效果評價一直是受多種因素影響的,尤其是對比兩個推薦模型更不是那麼容易。本文為你展示了一種非常清晰明了的方式來評價推薦系統結果,這個方式的特點是:可比較、可復現、無偏。

關鍵詞:效果評價

2. Real-time Recommendation of Streamed Data

作者:Frank Hopfgartner (University of Glasgow, UK), Benjamin Kille (TU Berlin, Germany), Tobias Heintz (plista GmbH, Germany) and Roberto Turrin (ContentWise, Italy)

主題:基於流式數據的實時推薦系統如何離線評價?如何做AB對照試驗?本文討論了這兩個問題。

關鍵詞:實時推薦,效果評價,ABtest

3. Scalable Recommender Systems: Where Machine Learning Meets Search!

作者:Joaquin A. Delgado (Verizon, US) and Diana Hu (Verizon, US)

主題:典型的搜索和推薦都有兩個階段,召回和排序。所以整合了機器學習的搜索引擎也可以用於推薦系統,本文介紹了一個開源框架,ML-Score,一個深度整合ElasticSearch的插件,用於替換ES默認的排序機制,而代之以機器學習排序,模型可以用Spark Weka R訓練得到。

關鍵詞:搜索引擎,ElasticSearch

4. Interactive Recommender Systems

作者:Harald Steck (Netflix Inc., US), Roelof van Zwol (Netflix Inc., US) and Chris Johnson (Spotify Inc., US)

主題:有一種推薦系統,介於主動搜索和被動推送之間,就是互動式推薦系統,它的特點是用戶不斷對推送結果給予明確反饋,從而引導推薦系統朝自己希望的方向推薦結果。這是一個EE平衡的問題。本文針對音樂推薦(Spotify)和視頻推薦(Netflix),根據用戶研究和AB對照試驗結果,討論這種推薦系統的方方面面。

關鍵詞:Explore&Exploit問題,互動式推薦

2016

1. Lessons Learned from Building Real--Life Recommender Systems

作者:Xavier Amatriain (Quora, USA) and Deepak Agarwal (LinkedIn, USA)

主題:本文是Quora的工程副總裁根據自己在Netflix和Quora的實踐總結出來的十條經驗。

關鍵詞:工業級

2. Matrix and Tensor Decomposition in Recommender Systems

作者:Panagiotis Symeonidis (Aristotle University, Greece)

主題:推薦系統中有很多矩陣分解方法,本文用一個統一的例子帶你逐一分析這些矩陣分解方法。

關鍵詞:降維,矩陣分解

3. People Recommendation

作者:Ido Guy (Yahoo Research, Israel) and Luiz Pizzato (Commonwealth Bank of Australia, Australia)

主題:本文介紹了社交網路中最常見的推薦系統「可能感興趣的人」「你可能想關注」。

關鍵詞:社交網路

4. Group Recommender Systems

作者:Ludovico Boratto (University of Cagliari, Italy)

主題:通常推薦系統都是針對單個用戶的,那麼針對一個群體的推薦系統該怎麼做呢?有哪些不同?該如何評價?本文討論的就是針對群體的推薦系統。

關鍵詞:群推薦

2017

1. Privacy for Recommender Systems

作者:Bart Knijnenburg (Clemson University, USA) and Shlomo Berkovsky (CSIRO, Australia)

主題:推薦系統對數據是貪婪的,但是用戶隱私保護也很重要。如何保護隱私,本文從架構、演算法、策略相關、UI設計等角度探討了這一話題。

關鍵詞:用戶隱私

2. New Paths in Music Recommender Systems Research

作者: Markus Schedl (Johannes Kepler University Linz, Austria), Peter Knees (Vienna University of Technology, Austria) and Fabien Gouyon (Pandora Inc., USA)

主題:音樂推薦早已經不再是簡單的內容推薦或者協同推薦能滿足得了聽眾的了,如今在線音樂推薦的是一種收聽體驗。簡單說就是一種序列推薦,情境推薦,而不簡單是某一首歌推薦得「精準」。本文介紹了學術界和工業界對現在音樂推薦提出的解決方案,主要包括:播單生成,情境推薦,音樂製作時的推薦。

關鍵詞:音樂推薦,工業級

3. Deep Learning for Recommender Systems

作者:Alexandros Karatzoglou (Telefonica Research, Spain) and Balázs Hidasi (Gravity R&D, Hungary)

主題:本文介紹了深度學習在推薦系統的應用,如RNN,CNN;使用了深度學習的基於內容推薦和協同推薦是什麼樣的。

關鍵詞:深度學習

4. Product Recommendations Enhanced with Reviews

作者:Muthusamy Chelliah (Flipkart, India) and Sudeshna Sarkar (IIT Kharagpur, India)

主題:電商中用戶評價用於推薦系統非常常見,本文介紹了電商推薦系統中對用戶評價的使用,涉及到文本挖掘,情感分析,話題模型,詞向量學習。

關鍵詞:NLP

5. Open Source Tools for Online Learning Recommenders

作者: Róbert Pálovics (Hungarian Academy of Sciences, Hungary), Domokos Kelen (Hungarian Academy of Sciences, Hungary) and András A. Benczúr (Hungarian Academy of Sciences, Hungary)

主題:如今的推薦系統早已經不再是周期性計算出推薦結果後再呈現給用戶的時代了,在線學習,實時或者准實時捕捉用戶的反饋非常必要。但是相應的工程門檻也不低,本文手把手教你如何利用開源工具搭建在線學習系統用於實時推薦系統中。

關鍵詞:實時推薦

話題變遷分析

常規話題

歷時十年,有幾個話題是一直都存在的:

1. 健壯性及推薦系統安全問題

2. 從學術到工業級別的推薦系統的跨越問題

3. 推薦系統的效果評估問題

4. 如何使用更多的數據以及用戶隱私的權衡問題

5. 用戶建模

產品應用

下面這些產品是Resys中最常聊到的推薦系統落地場景:

1. 在線視頻

2. 社交網路

3. 在線音樂

4. 電商網站

演算法和技術

在這十年里,真正落地到工業界產生效果的演算法和技術基本上圍繞下面這些方向:

1. 協同過濾

2. 矩陣分解

3. 深度學習

4. NLP

後記

ACM的推薦系統專場這十年彙集了全球頂級的Resyser,他們把各自在工作中研究中碰到的問題,得到的經驗毫無保留分享出來,非常值得尊敬和感謝。

但另一方面,我們要在自己的應用中落地實踐這些又不是那麼簡單,中間存在一定的鴻溝需要跨過,畢竟路要一步一步走出來。

希望大家能在自己的產品中「大吉大利,每天吃雞」。


作者簡介

刑無刀(本名陳開江),現為鏈家網資深演算法專家,從事演算法類產品的研發。曾任新浪微博資深演算法工程師,考拉 FM 演算法主管。

這裡推薦一個作者刑無刀同學的專欄——《推薦系統36式》,為你系統講解如何從0到1實現推薦系統,現在註冊立享30元新人紅包,掃碼微信訂閱券後僅需28元。

t.cn/REcQ0nM (二維碼自動識別)

專欄課程介紹

很多同學一看到推薦系統的各種演算法,再加上機器學習等高大上的名詞,就怵得慌。其實刑無刀也是這麼一路過來的,現在再回過去看推薦系統,其實並沒有那麼複雜。《推薦系統三十六式》中,刑無刀用通俗易懂、多舉例少談概念的方式幫大家講清楚各個概念。訂閱專欄後可以隨時給作者留言,刑無刀會回復和解釋,也會組織專門的直播來答疑,製作知識圖譜總結和整理知識學習路徑。

專欄共36期,僅58元,一次訂閱,永久閱讀。下面是課程的目錄,篇篇乾貨,深入淺出。

訂閱方式:

方法一

長按識別下圖二維碼,微信支付,即刻訂閱。

方法二

  1. 下載「極客時間」App,註冊並登錄,領取30元新人紅包。
  2. 從首頁輪播圖或專欄頁進入《推薦系統36式》,完成訂閱。

推薦閱讀:

TAG:推薦系統 | 個性化推薦 | ACM |