推薦系統有哪些比較好的論文?

最好是像kdd的論文和presentation那樣,從特定問題出發,特徵工程、模型選擇等整個過程都提及的


(昨天正好回答過一個相關問題,拿過來給題主參考以下)
推薦幾篇對工業界比較有影響的論文吧:
1. The Wisdom of The Few 豆瓣阿穩在介紹豆瓣猜的時候極力推薦過這篇論文,豆瓣猜也充分應用了這篇論文中提出的演算法;
2. Restricted Boltzmann Machines for Collaborative Filtering 目前Netflix使用的主要推薦演算法之一;
3. Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model 這個無需強調重要性,LFM幾乎應用到了每一個商業推薦系統中;
4. Collaborative Filtering with Temporal Dynamics 加入時間因素的SVD++模型,曾在Netflix Prize中大放溢彩的演算法模型;
5. Context-Aware Recommender Systems 基於上下文的推薦模型,現在不論是工業界還是學術界都非常火的一個topic;
6. Toward the next generation of recommender systems 對下一代推薦系統的一個綜述;
7. Item-Based Collaborative Filtering Recommendation Algorithms 基於物品的協同過濾,Amazon等電商網站的主力模型演算法之一;
8. Information Seeking-Convergence of Search, Recommendations and Advertising 搜索、推薦和廣告的大融合也是未來推薦系統的發展趨勢之一;
9. Ad Click Prediction: a View from the Trenches 可以對推薦結果做CTR預測排序;
10. Performance of Recommender Algorithm on top-n Recommendation Task TopN預測的一個綜合評測,TopN現在是推薦系統的主流話題,可以全部實現這篇文章中提到的演算法大概對TopN有個體會;
11. http://dsec.pku.edu.cn/~jinlong/publication/wjlthesis.pdf 北大一博士對Netflix Prize演算法的研究做的畢業論文,這篇論文本身對業界影響不大,但是Netflix Prize中運用到的演算法極大地推動了推薦系統的發展;
通過這些論文可以對推薦系統有個總體上的全面認識,並且能夠了解一些推薦系統的發展趨勢。剩下的就是多實踐了。Good luck!

------------------------------------------------------------羊年大年初一補充-----------------------------------------------------
Quora上有一個相關的回答,質量非常不錯:http://www.quora.com/What-are-the-seminal-papers-on-recommender-systems 回答了關於推薦系統起源問題的相關論文,同樣值得閱讀。


推薦兩篇必看(最好能自己實現)論文, 其他的論文其實都是在這基礎上build起來的。
http://Amazon.com Recommendations Item-to-Item Collaborative Filtering
http://www.cin.ufpe.br/~idal/rs/Amazon-Recommendations.pdf

MATRIX FACTORIZATION TECHNIQUES FOR RECOMMENDER SYSTEMS
https://datajobs.com/data-science-repo/Recommender-Systems-%5BNetflix%5D.pdf


2016.7.25
------------------------------------------
看了幾位的回答,涉及到了不少經典論文。我再補充幾篇頂會上的有趣論文吧。
(Collaborative Topic Regression&系列論文,作者是Blei的學生。在2015年被紐約時報採用,作為其推薦基礎,building-the-next-new-york-times-recommendation-engine)

CTR將概率矩陣分解(PMF)和潛在狄利克雷劃分(LDA)以緊耦合方式融合到同一個概率框架下,即將基於內容的推薦和協同過濾相結合,可以很好地解決冷啟動問題。最值得注目的是,它具有非常漂亮的推薦解釋性!如下圖,CTR認為用戶1對機器學習主題感興趣,因此可以推薦3,4,5,8(打叉處)等文章,從標題我們就可以看出其跟Machine Learning是相關的。

還可以發現原始LDA不能發現的隱式主題,起到補充作用。如下圖文檔Maximum likelihood from incomplete data via the EM algorithm,LDA只能發現其的文本字面層面的主題(text exhibits,如parameter estimation),而CTR結合了協同過濾CF後,能夠進一步發現隱藏主題(popularity exhibits,如Bayesian statistics),因為這篇文檔被很多對貝葉斯統計感興趣的學者所喜歡,那麼它就具有這一隱式主題表徵。

具體論文如下,主要就是在CTR基礎上有了很多改進,比如融合用戶社交關係、物品關係、物品標籤、注意力機制、上下文感知等要素。其中第8和9篇也讓我印象深刻,8是SDAE的貝葉斯化,9在用戶-物品-標籤三者上"直接"建立聯繫。

1. KDD11-Collaborative Topic Modeling for Recommending Scientific Articles
2. ICML12-Collaborative Topic Regression with Social Matrix Factorization for
Recommendation Systems
3. IJCAI13-Collaborative Topic Regression with Social Regularization for Tag Recommendation
4. AAAI13-LA-CTR: A Limited Attention Collaborative Topic Regression for Social Media
5. AAAI14-Context-Aware Collaborative Topic Regression with Social Matrix Factorization for Recommender Systems
6. AAAI15-Relational Stacked Denoising Autoencoder for Tag Recommendation
7. TKDE15-Relational Collaborative Topic Regression for Recommender Systems
8. KDD15-Collaborative Deep Learning for Recommender Systems
9. AAAI16-Capturing Semantic Correlation for Item Recommendation in Tagging Systems

其中6和8是CTR和DL的結合。需要注意的是,深度學習在推薦系統的應用還相當的少,google都找不到幾篇。因此這兩篇也很值得深入閱讀,目前還只是停留在SDAE挖掘物品內容特徵的階段。

當然還有從其他角度出發,直接採用DL做協同過濾的論文,比如:

10. Restricted Boltzmann Machines for Collaborative Filtering

11. Hybrid Collaborative Filtering with Neural Networks


2016.7.26
-----------------------------------------
剛才在這個問題下添加了自己的回答,涉及到了更多值得一讀的論文。
有哪些關於推薦系統的前沿資料或者文獻值得推薦? - 我的回答

ps,開始嘗試自己編輯答案,歡迎大家指正和交流。


個人愚見,工業界常用的推薦演算法並不像論文中那麼複雜,精細的特徵工程+簡單可行的模型+各種trick策略。比如CF。
看過一些基於矩陣分解的思路做推薦系統的論文,可能偏理論了不太貼近實際應用,貼出來供參考:
1,Factorization Machines with libFM。個人認為最經典的。
2, SVDFeature A Toolkit for Feature-based Collaborative Filtering。上海交大幾個大牛的作品。
3,Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation。標籤推薦,張量分解。
4,Factor in the Neighbors: Scalable and Accurate Collaborative Filtering。
5,Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model。I利用用戶的顯式或者隱式反饋提高準確率
6, Improving regularized singular value decomposition for collaborative filtering, 標準矩陣分解方法。
7, Maximum-Margin Matrix Factorization.
8, Probabilistic Matrix Factorization
9, Regression-based Latent Factor Models
10, Bayesian Probabilistic Matrix Factorization using Markov Chain Monte Carlo
11, Feature-Based Matrix Factorization.
12, Algorithms for Non-negative Matrix Factorization
不一定都合適,湊合著看吧。


CSE 291 Trends in Recommender Systems and Human Behavioral Modeling


那本《推薦系統 技術,評估及高效演算法》後面的參考文獻就挺詳細的


githup上有一些比較經典的推薦系統論文分享


推薦閱讀:

TAG:數據挖掘 | 機器學習 | 推薦系統 |