推薦演算法中除了itemcf外還有哪些計算item相似度的策略,另外有哪些基於模型的itemcf演算法?
目前公司的app是電商平台,商品詳情頁上有個 相關商品推薦場景。要求推薦的goods候選集只由當前瀏覽的gid決定,要保證不同user瀏覽同一個goods都能有 完全一樣的相關goods候選集(個性化功能是用機器學習模型ranking來做不同user展示不通的top N個goods)。目前我用的方法靠 基於記憶的itemcf和基於商品標題內容的lda主題模型 這2個演算法生成候選集的,還有其他方法用於生成候選集嗎
推薦系統中關於計算item之間的相似度的演算法很多,需要根據自己的數據規模、特徵、場景等各個維度來選擇合適的計算模型。一般而言,我們可以參考推薦系統中不同的推薦演算法來說明幾種比較流行的item相似度計算方法。
1. 基於content based的相似度計算
該方法以item的顯性特徵為基礎,構建item的空間向量模型,例如對於一篇文章,特徵可以包括作者、類型、標題特徵、正文特徵、用戶自定義標籤等等,對於一個視頻,可以是視頻時長、視頻類型、演員、導演等等,有了每個item的向量空間模型,接下來使用向量距離相似度計算就可以得到item間的相似度;
2. 基於領域的item cf的相似度計算;
該方法使用基於領域的item cf演算法,計算出每個item的 action user向量,據此可以通過計算這兩個action user向量的相似度來衡量item間的相似度。常用的衡量的方法有jacarrd相似度、餘弦相似度、皮爾遜相似度等等。
3. 基於矩陣分解的item隱向量計算item相似度
通過業界流行的矩陣分解方法(SVD,SVD++,FM,LDA等等)來計算user 和item在隱向量空間上的向量坐標,得到每個item的隱向量後,計算item間的相似度就比較容易了。
4. 基於深度學習的item向量表達
隨著深度學習的發展,使用深度學習技術(item2vec、node2vec、DNN、CNN)來學習item隱向量,例如google使用DNN學習user和item的隱向量來做視頻推薦等。
1買過這個商品的用戶 還買過。。。。2 建立標籤體系 如多層分類,然後根據分類設定相似度標準3 其他文本相似度計算方法,這個多難都行 ,無監督的如word2vec,如果利用用戶點擊日誌做有監督的,根據數據量,搭建合適模型,deep的或者樹模型 或者LR,自由發揮了。
可以基於商品本身屬性計算相似性啊
可以item本身的屬性進行相關性來計算,另外可以採用word2vec的思路做item2vec 事實上已經有了不少相關工作 。
推薦閱讀:
※如何看待如今上演的全民 CS,全民 AI 現象?
※二值化網路如何實現加速?
※美國數據挖掘研究生?
※arXiv怎麼發音?
※在 DeepMind 工作是一種怎樣的體驗?