怎麼描述一個人的興趣呢,如何數學建模?

給用戶簡單的打上幾個標籤?還是把設定一些大類,比如IT、汽車、軍事、社會、娛樂等等, 計算用戶的興趣成分比?基於特徵詞的特徵向量?或者還有其他的好的方式么?


用戶的興趣通過用戶的行為來表示。你說的這個是一種表示方法。但可以更廣泛的表示。比如在視頻網站中,用戶可以通過它看/搜索/訂閱/瀏覽的視頻來表示。不一定非得建模成人類能理解的詞語。此外,如果規模太大,也可以通過latent topic對用戶建模。


這個命題很有意思。
如果做成興趣圖譜,商業價值是很大的。
易傳媒,mediaV他們其實也是號稱有這樣的邏輯,來找到廣告主希望找到的客戶。就是通過cookie分析,演算法應該不難。
但是這也只是能夠分析這個人在網路上的行為,其在線上和線下的行為習慣可能並不統一。


看看有關persona的文檔吧
"The Personas』 New Clothes: Methodological and Practical Arguments against a Popular Method,」 by Christopher N. Chapman and Russell P. Milham
(Microsoft, Redmond, WA: 2006; http://cnchapman.files.wordpress.com/2007/03/chapman-milham-personas-hfes2006-0139-0330.pdf).
? Long, F. 「Real or Imaginary: The Effectiveness of Using Personas in Product Design.」 Proceedings of the Irish Ergonomics Society Annual Conference (Dublin), May 2009, pp. 1–10.


以我之前的經驗來看,可以分以下幾步:

1.梳理你業務的標籤,比如:搜索業務就是梳理搜索關鍵詞的分類,瀏覽業務就是梳理url的分類,下面的例子是我給阿里的一個部門業務做的分類

2. 然後把用戶與內容的交互行為映射到更粗粒度的標籤上,然後就有了以下的用戶畫像(當然你要做推薦的話可以不用匯總到粗粒度,直接用細粒度也行)

我的專欄:
數據科學之趣
http://zhuanlan.zhihu.com/ScienceIsFun我的微信公眾號:
港科楊慧明


推薦閱讀:

TAG:數據挖掘 | 興趣圖譜 | 個性化 | 推薦演算法 | 興趣模型 |