《A Dynamic Bayesian Network Click Model for Web Search Ranking 》

簡述:動態貝葉斯網路點擊模型,yahoo兩個工程師發表的。

實際上就是講述了一些搜索引擎中基本的經驗與假設,簡單但是很有用。

它不同於position model和級聯 model,它不但考慮position bias,也考慮結果與結果之間的的影響。將點擊,檢查等行為看作一個網狀結構,是一個稍稍複雜的隱性馬爾科夫模型(HMM)。主要核心就在於一個網路圖和一些基礎假設。這些假設給定的很合理,如下:

最後可以推導出一個url的評估標準 = 感知相關性*真實相關性,即用戶被吸引的概率*被滿足的概率,其實就是一個級聯運算。

後面又介紹了一個簡單的應用。假設用戶的容忍度為1,即若不滿意則會一直查找下去,這樣就不用考慮馬爾科夫中的一維狀態,減小了計算量。同時使得結尾點擊是滿意點擊。

這樣就有:感知相關性 = 點擊數/檢查數,真實相關性 = 滿意點擊數/點擊數 (以上兩個式子還要考慮平滑處理)


推薦閱讀:

我們推出了 極客搜索 1.0
搜狗要在美國上市?請問有多少營收來自莆田系醫院的墮胎收入?
全球十大搜索引擎,你聽過幾個?

TAG:机器学习 | 搜索引擎 |