計算廣告-基礎知識準備
02-04
重點關注三個相關領域的背景知識:
信息檢索,最優化,機器學習
信息檢索技術
倒排索引:
倒排索引最基本的操作有兩項:
一是向索引中加入一個新的文檔,
二是給定一個由多個關鍵片語成的查詢時,返回對應的文檔集合
向量空間模型:
向量空間模型VSM則是信息檢索中最基礎且最重要的文檔相似度度量方法之一
VSM的核心有兩點:文檔的表示方法和相似度計算方法
最優化方法
最優化的討論是給定一個數學上明確表達的優化目標之後,如果用系統性的方法和思路找到該問題的最優解
拉格朗日法和凸優化
下降單純性法
梯度下降法
擬牛頓法
Trush-Region法
統計機器學習
最大熵和指數族分布
混合模型和EM演算法
貝葉斯學習
共軛先驗
經驗貝葉斯
推薦閱讀:
※CTR預估系列一覽表
※為什麼FTRL比FOBOS更容易獲得稀疏解?
※計算廣告-前言
※CTR預估[九]: Algorithm-GBDT: Boosting Trees
TAG:计算广告学 |