標籤:

計算廣告-基礎知識準備

重點關注三個相關領域的背景知識:

信息檢索,最優化,機器學習

信息檢索技術

倒排索引:

倒排索引最基本的操作有兩項:

一是向索引中加入一個新的文檔,

二是給定一個由多個關鍵片語成的查詢時,返回對應的文檔集合

向量空間模型:

向量空間模型VSM則是信息檢索中最基礎且最重要的文檔相似度度量方法之一

VSM的核心有兩點:文檔的表示方法和相似度計算方法

最優化方法

最優化的討論是給定一個數學上明確表達的優化目標之後,如果用系統性的方法和思路找到該問題的最優解

拉格朗日法和凸優化

下降單純性法

梯度下降法

擬牛頓法

Trush-Region法

統計機器學習

最大熵和指數族分布

混合模型和EM演算法

貝葉斯學習

共軛先驗

經驗貝葉斯


推薦閱讀:

CTR預估系列一覽表
為什麼FTRL比FOBOS更容易獲得稀疏解?
計算廣告-前言
CTR預估[九]: Algorithm-GBDT: Boosting Trees

TAG:计算广告学 |