計算廣告-受眾定向核心技術
對於特定的受眾定向技術,需要同時考慮其效果和規模兩方面的指標,同時提供覆蓋率較高但是精準程度有限的標籤和那些非常精準但量相對較小的標籤,
從技術框架來看,受眾定向標籤可以分為用戶標籤,上下文標籤和廣告主定製化標籤3種類型,
上下文定向需要廣告坐在的頁面進行分析,然而這一分析過程與搜索引擎的爬蟲有很大的區別,結合廣告對上下文信息的需求特點,一般可以採用一種半在線的方式抓取和分析頁面,這種方式避免了無效的頁面分析計算,又能夠快速響應需要分析的頁面
行為定向是根據用戶歷史上的網路訪問行為對用戶打標籤的過程,
受眾定向技術分類
用戶標籤:人口屬性定向,行為定向
上下文標籤:地域定向,頻道定向,上下文定向
定製化標籤:重定向,新客推薦
上下文定向
思路:
- 用規則將頁面歸類到一些頻道或者主題分類
- 提取頁面的關鍵詞
- 提取頁面入練錨文本中的關鍵詞
- 提取頁面流量來源中的搜索關鍵詞
- 用主題模型講頁面內容映射到語義空間的一組主題上
半在線抓取系統
上下文頁面的有關信息顯然不可能在廣告請求發生時實時分析得到,那麼是否需要一個類似的搜索引擎爬蟲的系統來預測抓取吶?對於,廣告系統來說,不必要,
半在線抓取系統,系統用一個緩存來保存每個url對應的標籤,當在線的廣告請求到來的時候,進行如下操作:
- 如果該請求的上下文URL在緩存中存在,那麼直接返回其對應的標籤
- 如果該URL在服務中不存在,為了廣告請求能夠及時得到處理,當返回空的標籤集合,同時立即向後台的抓取隊列中加入此URL,這樣可以在較短的一段時間之後該URL就被賺取下來並打上了標籤存入緩存中
- 需要設置緩存合適的TTL時間以做到自動更新標籤
行為定向
行為定向建模的問題:
行為定向問題的目標是找出在某個類型的廣告上eCPM相對較高的人群
如果假設在該類型的廣告上點擊價值近似一致的話,那麼問題就轉化為找到在該類型廣告上點擊率較高的人群
行為定向特徵生成:
行為定向特徵的生成過程有兩點需要討論:一是特徵選擇函數的確定,二是公式對應模型的訓練集的組織和生成過程
最常用的特徵選擇函數就是將一段時間內的原始用戶行為映射到確定的標籤體系上,同時計算出各行為在對應標籤上的累積強度作為模型的特徵輸入
各類行為的標籤化方法:
- 網頁瀏覽,分享等於內容相關的行為可以通過主題模型的方法,將其映射到預先定義好的標籤體系上,也可以直接提取內容中的關鍵詞作為標籤
- 廣告點擊等於廣告活動相關的行為可以轉化為對廣告落地頁內容的分析,因此可以使用與網頁瀏覽相同的方法
- 最值得重視的是搜索,搜索點擊等於查詢相關的行為:可以直接利用搜索引擎做內容擴展,即將查詢送入搜索引擎,用返回的若干結果描述或者鏈接頁內容作為該查詢的對應內容,或者對查詢進行某垂直領域分類,直接利用相應垂直媒體的標籤體系
行為定向的訓練過程實際上就是調整各個標籤類型上各個特定權重的過程,影響訓練結果和效率的因素主要有兩個,
- 訓練集的長度
- 時間片的大小
人口屬性預測
性別的屬性預測的問題可以描述為一個典型的二分類的問題,輸入特徵為用戶的原始行為b
輸出就是兩個列表
建模的情況有兩個問題需要注意:不論用什麼樣的模型來預測人口屬性,必須要有一定的拒識門檻,也就是那些行為不夠豐富不夠有代表性的用戶應該輸出未知的判斷,而不是簡單的模型算出一個結果
推薦閱讀:
※為什麼FTRL比FOBOS更容易獲得稀疏解?
※計算廣告-合約廣告核心技術
※讀書筆記 | 計算廣告
※計算廣告-基礎知識準備
※SSP能夠給內容商帶來的好處有哪些?與AD Network的本質區別是什麼?
TAG:计算广告学 |