DSP機器學習及演算法機制_上【技術類】

通過上述優化要點《上》、《下》及《常見定向優化設置》的介紹,我們會發現有很多很多的因素會影響到廣告投放的效果,而且這些因素之間也常常是互相干擾的。這樣一來我們就會發現單純靠人腦、人工模式,已經很難持續地、7X24小時的、不吃飯不睡覺地、不間斷地進行相應的分析比對,調整優化,並進而根據調整反饋的結果閉環持續優化的工作。這就需要使用技術手段、機器學習、模擬人工智慧的方式,用機器、程序代替人完成那些重複性的邏輯判斷工作。下面我們將對DSP的這些自動化程序化的模塊,例如:內置DMP人群標籤演算法、智能推薦引擎、防作弊等進行介紹。

1. 內置DMP人群標籤演算法

DSP為了完成複雜的投放邏輯及大數據的處理,並運用大數據機器學習的手段,通過計算機自動化地去完成廣告投放,首先就需要建設自己的大數據DMP系統來支持後續的智能演算法推薦引擎。如圖7-11所示,DSP建立內置DMP來對廣告競價做輔助決策支持。DMP是DSP的大腦,指導DSP根據歷史的廣告數據及閉環回收的用戶數據給用戶打上標籤,並結合實時廣告請求中的數據,對廣告曝光機會進行價值預測及出價指導。

圖7?11 DSP內置DMP輔助競價決策示意

那麼大家會很好奇,DSP的大數據DMP系統,是如何根據用戶行為給每個個體打上人群標籤的。我們一般把機器學習的方式分為兩大類:監督式學習(supervised Learning)和非監督式學習(unsupervisedLearning)。要區分兩者很簡單,也非常的重要。

  • 監督式學習(也有稱為「回歸或分類演算法」的):

什麼是監督式學習呢?用分類演算法為例打個比方。這就好比事前我們已經知道人群標籤該有哪些(如上文中按商業營銷訴求對受眾人群屬性的劃分),但是每個個體身上的標籤是什麼那還是未知的。而我們有的是這些個體在網路上的各種行為:例如:瀏覽過內容的URL、點擊過的廣告、留過信息的表單、購物車中的商品、購買的商品等等。在監督式學習中,我們可以將已規劃好的人群標籤,先打到各種不同的行為數據中。例如:瀏覽女性化妝品URL的行為打上「女性」、「時尚」等等這些標籤、購買刮鬍刀產品的行為打上「男性」、「個人護理用品」等等這些標籤。然後再讓計算機,通過將行為上的標籤,同時也打到產生該行為的個體身上去。到這裡大家可能會問啦,剛剛舉的那兩個例子中的標籤具有一定的互斥性(「男性」Vs「女性」),那麼如何確定最終該打上哪些類的標籤呢?實際操作中往往是以權重的方式,來處理這些互斥性的標籤。我們收集到的每個個體的行為數據是海量的,那麼個體被打上標籤的次數自然也是海量的。雖然被無數次的打上標籤,但總有一些標籤被打的次數是重複的,這樣我們就可以在這些標籤上進行計數(即:加權重)。從而我們可以按每個個體身上的標籤按「計數量(權重)」從大到小排序,這樣就能找出這個用戶身上典型行為特徵(即權重較大)的那些標籤族。然後就可以使用這些人群標籤去定向這些人群做廣告投放,或根據這些標籤來進行進一步的數據比對分析和學習。

  • 非監督式學習(也有稱為「聚類演算法」的):

什麼是非監督學習呢?同「監督式學習」比對來說的話,就是事前不知道特徵分類的答案,無法在事前就規劃好標籤分類。只能通過將相似的行為特徵聚合在一起。找出這類受眾或訪客最典型的行為特徵族(我們有的時候也會使用離線模型來存儲這些特徵族的數據,離線是先對在線而言的,離線即事前已存儲好備用的,而在線即每次廣告請求來的時候實時動態計算得出的。)。然後可以直接運用這些離線模型的特徵,指導競價及智能推薦。或者還有一種做法就是,給這類行為特徵族定義一些標籤,再運用上述的監督式學習的方式給更多的用戶打上這類標籤,甚至通過Look-alike的方式去尋找潛客。

當然還有一些介於上述兩種模式中間的變種模式的學習方式,例如:

  • 半監督式學習:即輸入數據部分類別有部分事前已知,而仍有部分沒有被事前已知,介於監督式學習與非監督式學習之間。常見的半監督式學習演算法有支持向量機等等。
  • 強化學習:在這種學習模式下,輸入數據作為對模型的反饋,不像監督模型那樣,輸入數據僅僅是作為一個檢查模型對錯的方式,在強化學習下,輸入數據直接反饋到模型,模型必須對此立刻作出調整。常見的強化學習演算法有時間差學習等等。

更多關於各種機器學習演算法的原理、特點,適用場景等等,以及《樣本訓練》、《回歸驗證》等等的實操流程已曾經介紹過了。這裡就不再展開。

(轉載請註明出處:微信訂閱號:ad_automation)

文字表現力有限,歡迎參加《9月9日「DSP上」專題【線下大課堂】》面對面為您答疑解惑講透您關心的問題。

歡迎購買作者剛出版的《程序化廣告實戰》正版書系統化學習

推薦閱讀:

Big Data (Specialization)
多重預訓練視覺模型的遷移學習
地理大數據的商業金礦,怎麼挖? | 數據俠實驗室07期
2017 年回顧:NLP、深度學習與大數據
2017黑五背後的消費者數據_諸葛io

TAG:大数据 | 数字营销 | 需求方平台DSP |