計算廣告和機器學習的興起
Facebook數據分析團隊早期負責人之一Jeff Hammerbacher在離開Facebook的時候留下一句很有名的話,「為什麼這些聰明人都在絞盡腦汁讓人點擊廣告?」
為什麼?為什麼?為什麼?因為這件事情make money!現在幾乎所有的主流互聯網公司都是靠賣廣告賺的腰包鼓鼓,國外的google和facebook,國內的BAT。這些公司最大的收入來源就是廣告(騰訊除外,最大的收入來源是遊戲)。
但是,互聯網廣告有什麼優勢?互聯網廣告系統簡直就是印鈔機,搭建好了之後就可以自動給互聯網巨頭帶來強勁的現金流,機器學習在這裡面又起到了什麼作用?這可能可以解釋為什麼機器學習會跟著火了起來。
互聯網廣告的興起
1995年,以Yahoo為代表的門戶網站的興起。20世紀末Yahoo取得不錯的流量規模後,變現的方法是把網頁當作線上雜誌進行售賣。這種模式的廣告售賣方式和傳統媒體相差無幾,只不過把廣告從線下搬到了線上,還是靠著銷售人員把廣告賣出去後,按照約定的合約廣告的形式進行投放。
1998年,以Google為代表的搜索引擎興起。與門戶網站不同,搜索引擎的變現採用了與服務自然結合的付費搜索模式,也就是根據用戶的即時興趣定向投送的廣告,而即時興趣的標籤就是關鍵詞。這種廣告可以達到非常精準的程度,而且採用了競價方式進行售賣。
2005年,以youtube為代表的視頻網站的興起。在線視頻的流量不斷攀升,其廣告投放模式也很貼近傳統電視廣告,進一步的蠶食了傳統電視的市場。
很快這些廣告模式就得到了各大廣告商的青睞。因為相比於傳統廣告,數字媒體上的廣告有三個非常大的優勢:1. 用戶花在網上的時間越來越多,而且呈現上升的趨勢,廣告主為了抓住年輕一代的用戶,必須緊跟大勢;2. 在線廣告的投放門檻很低,100美金也可以在Google自助開戶後進行廣告投放,而且可以進行個性化廣告投放,效果可快速量化,馬上就能看到廣告投放效果;3. 廣告上線後,廣告效果更容易優化,也就是AB Testing。
以門戶網站為代表的展示廣告,以搜索引擎為代表的搜索廣告,以視頻網站為代表的品牌廣告。大家從不同起點出發,互相吸收優點,逐漸演化出了一個豐富的廣告市場(CPS、CPM、CPC等不同形態的廣告,分別在廣告的質和量上做到平衡)。門戶網站也演化出了受眾定向廣告;Google演化出了廣告聯盟(Ad network)和程序化(Exchange)廣告市場,將網上的大小網站流量全部收編後快速變現,而大小網站也省去了銷售團隊售賣廣告的成本。
機器學習的興起
互聯網廣告的興起帶動了一門學科的興起,那就是機器學習,現在炙手可熱的AI等都可以認為是機器學習的範疇。(10年前的畢業生誰知道機器學習是怎麼回事兒呢,那個時候只有演算法導論。)
且看機器學習在互聯網廣告中的價值在哪裡?CPC競價廣告出現之後,以競價理論為基礎的GSP(二階競價理論)得到了廣泛應用。廣告投放里有三個玩家:流量採買方(Demand),流量提供方(Supplier)和用戶。流量採買方就是廣告主,提供錢的金主,流量提供方是想變現的網站,用戶就是使用網站的人。廣告投放是三方博弈的結果。流量提供方為了讓自己的流量賣的更值錢,也就是需要優化使得單位流量的價值更高。單位流量價值ECPM=CTR*BID,其中的一個核心技術問題就是CTR預估問題。CTR預估可以歸納為「點擊和不點擊的二分類問題」,然後通過收集用戶行為數據,利用機器學習模型進行優化。(現在終於知道為什麼一堆聰明的人想方設法讓用戶點擊了吧)。當數據收集的越多,特徵刻畫越細緻後,模型學的就會越准。所以大數據+機器學習+廣告讓這個行業的所有參與者都獲得了很大收益。
機器學習這part的知識,歡迎大家關注我同事寫的專欄寫給大家看的機器學習書 - 知乎專欄。
概念
ECPM:Expected Cost Per Mille,千次展現期望收入。
CTR:Click Through Rate,點擊率。BID:點擊價值。
CPC:Cost Per Click。寫在最後的話
此文是計算廣告的系列文章第一篇,本人做直通車技術多年,主要從技術人的角度和理工科人的思維闡述自己關於在線廣告的思考。第二篇將講述"為什麼要砸重金打廣告,不是說酒香不怕巷子深嗎?"歡迎大家關注我和我的專欄。如果你也是業內人士,歡迎申請當專欄作者,投稿交流,一起來維護這個專欄,互相學習促進交流。
關於這個話題,本人最為推崇的學習資料是2011年Yahoo! Research的Andrei Broder在斯坦福大學的公開課Introduction to Computational Advertising。
~~~~更新~~~~
互聯網廣告野史
早期的搜索引擎最早採用的廣告形式是banner ad,現在能想像嗎?這種和用戶搜索詞完全不相關的廣告自然點擊率越來越低。
第一個嘗試現代搜索廣告雛形的公司是Open Text,http://www.opentext.com,我特意去看了看這個頁面,已經完全被驅逐出了搜索市場,先行者不一定能笑到最後啊。
第一個嘗試搜索競價廣告的公司是GoTo,2003年以16.3億美金的價格出售給了Yahoo,但是Yahoo最終在2017年也只賣了48億。市場是如此的殘酷。
第一個使用GSP的公司是Google,這種競價方式能達到納什均衡的穩態。Google的核心演算法PageRank助力google逐步佔領了搜索市場,而該GSP機制助力Google每年入賬數不清的錢。
笑到最後才是真正的贏家。
推薦閱讀:
※SSP能夠給內容商帶來的好處有哪些?與AD Network的本質區別是什麼?
※Online方式點擊率預估時學習率不斷變小,是否可能追不上目標函數的變化?
※如何用機器學習做廣告反作弊?
※廣告點擊預估用深度學習怎麼搞?
※什麼是計算廣告學?