觸寶吳琨:深挖每一位用戶的數據價值,幫我們實現國內第一
快節奏的時代,APP的迭代速度可見一斑,用戶所反饋的數據也是層出不窮,如何去分類別、精細化的去貼近業務的利用數據,來實現正規合理的變現,理所當然的成了當下亟待解決的問題。觸寶告訴你:「建模,或許是個不錯的方法。」
在昨天結束的【友盟+】2016·U-Time 上海站活動中,觸寶科技大數據團隊技術總監吳琨,為我們分享了觸寶電話在大數據方面整合、利用、實戰、變現的經典案例!以下為演講速記,整理時有刪減。
點——線——面用最通俗易懂的方式解讀大數據
圖中的圖標,若干的點,以及遍布全幅的線,可以得到一些信息。它是一個網路,網路中有節點,節點可能是一個具體的用戶,也可能是一個商戶,也可能是一個公司一個機構,節點中又都有信息,但是這些信息都是異構的。異構是一個高端的詞,說的通俗點就是不一樣。既然做大數據,什麼數據是大數據,就是當你發現一個個數據錯綜複雜又亂又差,這是大數據的一個必要條件,不一定是充分的,但是大數據一定是臟、亂、差,如果你的數據都是非常容易可見,那一定不是大數據,我們要做的就是在這些全部不一樣的,但是信息量又很大的數據之中,去挖掘出屬於觸寶也是屬於大家屬於社會的價值。
以下是觸寶的幾個經典的實戰案例,分享給大家。
1、廣告點擊率預估模型第一個,從觸寶電話說起。眾所周知觸寶的輸入法是針對海外市場而言的,而觸寶電話則主要是針對國內市場,也確實做到了國內排名第一的通信軟體。這個不是空穴來風,做一下廣告,觸寶電話一個功能是免費電話,還有一個就是擁有數十億的號碼庫,可以識別騷擾電話等等。當面對這樣大的流量,自然而然的想法就是實現商業化變現,同時這也一定是可能的,只是手段和方式的選擇,觸寶也正處於這個階段。商業化變現最直接的手段——可以做廣告系統,因為觸寶大數據裡面一個小的團隊就是搭建完全屬於自己的廣告平台。這個廣告平台就像一個媒體,可以發布廣告,這就意味著可以通過銷售去接很多廣告過來。
圖中簡單的公式並無太多意思,就是賺錢的多少等於用戶點擊廣告的可能性,乘以這個廣告給你帶來的收益。假設一個廣告三塊錢,95%的人都會點,
那麼相對於一個五塊錢但只有50%的人會點的廣告,三塊錢的廣告就可以優先展示。不過,現實生活中廣告的單價是知道的,但是用戶的可能點擊的概率是不知道的,所以通過大數據建模方式可以做出一個模型來對點擊率進行預估。
主要特徵1
用戶
透過用戶畫像方式。因為觸寶電話有一些屬性,用戶的一些收入、職業,以及他使用的移動終端是什麼樣的,還包括他的一些消費習慣,都把這個作為用戶針對於這個維度的特徵。
2
上下文
這個意思就是時間點、地點、星期點。因為一個人在不同的地點、時間段看到廣告的反映是不一樣的,假設在上海收到一個北京當地O2O的廣告,是沒有辦法點擊也是沒有辦法實現轉化的。
3
廣告
從廣告本身的屬性來看,它是一個遊戲的廣告,還是P2P借錢的廣告,還是一個電商的廣告,這一類廣告以往的一些點擊率的情況,包括在不同的廣告位上所實現的轉化和點擊,都會作為特徵。
擁有了這三個作為模型的總的特徵的集合,再加上最後一環節,通過歷史數據去看,用戶在具體的三類特徵下,有沒有點擊廣告,這個就構成了模型的訓練數據。通過計算機了解以往的不同特徵下來預測,遇到一個相似的環境下面,用戶點擊廣告可能性是多少。那結果是什麼,結果就是賺錢,就提高了20%。
2、簡訊拉活用戶留存拉活是運營的重點
想必大家都比較感興趣的是對失去活躍的用戶的拉活。不管是做何種互聯網產品,用戶的量首先是第一位的,沒有用戶就沒有變現。如果一開始就非常注重拉新,希望獲取新用戶,希望改進產品體驗,可以用一些比較有意思的玩法。觸寶也是藉助其他友商的手段來實現的。所以獲取新用戶有很多的辦法,但當你積累很多的用戶,就會發現每天都被用戶留存率的問題困擾著,每天都是有用戶離開你的產品,不管是什麼原因,做的好的產品可能留存率高一點,但是不可能說哪一款產品的留存是百分之百。
大數據建模——精準化拉活
觸寶電話比較特殊,它知道用戶的電話號碼,所以怎樣去接觸到失去活躍的用戶,最簡單粗暴的方式就是給他打電話,但是太激進了,所以退而求之就是發發簡訊。當今每個手機里的簡訊,幾乎都是機器人發的簡訊。觸寶也做了這個嘗試,發簡訊給失去活躍的用戶,因為我們發現,用戶可能上個禮拜給觸寶傳數據,但這個禮拜就沒有了,我們認為這些是失活用戶。那麼觸寶給用戶發簡訊,有什麼問題?——要錢,還挺貴,所以比如說先發一千個,不要太多,然後看多少人又給上傳數據又開使用了。後台會發現一千個裡面有一百個人用了,當然這些重新「復活」的用戶所對應的數據方面的特徵是什麼,終端機型、性別、用戶畫像、所在地、免費電話居多亦或高端商務居多,都可以做數據分析。如果你是一個數據工程師,從上述數據中進行建模,找到最可能回來的失活用戶。
用戶打分——增效降支
同時可以給這些人打一個分數,分數高的人都在這些用戶中,找出和那些發簡訊回來的用戶很像的人,就可以給高的分,下一次這個錢花的就更有效率,那麼就專門給那些分數高的用戶發。然後做對照實驗,建模之後不要過於激動,因為模型效果不一定如預期好。比如說這次發兩千個,一千還是隨機用戶,還有一千是你可能會回來的人,看效果如何。我們的模型,比如原來發一百條有10個人回來,現在一百條是有60個人回來,這個就使得成本下降到六分之一。拉活,不一定是發簡訊,因為不一定知道用戶的電話號碼,也可以發郵件等等。像一些經常用的外賣APP,但是每天去就不發紅包了,這個都是做留存做拉活的一些策略。
3、http://LU.com高頻拯救低頻
觸寶電話有一個O2O的平台,高頻的應用可以拯救低頻的應用,觸寶在這個平台做了和陸金所的一個合作,就是看轉化率。總的來說套路都差不多,但是具體實施這些步驟的時候,工程方面和業務方面的細節可能會有很多不同的地方。其實都是相通的,通過看過往在觸寶電話有哪些用戶,通過O2O平台消費,並統計消費者的職業、年齡層次、頻率。針對這些比較有可能借錢的人做一個推送,關於陸金所的推送。因為要完成這樣的一個銷售,需要三步,每一步都會有一個轉化,這些轉化都是相輔相成的。能提交的是多少,這上面三步轉化率都有,總體的轉化率也是相差接近七倍。
從細節中運用數據
所以這三個案例都可以看到,不管做什麼事情,通過一種隨機的方式和有一點數據科學的成分,很容易把它做到至少大多數都有翻幾翻的效果。做任何的運營動作的時候,不一定是這個活動,每一個運營活動可能會有很多的細節動作,我們要怎麼做,可能就是藉助數據的力量。
4、新聞流推薦做新聞流是很賺錢的事情,所以觸寶也加入進來,為什麼?在國內會發現facebook是不存在的網站,但是它的廣告平台非常厲害,每個人的主頁上面都是feeds流夾雜廣告,而且這個廣告可以給facebook帶來的收益是非常大的。如果不是專業的用戶看完之後,廣告和非廣告的內容是很難甄別,很多人不知道是廣告。百度的用戶也不知道現在的搜索結果首頁三分之二都是有推廣的。所以說用戶很有可能會去點擊這個廣告,如果對這些廣告做一些個性化設計,就可以在賺錢的同時,可以幫助到用戶。因為一個好的廣告系統,比如說像百度廣告。
舉例說明
比如說用戶搜索台灣旅遊,當用戶在打開其他的網頁就可以推薦台灣旅遊社等等這類內容。如果接入新聞的SDK,比如說接一點資訊,或者是今日頭條,賺的錢不會特別多。第二步,就是自己爬取新聞網站,把這些直接從網站上爬過來,是觸網自己做這些網頁,用戶看到所有的新聞都是在觸寶的伺服器上,所有的新聞的詳細頁面做詳細化的變現。當然對應的技術成本就會高一些。有了這些遠遠不夠,因為簡簡單單的把新聞都拉過來價值不大,所以要有三個變化,要怎樣做到最好地,要做幾個事情。
新聞分類
有一些人喜歡看體育,有一些人喜歡看娛樂,但是有的人非常討厭看娛樂新聞,怎麼做這樣的事情,有人肯定會說,現在新浪網或者是搜狐頻道都分好了,哪個是體育,哪個是娛樂,但事實不是這樣的。這些頻道都是小編做的,可能會有一些其他的東西,比如說美女圖集可能放在NBA裡面,但是一般人並不認為這是NBA的新聞。所以現實中的新聞分類和用戶的期望是不一樣的。先人工的標註,比如說幾千條把它放到觸網很多的新聞分類裡面,然後訓練出一些關於每一個新聞分類期。接下來只要過了一個新聞分類器。接下來只要通過分類器就可以對新聞進行分類,就不需要小編再次打便簽。
用戶端
每一個用戶喜歡看 什麼問題,形成一個新聞興趣點的分布,他70%是看體育,20%是社會新聞,10%是娛樂新聞,這樣可以做他的新聞的個性化,這樣才可以使新聞的點擊率逐步上升。尤其要有截圖那一天的熱點新聞,也是考驗時效性的東西。新聞和其他不一樣,淘寶商品相對來說生命周期比較長,新聞可能就是48小時過了就不能說是新聞了。這個就像劉翔在菜市場買菜,馬上就出來,用戶就會覺得比較好。下面這個是廣告,但是不注意看不出來這個是廣告,這就是原生廣告厲害之處,用戶很可能會點擊。
5、數據可視化——汽車大數據觸寶有自己的數據團隊,也對數據的處理和使用有非常多的經驗,所以也想做一些行業分析或者數據分析,但是做的不是非常普遍或者通用的分析,做的更多的是和自己的業務相關的。現在觸寶和一些汽車的廠商和廣告主有比較好的合作,所以對汽車比較感興趣,也通過一些數據的呈現來展示觸寶大數據的價值,以及能夠至少在這個圖裡面對汽車用戶的有一個定向的能力。
比如最簡單的就是汽車中呈現的男女比例,並不是通常認為的51%和49%的比例。年齡也是比較有意思,25到45是占絕大比例,還有一些地域的分布,大家對於汽車品牌的關注,不能說喜好,像大眾汽車之家上面大眾是被罵的最多的,但是也是賣的最好的。如果說我汽車廣告主需要定向一個地區,一個年齡段,關注某個品牌的用戶,那麼我們的大數據就可以提供這樣的定向能力。
6、廣告數據報告——春節免費電話
觸寶春節免費電話報告是關於用戶撥打電話,主要是免費電話,在春節期間,全中國從哪裡到哪裡是呈現一個怎樣的數據的分布也得到很多很有意思的結論。有的省份特別多,比如說廣東省位列打電話最多第一位,還有哪些用戶往國外打的比較多,國內打的比較多。
還有一個比較有意思的小插曲,春晚有一個小品裡面有一個手機號,其實這個手機號是一個空號,但是通過觸寶的後台數據發現,打給這個空號的用戶也有很多,這很有意思。
總的來說可能這些案例不一定能夠百分之百切合到所有人的業務需求,但是可以從中看到一些什麼東西呢,就是做產品的時候,一定要珍惜用戶留下的數據。然後要使這些數據為增長,為商業化,包括去提高用戶基數拉新拉活要做出貢獻。
推薦閱讀:
※數據時代
※原來電影數據可以這麼玩 - 第一彈:賣座電影最青睞的海報色調
※若想修鍊成數據科學家,最重要的技能居然是...?
※產品經理如何培養數據分析能力
※系列丨指標驅動型SaaS(三):如何獲客