從運營數據甄別渠道作弊之三種境界

如何判斷渠道的質量和狡猾程度,如何判斷用戶是否真實、是否來自牆、是否機刷or肉刷而來,是運營人員乃至整個公司最為頭疼的事情,因為事關成本,成本則事關生死,不可謂不大。

那麼我們如何識別真假用戶,從而有效的管理渠道呢?從運營的角度,要是能根據上量的用戶的綜合價值來給渠道付費,那當然就是最佳策略。什麼叫用戶的綜合價值,那就是該用戶為公司創造出來的綜合價值,價值包括但不限於:

  • 1) 直接利潤價值:比如購買行為,產生收入和潛在的利潤;
  • 2) 內容價值:比如產生了積極的、優質內容,間接的創造價值等
  • 3) 傳播價值:比如因為ta的傳播,引發了其他用戶的使用等等;
  • 4) 衍生價值:停留時長或關注時長,所帶來的廣告收益等;

每個App的行業不同,這四種價值側重不同。但是為什麼我們App運營者這個甲方,從來就沒有按照這個邏輯給渠道結算呢,而是按照下載激活這樣最坑爹的方式進行議價結算,這又是另外一個問題,我們將另起文章討論。

因為按照激活這個時間作為結算的時間節點對我們來說,這個時間窗口太短,對甄別用戶的真假帶來巨大的挑戰。

在這個巨大的挑戰面前,就分化出作弊防護的不同境界。

第一個境界——事後諸葛亮,事前豬一樣

稍微量化一下這個境界,發現作弊的時間需要7天以上,能感知到40%左右的假量用戶,其他超過半數的作假不能確保;通俗的講,知道自己被騙了,但不知道騙了多少。他們的手段一般是這樣的:

(一) 看留存率

根據長期的鬥爭經驗,他們發現渠道刷量會選擇在次日、7日、30日這些重要時間點上導入用戶數據。然後發現APP在次日、7日、30日這些關鍵時間點上的數據明顯高於其他時間點。而真實的用戶的留存曲線是一條平滑的指數衰減曲線,如果他們發現留存曲線存在陡升陡降的異常波動,基本上就是渠道干預了數據。

(一) 看用戶終端信息

1) 低價設備排名:根據經驗分析渠道的新增用戶或者啟動用戶的設備排名。如果發現某款低價設備排名異常靠前,他們就視其為異常,開始報警。

(二) 新版本操作系統的佔比:經過渠道多年蹂躪,運營人員終於發現,很多渠道刷量工作室在操作系統版本的適配上會有延時。查看渠道用戶的操作系統時,可以和全體手機網民的操作系統的分布做比較。

1) 註冊昵稱的分布和規律,很多低端的刷假量的註冊昵稱有很強的規律性,各位運營看官肯定遇到這樣的情況;

2) 註冊手機號碼的歸屬地分布,這點相比各位看官也遇到過,某個渠道上來的用戶手機號碼不但來自某運營商的某個地市,甚至都是連號手機號碼。

3) wifi 網路的使用情況:比如說2G、3G、4G的使用比例分布是否正常等等。

小結:該境界中的運營者嚴重依賴於個人經驗,工具手段不專業化,操作效率低下,耗費人力物力,但發現問題時間滯後,而且稍微高級一點的作弊行為不能被發現。

第二個境界——亡羊補牢,損失在所難免:

在這個段位的選手,甄別出真假的時間周期大概是2-7天之間,識別出來的假量大概在40%-70%之間,通俗的講,他們可以比較確定性的識別出很大一部分假量用戶,如果商務條件比較給力的話,是可以控制損失範圍的。之所以有這樣的效果是因為他們採用了一些專業的手段:

(一) 單個指標

  • 1) IP:是否為黑名單IP、是否為代理IP,跟一個巨大的黑名單庫進行比對;
  • 2) IMEI:是否為黑名單IP;
  • 3) 手機號碼:號碼是否非法,是否在黑名單;

(二) 群體指標

  • 1) IP:用戶IP的地域分布是否符合先驗數據的分布,地域包括國內的省份分布和海外市場的分布,;
  • 2) IMEI:用戶IMEI號的地域分布是否符合先驗數據的分布,IMEI所代表的製造商的分布是否隨機;
  • 3) OS:該渠道操作系統版本的分布情況是否符合一定的隨機性和統計性,並與之前的先驗數據進行對比判斷;
  • 4) 機型:機型分布是否符合先驗數據,以及最新智能手機出貨量的比例;
  • 5) 位置信息:位置信息打開的比例,以及獲取到位置信息的地域分布比例是否符合先驗數據的分布,是否符合渠道承諾的地域情況,是否符合應用的實際分布情況;
  • 6) 運營商:運營商的數據分布是否隨機,是否符合國內運營商的正常分布,以及海外運營商的隨機分布;
  • 7) 網路接入方式:wifi、2G、3G、4G的分布比例是否與先驗數據保持同樣的趨勢和數據特徵;

(三) 信息一致性:

設備一致性的驗證,包括:CPU、製造商、MAC地址、IMEI、機型、操作系統的一致性驗證;

一般而言,通用的統計分析工具是實現不小上述的分布,這就需要用專業的作弊防護軟體或安全軟體來。

這個境界的運營者已經擺脫了手工處理,依賴個人經驗的階段,而是走上了演算法和數據的專業化路線,但問題是每家的演算法能力和數據積累參差不齊,因此在效果上各家能力差異很大,而渠道反過來猜測各個運營者的能力的強弱,來給他們摻不同比例的假量。

第三個境界——當下即斷,零損失可以期待

在這個段位的選手,甄別用戶的真假所需時間從15分鐘到30分鐘,如果是時間窗口延伸到24小時,那麼他們的把握將更大。那麼他們是如何做到的呢?總結一句話就是:軟硬兼施,進攻是最好的防守!

(一) 硬手段:

所謂硬手段就是在用戶端的硬體上下功夫下手段,進駐在用戶硬體設備上的SDK主動進行探嗅,探測硬體環境的變化、操作系統環境的異常、以及各種應用介面是否被劫持。第一時間得到用戶智能設備的狀態。當該用戶的手機硬體及其系統環境出現異常時,立刻在後台對該用戶的所有數據進行縝密的審核,1)追蹤其IP及埠的狀態,以及IP的歷史行為;2)追蹤其IMEI以及IMSI的對應關係,IMEI和IMSI基本可以理解為一把鑰匙一把鎖的對應,偽造一個IMEI號容易,但要想連同IMSI一同偽造,這個成本就變得奇高無比。而整個過程可以控制在15-30分鐘,為跟渠道斗(si)爭(bi)贏得充分時間窗口。

(二) 軟手段:

在第二境界的基礎上,他們通過長期的數據積累和研究發現:各個指標反饋出來的信息強弱不同,因此對所有的指標進行賦值,並讓這些指標對該群用戶做作弊投票,當累計值超過閥值時,宣布該用戶為可疑用戶。這樣就可以完成了在24小時內對用戶真假的補充判斷。

要達到這個水平,不僅需要長期大量的數據積累和與時俱進的更新,還要有強大的數據處理演算法和軟硬通吃的技術實力。如果本篇閱讀數過萬,點贊數過百,我們就為您披露更進一步的信息,那家的技術分別達到哪個境界了。


推薦閱讀:

如何看待在特朗普聲明遭奧巴馬政府竊聽後美國多地爆發支持特朗普遊行?(March 4 Trump)?

TAG:移动应用运营 | 渠道推广 | 反作弊 |