淺談風控領域中的用戶畫像

用戶畫像(User Profile)一詞在近幾年瞬間火了起來,由互聯網領頭的各行各業開始不斷的嘗試構建用戶畫像來提供自身的業務能力,那究竟什麼才是用戶畫像,為什麼要構建用戶畫像呢?

用戶畫像介紹

用戶畫像最初是希望產品設計工作者在定性目標用戶時,不再像之前那樣想當然地猜測假想用戶的需求,取而代之的是使用用戶畫像來側寫目標用戶,從而將設計聚焦在真正用戶的動機和行為上。

用戶畫像最早被互聯網應用於電商中,在定性目標用戶時,企業數據分析人員會將用戶數據進行分析,並形成合適的用戶畫像,常見的會包括有姓名,性別,年齡,收貨地址,手機號,銀行卡,身份證號,郵箱等基礎屬性,和瀏覽分類,點擊偏好,購買習慣,登錄設備類型等特殊屬性。然後通過分析此類信息,以方便後續分析了解目標用戶的需求,如男性/女性用戶更傾向於哪類商品,又如90後客戶更偏愛購買哪類商品,不同地域熱銷商品的排行等。

可以看到,用戶畫像可以將用戶人群進行分類,最終目的是為用戶打上各類標籤,如為用戶打上諸如健身用戶、化妝品受眾等標籤,之後市場人員可以對各類標籤用戶提供精準營銷。

為什麼要構建用戶畫像

文本分享的是風控方向的用戶畫像,其和電商側的會有所不同,電商中構建用戶畫像是為了更好的進行精準營銷,提升營業額,轉化率。而在風控領域中構建用戶畫像的目的是:

1. 系統的梳理用戶群體,儘可能的找到異同點並將用戶分類,分類是多維度的,可以是購買偏好,也可以是薅羊毛黨,應該從各個角度去側寫用戶2. 便於更深刻的理解業務,理解用戶需求,風控離不開具體業務,只有深刻理解業務後,才可以拆解出可能的潛在風險3. 便於後期的數據挖掘,了解惡意用戶的行為特徵,可以更具用戶特徵做關聯規則分析4. 便於對不同類型的用戶,採用針對性的風控規則。單純去側寫用戶畫像是沒有意義的,當構建了用戶畫像後,需要結合實際的風控規則,來管控用戶請求事件。

如何構建用戶畫像

在了解了構建用戶畫像的目的後,接下來一起了解如何構建用戶畫像,在風控領域中,一次完整的用戶畫像構建過程為:

收集數據

在現今互聯網的高速發展中,無論是促銷活動,市場推廣,還是網上信貸,都離不開數據,龐大且完整的數據可以提供更多維度的支持。一般來說,需要收集的數據包括但不限於以下幾種:

1. 賬戶數據如賬戶名、手機號、銀行卡號、姓名、年齡、性別、身份證、地址等,這類信息主要提供了用戶的基礎屬性2. 業務數據,主要收集業務場景下的數據,貸款業務有貸款維度的屬性,優惠券兌換有優惠券的信息,在對這部分事件做風控時,業務數據是核心關鍵數據3. 設備信息,在風控過程中,還需要對用戶的常用設備指紋,環境信息進行收集4. 用戶軌跡,主要包括用戶的訪問順序,操作頻率,按鍵信息等

收據的數據信息需要通過業務埋點來將用戶側的信息發送到服務風控側,而後進入數據清洗工作。

數據清洗

顧名思義,將收集的數據進行數據清洗,轉變為需要關注的數據集。在本文最初提到了電商中的用戶畫像,但風控領域的會有所不同,一般將用戶畫像分為兩類:基礎屬性和風控屬性。

基礎屬性包括姓名,性別,年齡,收入,工作,技能,喜好,收貨地址,職業,教育水平,銀行卡號,身份證號等屬性,一般是用來側寫用戶狀態的,此類屬性一般每個用戶都會具有且更新不頻繁,作為用戶基礎屬性,存在畫像中。

相較於基礎屬性,風控屬性具有更強針對性,是針對於不同風控維度屬性的聚合,常見的包括有購買偏好,社交網路,行為特徵,風險偏好等,另外風控屬性又具有極強的業務性,在不同的業務點中,建立的風控屬性有的時候又會有所偏差。

如有的時候在風控過程中,我們需要了解用戶本次登錄是否異常,從用戶畫像的角度,我們需要構建出用戶的常用IP是哪,是否屬於異地登錄,還需要構建出用戶的常用登錄平台,設備是什麼?是時常WEB登錄的,還是時常手機端登錄,是iphone6的用戶群,還是小米等。只有擁有了這些畫像,才能更好的進行風控規則。

數據建模

本文不再在建模分析中深入展開,主要聊一下建模分析過程中的一些問題。在風險建模中,很多時候數據源是龐大的,我們需要用到大數據的分析手段,另外在建模構建用戶畫像的過程中,數據精準是非常重要的,壞樣本的定義和範圍是需要嚴格定義的,這對後期通過規則做查准查全率會有極大影響。所以用戶畫像的驗證階段需要對通過分析打上標籤的結果數據進行驗證,對於有事實依據的(真實壞樣本)和無事實依據的(疑似惡意樣本)需要有一整套完成的驗證機制。

構建畫像

到這一步我們需要開始構建用戶畫像,將一個唯一標誌性KEY(一般為用戶ID)作為「用戶」標識,來對其打上各類標籤。這邊列舉下風控領域的用戶畫像標籤:如是否曾經被盜、常用設備、常用地、消費偏好、所屬企業畫像、是否有危險夥伴往來、手機畫像、IP畫像、社工賬號等。在上述標籤中,不難發現像手機畫像,IP畫像可能並不是直接從數據收集中獲取,這類信息很多時候我們是通過另外的技術手段進行的收集工作,如手機是否為貓池號,是否為小號空號,如IP是否為VPN、代理、是否屬於爬蟲等。

如何使用用戶畫像

如前文所說,用戶畫像最終會給不同的用戶群體打上各類標籤,最終每個用戶可能會各自不同的屬性和多個標籤,這些數據充分地從各個維度刻畫出當前用戶的方方面面,也使相關分析人員可以第一時間了解到想要關注的人群。

用戶畫像是需要結合風控規則一起使用的,在實際風控過程中,當用戶發起一些事件請求如領取優惠券,購買理財產品時,風控系統可以結合事件的風控規則,通過數據服務的篩選,與用戶畫像的比對給出最終的風控響應。一個成熟的風控產品是可以快速甄別符合同樣風險屬性的惡意用戶再次發起事件請求的。

本文屬原創文章,未經許可禁止轉載

推薦閱讀:

用戶畫像之標籤權重演算法
mongo集群可以用來進行海量數據分析嗎?
想了解用戶畫像(Persona)有什麼推薦的書籍or讀物嗎?

TAG:用户画像 | 风险控制 |