金融騙子的末路!關係圖譜讓他們無處藏身
來源:蘇寧財富資訊
作者:倪偉淵 蘇寧金融研究院高級研究員
金融機構每年都會因欺詐活動遭受大量的資金損失。傳統的欺詐方式包括偽造身份騙貸、車險騙保等。隨著互聯網金融的發展,層出不窮的營銷活動和品類繁多的網貸產品讓欺詐分子有了更多可乘之機,他們的欺詐成本似乎也更低了,足不出戶就可以日進斗金。
為了限制欺詐活動,金融機構和互聯網公司都會構建自己的反欺詐團隊和防範系統,通過種種規則和預測模型將欺詐分子拒之門外。
然而,道高一尺,魔高一丈,再嚴密的規則也難免會有漏洞,加之欺詐手段日新月異和團體欺詐盛行,採用傳統的反欺詐工具總是略顯被動。
因此,關係圖譜就有了用武之地。關係圖譜之於反欺詐,就如同飛機之于軍隊,可以從更高的維度去偵測和打擊對手,實現升維打擊。
什麼是關係圖譜?
關係圖譜是描述個體及個體之間關係的圖。下圖給出了一個移動支付場景的關係圖譜示例,個體類型可以包括IP地址、設備、支付賬戶、賬戶聯繫人等,個體之間也可以存在不同的關係,比如IP登錄行為、設備登錄行為、聯繫人登記行為等。
關係圖譜如何實現「升維打擊」?
主要有四種手段,具體如下:
(1)全維度的事中偵測。在欺詐檢測系統中,諸如登錄時間和位置(例如IP地址)之類的行為線索很容易被欺詐分子改變或偽造,但是欺詐分子很難全面地了解他們所在的整個關係網路(例如轉賬、購物、登錄、瀏覽、還款)。因此,即便欺詐分子儘可能地掩蓋了痕迹,也難免會在關係網路上露出馬腳。比如上圖中的共用設備、共用聯繫人信息、共用IP等就可以作為可疑特徵用於識別欺詐事件。
(2)全局的可視化事後分析。一方面,反欺詐部門分析人員可以根據已定性案件在關係圖譜上呈現出來的全局特徵,優化風控規則和模型。例如,一個可疑賬號可能會登錄多個設備,而這些設備往往會被登錄多個可疑賬號。關係圖譜可以非常直觀地呈現這種間接的多對多關係。另一方面,也可以挖掘看似獨立卻存在間接聯繫的案件之間的關係,識別核心作案人員和其他疑似欺詐分子。
(3)全渠道的標籤傳播。關係圖譜也可以基於現有黑名單,為可疑個體打上相應標籤,用於反欺詐規則和風險提示。假設已確認一個黃牛常用手機號,可在關係圖譜中把這個手機號直接和間接關聯的賬戶、手機號、地址、銀行卡等個體打上「疑似黃牛」的標籤。這種路線便是標籤傳播(如下圖)。
(4)高效的信息檢索。傳統的數據存儲通常基於關係型資料庫,比如轉賬、登錄等各種關係分別存儲在不同的表中,想要抽取多級關係信息則需要連接多個表才能實現。而關係圖譜一般存儲於圖資料庫中,常用的圖資料庫如neo4j、orientDB等。當關係深度較小時,比如深度為2(類似查詢朋友的朋友這種關係),關係型資料庫和圖資料庫的性能相當;當關係深度超過2時,關係型資料庫所需的查詢時間達到圖資料庫所需時間的上百倍甚至上千倍,這時圖資料庫的性能優勢就非常明顯了。
構建關係圖譜的關鍵點是什麼?
數據,數據,還是數據。
目前構建關係圖譜的一個重大挑戰在於用戶的行為數據是割裂的,散布在政府機關、傳統金融機構、運營商和互聯網公司的數據中心,任何一方都很難獲取用戶端到端、全渠道的數據,缺失關鍵信息則會顯著影響偵測欺詐行為的效果。可以說,數據決定了關係圖譜作用的上限,而圖譜的本體設計和相關圖演算法都要基於原始數據。
因此,各家公司都在積極外拓數據源,近些年各類數據服務公司如雨後春筍般湧現,也印證了市場需求。
另一方面,關係圖譜還需要充分利用已有數據,比如時間序列信息,構建動態關係圖譜(如下圖)來更有效地預測和識別欺詐風險。
隨著物聯網的技術發展和場景豐富,可以展望這樣一個未來:一個人的所有行為都將被數字化並映射到關係圖譜上……
http://weixin.qq.com/r/mEiSir-EaeIWrfvp9x2K (二維碼自動識別)
編輯:陳霞 楊娜
推薦閱讀: