互聯網金融平台如何反欺詐?
一套較為完整的互聯網金融產品風控體系需要包括貸前審批、授信,貸中跟蹤、監控,貸後失聯修復、不良催收,是一個極為複雜的過程,每一個流程都會影響整體的風控質量。鑒於目前的最高票答案已經對整個流程進行了較為全面的梳理。因此,本回答將會將重點放在「大數據「上。
目前互聯網金融產品擁有的數據源主要可分為以下幾類:
a) 身份信息:姓名,身份證號,手機號,銀行卡號 , 地址,婚姻,學歷等
b) 信用信息:歷史貸款申請信息,還款記錄,逾期記錄等
c) 社交信息:通訊錄信息,社交平台數據等
d) 消費信息:銀行卡消費水平,消費能力,高風險行為等
e) 行為信息:手機使用狀況、出行記錄、電商平台交易數據等
f) 合作機構數據:黑名單、白名單客戶等
上述數據源的數據加上申請者提供的數據,就可以組成一個與該申請者相關的巨大的數據集合。利用這個數據集合就可以建立風控體系對用戶的欺詐風險、還款意願、還款能力等進行有效判別。以現金貸為例,我們可以把常見的現金貸大數據風控規則歸類如下:
(1) 勾稽比對
勾稽比對是會計行業的一個常用術語,在風控中主要指利用多維度數據進行邏輯對應關係檢驗的方法,舉例來看:假設用戶填寫的「收入水平」為變數A,「工作地點」為變數B,申請時IP地址的「所處區域」為變數C。從A+B的維度來看,倘若用戶填寫的A月收入有數萬元,B卻顯示在某個偏遠山區的修車廠工作,我們或許應該懷疑用戶隱瞞收入。若從B+C的維度來看,倘若B變數顯示用戶工作地點在北京,C卻顯示申請時IP地址在雲南,或者頻繁更換IP地址去申請,我們或許應該考慮金融欺詐的風險。若結合A+B+C的維度來看,若B變數顯示客戶在北京國貿工作,A變數顯示月入10000元,IP地址、申請地點都在北京,通過三個變數數據的交叉驗證,可以初步推斷申請人是常住北京的中等收入白領。倘若再增加更多變數例如填寫手機號碼常用通話地點等,就能從更多的角度驗證出數據的可靠性。
(2) 交叉檢驗
交叉檢驗與勾稽比對有細微差別,但兩者都是利用多維度數據對用戶真實性和可靠性進行驗證的方法,這裡只簡單舉個例子,例如申請人提供了工作單位地址,但用外部數據驗證結果顯示該單位不再這個地址,那該用戶可能存在欺詐風險。
(3) 強特徵篩選
有一些變數在風控的考量中佔有較大的權重,例如多頭借貸次數,該次數較高意味著用戶存在嚴重的多頭借貸情況嚴重,有較高的違約風險。拿前海徵信常貸客產品驗證結果舉例,命中常貸客客戶信貸逾期風險是普通客戶的3 ~ 4 倍。其它較常見的強特徵變數還有關注機構(催收機構等)通話,工作日夜間通話等。
(4) 風險關係
風險關係主要驗證與申請人相關聯個體的信息。例如,該申請者通訊錄中是否存在較多被列入黑名單的聯繫人,該申請人的生情電話或IP是否曾被另外的申請者使用過等。
(5) 用戶的行為數據
用戶的行為數據也可以很好地用以鑒別金融欺詐。例如通過運營數據統計顯示,在凌晨3點左右申請貸款的用戶的信用風險更高,這可能因為很多欺詐者對智能信貸不熟悉,錯誤地以為凌晨無信貸員審批,防禦薄弱的突破口;此外,申請時多次修改填寫資料的用戶可能存在信息造假,因為普通人通常不會頻繁記錯自己的私人信息。這些獨特的用戶行為數據一定程度上也能甄別風險,反應用戶信用。
互聯網金融發展到今天已經衍生出了許多具有不同特點的產品(例如額度、期限、場景、客戶群等)。因此互聯網金融產品風控體系在搭建過程中需要注意與其所面向的產品的特點相適。
哈哈,怎麼全是乙方在答題,而且看到不少我們的供應商。
作為甲方來回答一下吧。
現在反欺詐領域包括多項內容,從業務層面看,存、貸、匯三塊都存在反欺詐的需求
自己對「貸」這一塊最熟悉,這一塊對反欺詐的需求也最為旺盛,就重點說一下這裡。
由淺入深
一、黑名單篩選首先申請層面,從客戶填寫資料進行反欺詐,首先註冊時客戶的三個要素/四要素需要首先填寫的是姓名+身份證號+手機號+銀行卡號。同時雖然你沒有填寫但是通常在你申請的時候互金機構會通過SDK抓取到你的設備指紋和IP,也就是說會以這6個為索引條件進行黑名帶匹配,命中即拒絕。黑名單包括但不限於:
1公檢法公開的失信、申訴、被執行、吸毒等。
2各類徵信數據聯盟的不良名單(通常為M3+以上)
二、多頭借貸顧名思義就是你在不同平台申請的頻率,依然是通過上面的這些維度進行篩選,一台設備或IP短時間內集中申請,通產會被理解為中介,而以身份證、姓名為條件進行多次申請則會認為是高危人群,也會被放在疑似欺詐中。
三、勾稽規則這個就比較多了,多半是通過對比進行校驗,你自己填寫的收入、工作、住址、借款目的等等都會和平台能夠抓取到的數據進行對比,有硬性的對比,比如學歷、性別、年齡等。也有模糊對比如收入等級、居住地址和單位地址(通過經緯度)等。通常為了防止申請人填寫錯誤、數據錯誤、特殊情況(噪點)導致的誤殺,勾稽規則這一塊採取命中後給於風險分值,分值累加後計算是否超過閥值的方式處理,達到一定閥值人工干涉、達到更高的閥值自動拒絕。通常這些分值也會和多頭產生的疑似欺詐分值進行累積。
四、社交關係這一塊主要是通過你的通話記錄,進行處理,呼出呼入的電話中是否有其他失信人員、黑名單人員、催收公司電話等等,數據足夠大的情況下如騰訊甚至可以做到多層關聯,比如你直接聯繫人是黑名單為一級關聯、你的朋友的聯繫人里有黑名單,那你就是二級關聯。
五、邏輯規則信貸審核中有一句話叫做反常即為妖。比如你填寫自己為朝九晚五公務員,但是收集到的你的運營商數據顯示你的通過話時間集中在工作日的凌晨1點-4點。這裡面也會給與一定的欺詐分值。再比如你填寫的工作為某集團中層管理,但是學歷是大專、年齡只有24歲。明顯不符合邏輯。或者工作是教師,但是你的運營商數據顯示你的物理地址經常在工作日的時間,出現在不同的外省市,撥打或接聽電話。這些都可以做成相關規則。
六、欺詐綜合處理以上處理中狠多規則其實無法直接確認是欺詐操作,但是以風控的思路要對客戶做有罪推論,也就是說我覺得你有嫌疑起碼就要進行嚴格審核,如果要推翻我的懷疑需要有合理的解釋或者邏輯說服,所以反欺詐裡面很多都是除了必死的黑名單項,大部分會進入人工干預。同時對於欺詐分值最終有可能會以決策矩陣的方式對這次借款事件給於額度上的控制,或者對這類客戶在貸後管理中放入到需要頻繁監控的隊列中。
大致思路是這樣,當然具體實施上也會有很多別的技術和思路,但是基本都是以邏輯和大量貸後表現數據為依據,對客戶自己填寫的以及可以搜集到的信息進行檢驗。檢驗是否名中欺詐名單或者你填寫的這個欄位是否落入到了高危欄位或者高危人群、或者你整體的個人畫像明顯存在不符合邏輯的內容
互聯網金融是傳統金融機構與互聯網企業利用互聯網技術和信息通信技術實現資金融通、支付、投資和信息中介服務的新型金融業務模式。近年來,互聯網金融是一個熱點,新的業務模式帶來新的增長點的同時,也對風控帶來了新的挑戰。其中,操作風險中的外部欺詐風險尤其值得關注。
巴塞爾新資本協議中,將操作風險事件分為:內部欺詐,外部欺詐,就業政策和工作場所安全性,客戶、產品及業務,實物資產的損壞,營業中斷及系統癱瘓,執行、交割及流程管理。其中盜竊,偽造,黑客攻擊損失,盜竊信息等都被歸到外部欺詐風險中。
在互聯網金融的業務場景下,由於互聯網的以下特性導致上述外部欺詐風險較之線下業務更為嚴重:
互聯網隱蔽性:在互聯網金融的業務場景下,客戶不再面對面和和業務人員交流,而是通過網路與伺服器交換數據就自動化的完成絕大部分的業務。這些業務不再需要服務提供商與客戶面對面打交道,而互聯網通訊協議本身又是匿名的。這就給欺詐者帶來了偽裝身份的便利,俗話說「在互聯網上,沒人知道你是一條狗」。欺詐者通過簡單的技術手段就可以完成年齡,性別,身份等偽裝,通過網路實施各種欺詐活動。
互金產品的客戶選擇:如線上小額貸等互金產品,其針對的客戶群本身就是缺乏足夠的信用記錄,無法在銀行等渠道獲得授信。如農民工,學生等群體。其中很多人信用意識不高,存在佔小便宜心理,有動機去用各種手段騙取授信。
產品本身的缺陷:在快速搶佔市場的壓力下,各互金公司都催促開發部門儘快推出在線產品。在項目進度壓力下,產品設計實現過程中容易產生種種疏漏,或者從業者經驗不足風控考慮不周,有些產品甚至在業務壓力下放鬆對風控的要求,這些現象都增加了操作風險。另外,基礎IT運維能力不足也容易把敏感數據和業務流程暴露在黑客的攻擊之下。
既然知道了風險的來源,那麼自然就有應對之道,下面幾種招式是互金企業的應對之道。
第一式,大數據馬步
在互聯網金融業務中,系統理論上可以記錄用戶所有網路行為。並且根據業務需求獲得一些隱私相關的業務信息,如用戶GPS位置,郵寄地址,email,手機號等。合理利用這些信息可以對風控和業務來的很大的幫助。
下面是對數據利用的幾個典型場景:對用戶在客戶端的行為軌跡分析和對業務API的訪問,區分正常用戶和惡意用戶;通過對用戶訪問數據的統計分析,發現異常訪問,提供各個層面的風險預警;通過對用戶訪問內容的分析,基於設備指紋或用戶ID關聯,賦予用戶標籤,形成用戶畫像。
大數據是金融風控的基礎,充分利用互聯網服務過程中全面收集用戶信息的便利,將線上線下數據結合,藉助Apache等開源框架下一系列大數據處理利器,配合機器學習神功,有助於各互金公司練就紮實的風控數據底盤,在互聯網驚濤中巍然不動。
第二式,身份識別手段
互聯網上各種欺詐行為常常需要偽裝身份。互金企業需要練就火眼金睛,用各種身份識別手段讓他們原形畢露。江湖上目前常用的幾種方法是:
簡訊驗證碼:簡訊驗證碼是常用的一種鑒別存檔或者當前輸入手機號碼的確在被某一用戶使用的手段。配合電話號碼身份驗證,邏輯上可以證明用戶的身份。簡訊驗證碼是一種簡單快捷的身份驗證方式,但欺詐分子已經有多種應對手段。
語音驗證碼:通過撥打電話,鑒別存檔或者當前輸入手機號碼的確在被某一用戶使用的手段,由於語音識別技術的成熟,與其簡訊驗證效果區別不大。
圖形驗證碼:圖形驗證碼的主要目的是為了區分人與機器,防止大規模機器作弊,但目前黑產已有多種手段應對,甚至出現了打碼平台這樣從原理上擊潰圖形驗證碼的手段。
拖動滑塊式驗證碼:通過拖動圖片或滑動滑塊,配合機器學習技術驗證是否是真人。目前已投入實用,但大規模推廣還需要時間。
設備指紋技術:通過各種手段對設備進行唯一標識的技術,目前有公司已經將人工智慧技術應用於這個領域,取得了不錯的效果。
人臉識別:通過深度學習演算法識別人臉,通常用於身份證或存檔照片比對等場景
虹膜識別:類似於人臉識別,但需要專用設備,互聯網上應用較少見。
基於人臉識別的活體檢測:人臉識別的升級版,不僅可以完成照片比對,還可以識別是否是真人。
四要素驗證等已經在傳統業務中成熟使用的技術。
上述招式配合使用,可以收到安全與用戶使用方便兼得的功效。
第三式,求助外援
現在黑產,早已不是昔日單打獨鬥的小盜,開發者,偽裝工具提供者,培訓者,實施者,變現者通過網路緊密合作,形成了完整的地下產業鏈。面對專業化的欺詐產業鏈,各企業單打獨鬥顯然獨木難支。一個好漢三個幫,眾多第三方解決方案提供商都有自己在特定領域的獨門秘籍,目前市場上的供應商可以分為下面幾類:
整體的風控解決方案提供商/外包商:這類供應商提供風控基礎構架,並根據客戶需求做一定的定製化開發。一些供應商還擔任集成商的角色,負責集成各種服務。
風控建模外包:有一些專業團隊提供專門領域的風控建模服務,幫助數據分析能力不足的互金企業解決緊急的風控建模問題。不過長遠來說,互金公司還是要建立自己的風控能力。
數據提供商:第三方數據提供商一直是風控數據的重要來源。傳統的各要素驗證服務無論線上線下都在使用。一些SaaS風控解決方案提供商,在為各互金企業提供服務的過程中,也整合各家數據提供黑名單服務。另外,一些非互金領域的互聯網企業,在收集到大量的用戶數據後,也將風控數據輸出作為一種變現手段。這些非傳統風控數據的出現,可以豐富風控數據維度,有助於彌補因網路隱蔽性帶來的風險。不過,市場上的數據良莠不齊,互金企業需要建立相應的評估體系快速篩選出合適自己業務的數據。
各領域解決方案提供商:這類供應商常常以SaaS服務的方式提供各領域解決方案,如簡訊驗證,人臉識別,生物探測,設備指紋等。對於大客戶,也能提供私有化部署的方案。一般來說,SaaS方式收費較低,但在使用SaaS服務的過程中,必然有部分業務或用戶數據被供應商收集;而私有化部署雖然能夠保護業務數據,但需要支付較高的成本。
第三方數據源和解決方案在專業領域可以彌補互金公司在技術或資源上以及經驗的不足,充分利用好這些外部服務有助於互金企業快速搭建業務和風控平台,減輕研發壓力。可以把更多的資源投入到核心業務流程和系統安全上。
總的來說,互聯網平台可以利用平台自身沉澱以及外部獲取的數據,結合用戶本次行為的特徵,利用機器學習演算法等手段實時識別和打擊作弊行為,並根據作弊行為的類型實時採取不用風險決策及處置。
由於互聯網平台在數據和技術上的優勢,反作弊行為的識別和處置效率遠遠高於其他平台。
下面結合互聯網平台的特點,提供三種反作弊的思路。
首先,互聯網平台可以利用自身沉澱的用戶數據、環境數據、行為數據,結合生物探針技術採集的本次用戶行為數據,建立用戶、環境、行為畫像以及基於用戶、環境、行為的關係網路。通過機器學習演算法實時識別關係網路中的異常點,完成作弊行為的識別。
其次,根據作弊行為不同的類型和不同的風險等級,通過密碼、上下行簡訊、語音、圖形驗證碼等手段用實時風險決策引擎核實用戶行為。同時,互聯網公司還可以利用自身數據和技術優勢,開發出生物識別,問卷核身等突破難度較大的識別手段,進一步保證及時制止用戶作弊行為。
最後,互聯網平台利用自身大數據優勢,可以將歷史上所有識別的作弊行為歸類存儲,並且關聯擴散出更多的異常用戶、環境、行為數據。將這些數據通過黑名單及和現有行為比較等方式利用,增加作弊行為的識別率和作弊難度。
以上,互聯網平台可以利用數據和技術優勢,在識別、校驗、處置全環節實時打擊作弊行為,增加作弊行為成本,有效防範作弊行為。
一、合作前的徵信。
從央行或上海資信(央行下屬公司)獲取個人徵信報告。央行的個人徵信報告可通過合作的金融機構獲取;至於上海資信,據說一般的P2P廠商都可以接入這個平台,從而可以達到信息共享的目的。二、合作後的打擊(違約披露)。
通過央行或上海資信的徵信系統披露違約信息;當然一般企業也都會搭建自己的黑名單資料庫。總的來講,必須得有一個信用信息系統,要麼自建,要麼依靠第三方。金融公司反欺詐針對不同的欺詐情況會有不同的應對策略。
根據不同的業務可能遇到的欺詐客戶建立相對的策略。
既然說到欺詐就先不講違約和高風險的問題 。
惡意欺詐借貸不同信用卡包括以下幾個問題
重中之重
內部員工合夥欺詐
該類問題占欺詐比應該是最高的 危害也是最大的。欺詐手段有針對性,不可複製性和災難性。內鬼級別越高越嚴重。
此類問題 反欺詐很難。通常是通過輪崗和審計排查,針對批貸客戶進行回訪和確認。對拒貸或者查詢出來的黑名單客戶的負責人 審批人盡興專項調查,逐一篩查高風險單子。冒名欺詐
非申請人本人的欺詐。
該類問題 在自動審批過程中較難查出,需要人工電話審核進行複審針對提供的聯繫人 及客戶所在公司和電話進行複核。盡量和申請人本人取得聯繫。合夥欺詐
此類欺詐往往多為複雜
申請貸款往往互為聯繫人,互相掩護欺詐,該類問題 需要在系統級別注意聯繫人關係和聯繫電話及公司出現頻率,及時觀測。系統級別上需要建立申請單信息和申請聯繫人的關聯關係查詢。第三方數據對接
此處不做詳談簡單來說就是第三方的黑名單導入和共享。
————————————————————————————————————————
2017年6月更
原答案說的更多的是 人工策略
隨著科技發展和數據積累這一年 已經有了很多成熟的技術應用方式。
技術應用方式和策略 可以多參考京東白條和前海研究院的答案
但是有一些關鍵點,希望看到這個問題的朋友多注意
如果你是一個從業者,要多思考合規合法問題,遇到爬取數據要思量法律風險。中國的「互聯網金融」「金融科技」等概念公司會逐漸併入到傳統金融領域的監管中去。這是趨勢。哪些數據能用,怎麼用,是不是有使用的權利,是未來需要考量的。不要一味強調大數據策略,和數據體量。如何合法採集利用可能是未來監管規範的重點。
如果你是外行 或者初入者,既不要迷信科技策略,也不要鄙夷數據採集手段。科技進步是趨勢。個人信息,包括各位所認知的「隱私」信息,企業進行收集和處理最終是為了更好的服務於社會和個人。一切皆以人為本。
風控是所有金融業務的核心。金融借貸業務例如抵押貸款、消費貸款、供應鏈金融都需要數據來識別欺詐用戶及評估用戶信用水平。傳統的金融風控主要利用客戶的信用屬性數據,一般採用20個緯度左右的變數,利用信用評分來識別客戶的信用風險。
互聯網金融的大數據風控並不是對傳統風控的顛覆,而是對傳統風控的豐富。大數據風控除了利用申請人的信用屬性數據外,還將收集其他各種維度的信息(如行動軌跡、行為傾向、興趣愛好、社交屬性等),藉助機器學習演算法來揭示申請人的欺詐風險和信用風險。常見的互聯網金融大數據風控方式有以下八類:
身 份 認 證
姓名、手機號、身份證號、銀行卡號、身份證照片、申請人生活照、身份證在公安庫中關聯的照片,這幾類信息的相互驗證是互金行業的必備的風控手段。此外,越來越多的機構採用手機號實際使用人驗證、關聯人驗證、居住地址驗證、工作地址驗證、同戶人員驗證等信息來查驗申請人的資料真實性。
負面信息記錄
個人的信用記錄是申請貸款時非常重要的一項參考因素,負面信息和不良信用記錄都需要納入考慮的範圍之內。目前的負面信息記錄主要包含黑、灰名單記錄,網路公開負面信息,司法信息(司法被執行人、法院結案等),黃牛、刷單號碼,賭博、吸毒記錄等。
這些負面記錄能直接反應貸款人的信用情況,也是大數據風控中必備的數據之一。但是目前市場上宣稱的負面信息記錄總條數超過3000萬,這其中有些是金融機構通過歷史的放貸所積累出來的黑名單,另外一些則是濫竽充數,依次充好。負面信息記錄的真實效果如何需要互金機構自己來評估。
信息共享
「信息共享聯盟」主要是通過免費或低價的形式接入信息共享平台,建立信息互聯互通、聯防聯控機制。通過整合接入機構的查詢請求,信息共享平台可以獲取到某個身份ID在某段時間的申請記錄,用以防範申請人的多次借貸。同時,某些信息共享平台還要求接入機構向其提供更多的關於申請人的信息,比如家庭地址、工作單位、聯繫人電話等。
通過對這些信息的整合,信息共享平台可以建議一個龐大的關聯網路,挖掘群體性欺詐等高風險內容。使用信息共享平台的優勢在於其能夠看到申請人是否有多重借貸記錄,而缺點則是平台需要有較大的體量才能體現出效果且平台的數據純凈性不太可控。
關聯網路分析
關聯網路分析是用於挖掘申請人之間,申請人與其關聯人之間關係的有效方式。目前大部分的互金機構都會收集用戶的手機通訊錄或者通話記錄,利用這些數據在輔以申請信息中的聯繫人、家庭地址和工作地址。互金機構可以構建一個超大的關聯網路,對於識別群體欺詐,惡意欺詐和失聯召回都具有較大作用。
比如,欺詐用戶在填寫信息時,往往能發現一些奇怪的規律:不同的城市中小區名字樓層房號相同、不同的單位地址電話相同,還有填寫虛假的小區、地址和單位名稱以及電話信息等,互金機構可根據這種異常來識別欺詐。採用關聯網路的優勢在於能夠挖掘更深層次的欺詐行為,但困難在於需要依賴於較大體量的數據和分析能力。
還款能力評估
大數據風控不僅可以判斷借款人的身份,還可以評估其還款能力。傳統金融對借款人還款能力的判斷主要依據其收入,但是,有些客戶擁有工資以外的收入,例如投資收入、顧問諮詢收入等。另外一些客戶可能從父母、伴侶、朋友那裡獲得其他的財政支持。
舉一個例子,家庭主婦並沒有直接的收入來源,按理來說還款能力比較弱,但是如果丈夫收入很高,家庭日常支出由其太太做主,那麼就明顯不能只靠收入來判斷了。這種情況下,就需要藉助消費數據了,常用的消費記錄有銀行卡消費、電商購物、公共事業費記錄、大宗商品消費等,還可以參考航空記錄、手機話費等方式,例如頭等艙乘坐次數,旅遊消費、奢侈品會員、4s店的消費記錄都是十分有意義的數據。消費記錄能夠有效的輔助機構對申請人的收入評估,但缺點在於消費數據收集困難,呈數據孤島的形態。
社會屬性分析
通過對數據的分析,其實不難發現,在一定程度上可以通過借款人的社會屬性和行為來判斷他是否會違約。
設備屬性
目前移動端的互金業務一般會獲取用戶設備的各種信息,如實時位置、手機安裝的app列表,申請人填寫信息的順序、時間等。欺詐用戶一般會使用模擬器進行貸款申請,設備數據可以識別出貸款人是否使用模擬器。
欺詐用戶也有一些典型特徵,例如很多設備聚集在一個區域,一起申請貸款;欺詐設備不安裝生活和工具用App,僅僅安裝和貸款有關的App,可能還安裝了一些密碼破譯軟體或者其他的惡意軟體。這些信息都有助於獲取到更為客觀的信息,能有效的識別申請人的性質,但局限在於更適用於APP端,其他渠道所能獲取到的信息較少,並且某些信息需要申請人授權才能獲取。
信息修復
當客戶失聯的時候,電話地址等傳統修復手段的效果有限,這時就需要通過綜合大數據,精準查找修復失聯債務人,全面挖掘客戶在運營商(手機)、社交(微信、qq等)、互聯網(購物、租車、婚介)等各個場景下預留的新的聯繫方式或者其親屬的聯繫方式,提高客戶觸達率。解決逾期高階階段出現的客戶失聯、地址不真實、資產情況無法評估等問題。信息修復能夠在一定程度上降低企業的損失,但有侵犯客戶隱私的嫌疑,需要慎重使用。
綜上所述,互聯網金融的大數據風控採用了用戶社會行為和社會屬性數據,在一定程度上補充了傳統風控數據維度不足的缺點,能夠更加全面識別出欺詐客戶,評價客戶的風險水平。
做好風控,做好擔保我認為,互聯網金融平台反欺詐的現狀是,只有發生了「真金白銀」的損失,企業才會想起事後補救。因此,通過技術和數據手段,在危機發生之前識別並解決業務中的各類風險,才是反欺詐之道。
舉幾個例子
春運前夕,小王緊張地守在屏幕前,提前登陸好12306,點擊查詢,看到票,立馬下單,然而票已經沒了。「放票那幾天,每天守著12306,每次剛看到票瞬間就沒了。票到底去哪了?」小王百思不得其解。
微信刷得正酣,突然跳出一條催收簡訊讓小王虎軀一震:「您在XXX的借款已涉嫌惡意拖欠,您的案子將移交我司司法部通過有關法律途徑追究相關法律責任……」從未在網貸平台借款,卻陷入被催收漩渦中。這究竟是誰搞的鬼?
一元秒殺iphone,從來都搶不到……
手機被盜,騙子簡訊接踵而至……凡此種種,僅僅是網路黑產的冰山一角。實際上,黑灰色互聯網行業已經形成了一條巨大的產業鏈,網路黑產鏈條呈現分工明確、組織嚴密的特點,初步估計,中國「網路黑產」從業人員已經超過160萬,市場規模達到千億級別。
企業在做什麼?
以前,企業注意力更多放在傳統安全領域,如黑客、漏洞等。但當下的互聯網安全不再是傳統PC互聯網時代所說的安全了,業務安全、反欺詐逐漸成為更值得關注的重點。不保障業務安全,流失信息和財富就會成為常態。為有效解決這一問題,豈安科技推出了互聯網業務安全分析系統。
目前市場上為企業提供業務安全分析的以SaaS(Software-as-a-Service,軟體即服務)模式為主,而豈安科技採用了SaaS+本地化的解決方案。相較於SaaS模式,本地化的解決方案解決了用戶數據外泄的問題。
區分互聯網世界「好人」和「壞人」
當前,網路詐騙已經成為新的犯罪方法。Aberdeen Group在近期發布了以北美幾百家公司數據為樣本的爬蟲調查報告,數據顯示,2015年網站流量中的真人訪問僅為總流量的54.4%,剩餘的流量由27%的好爬蟲和18.6%的惡意爬蟲構成。最近BAE Systems調查顯示,85%的企業認為他們為可能面臨的網路攻擊做好了防禦準備。實際情況是,在過去半年內,這些企業中有40%都遭到了攻擊,平均損失超過50萬美元。
在互聯網上分辨「詐騙用戶」至關重要。互聯網世界如真實世界,也有「好人」和「壞人」。而豈安科技的出現,就是幫助用戶判斷互聯網上的「好人」和「壞人」,從而過濾「詐騙用戶」。
識別方法並不高深莫測,主要用過「用戶畫像」的方式來完成。每個人在上網時習慣也不盡相同,經常瀏覽的文章、圖片、網站點擊的順序等信息,足以形成用戶的基礎畫像,用風控系統的語言來描述即「正常用戶」。
舉例來說,公司小王要去茶水間拿西瓜吃,正常情況下小王從座位走到茶水間需要40步,但某天監控系統發現他只用1步就走到了,顯然不合常理。如果小王利用這個漏洞頻繁拿西瓜,就會使辦公室其他同事就無法享受這個福利。對應成互聯網語言,即風控系統認為小王是一個異常用戶,因為他的行為不符合正常邏輯,而他的操作可能會給企業或平台造成巨大影響。
豈安科技就是這樣通過海量數據採集,再進行後台大規模數據運算,分析出該用戶的行為模式。如此,只要符合該用戶行為模式行為即為用戶本人,反之則需要謹慎判斷用戶身份、來意和企圖。
反欺詐急需事前預防
互聯網發展至今,一些在互聯網上利用網路欺詐、盜取等非法手段,獲取利益的「黑色產業」在陰影中不斷滋生。網路爬蟲、羊毛黨、刷單等現象逐漸形成了黑色產業鏈,這條蠶食互聯網資本的「吸血蟲」,成為互聯網時代創業者們創業成功的巨大阻礙。
- 有些電商企業網站上的數據任由競爭對手爬取,直到爬蟲太多使網站宕機,才會處理;
- P2P理財企業,會以某幾款高收益率的理財產品或者現金紅包來拉新,但這些理財產品和紅包經常會被少數人用作弊手段搶走,業內稱「薅羊毛」……
如果企業的運營和安全團隊不夠細心,則很難發現此類問題。
用戶數據流失到競爭對手手中,無疑會對企業造成巨大打擊。但是,互聯網企業應對用戶隱私數據的防禦措施和自我保護意識都仍然較弱,導致企業通常在財富流失後,才想到解決「壞人」的問題。
而廠商安全意識不夠高,的確有歷史原因。互聯網是個新興的行業,很多廠商進入行業不久,在沒吃到安全方面的苦頭之前,並不太願意花太多預算到業務安全上。當然,當企業遭遇了「薅羊毛」、「被撞庫」這樣的安全問題之後,自然會對業務安全重視起來。
豈安科技的解決方案則可以很好的解決這些問題——不僅可以提供業務安全解決方案,還能幫助客戶認清自己需求。豈安科技在切入這一市場時,把風險劃分為三個階段去控制,分別是風險事前、事中和事後。
- 風險事前(一般是在用戶支付行為前)主要由Red.Q業務風險情報雲來輔助判斷。多數情況下惡意用戶會使用隱藏IP地址和虛假手機號碼來完成註冊登錄、下單等行為,通過對用戶的IP地址、手機號碼等信息的比對,可以有效發現未知風險。
- 風險事中則主要由Warden系統(業務風險實時檢測系統)完成。通過採集用戶在網站或APP上的行為信息來判斷是否是惡意用戶,並且這一系統部署在公司本地保障其敏感數據安全性。業務風險分析平台 Warden 在設計上的思路就很超前,採用了以網路流量旁路鏡像作為最前端輸入,然後加工成業務日誌這種無埋點的數據採集模式。
簡單來說,Red.Q與Warden之關係如同電影《速度與激情》中的天眼系統,Red.Q負責提供情報和前科證據,而Warden負責抓犯罪證據,重點在一個抓字。
天眼
- 風險事後承載數據回放、模型迭代等功能。
而在這三個階段中,風險事前可以將危險扼殺在搖籃里,尤為重要。
業務安全任重道遠啊
目前互聯網營銷推廣活動爭取一個新用戶的花費高達50元。很多情況下,幾萬、幾十萬的推廣預算投入市場,大部分被羊毛黨奪取。這樣就導致不僅活動的目的沒有達到,還產生大量垃圾、虛假用戶給產品帶來負擔,也將嚴重影響真實用戶的使用體驗。
各大企業營銷推廣上燒的錢,養肥了月入過萬的「羊毛黨」。然而,刷單、羊毛黨只是業務詐欺的冰山一角,企業面臨的網站爬蟲導致網站宕機,掃號撞庫導致賬號盜用,商業敏感信息泄露等業務風險,更應該引起重視。
豈安科技目前的企業用戶主要為泛電商、互聯網金融公司和互動娛樂公司的大中型企業。而這些客戶大致可以分為兩種類型:
- 一種是為了讓自己的風控做得更好,運用豈安科技產品提高風險可視化的能力和發現問題的響應速度;
- 另一種是基於團隊對整個黑色產業鏈的了解,運用豈安科技產品找到一些突發性問題的矛盾點。截至目前,豈安科技提供的產品累積處理異常數據已超過3億條。
作為高性價比產品,豈安科技平均可以幫助每家客戶每個月省下70到90萬的信息安全維護費用,每年可以可以節省一千萬。能夠節省開支的互聯網安全維護產品,新興企業自然更容易接受。
從長遠看,互聯網依然很脆弱,需要更強大的安全防護措施,巨頭們大力投入安全業務策略各不相同,卻不約而同反映了業務安全將是未來的重點。企業應該不斷提升自己的容災備災能力,在攻防對抗激烈的互聯網江湖裡,只有不斷進步,方能快人一步。
如果說互聯網時代可以追蹤一個人當下的信息,那麼大數據時代,可以通過技術「預知」一個人未來的行為方式。具體到P2P網貸平台,則可以通過對數據的抓取和挖掘分析,根據借款人以往的各種商業信息作參考,判斷他們的風險係數,欺詐和預期的可能性。
在中國,信用借款壞賬大致分為兩類:一類是借款人在借款時主觀上就不想還款,這被稱之為欺詐;另一類是借款後,還款能力出現了問題而還不起款。由於國內個人徵信體系尚不完善,中國欺詐違約比例明顯高於國外。
傳統P2P貸款審批業務主要基於審貸人員的主觀判斷,初步的定性分析以及政策制度來實現。由於目前徵信及監管環境的限制,P2P平台很難獲得充裕的數據、信用記錄用於信貸管理環節,一定程度上推高了行業的信貸風險。如今,風險控制能力和作業效率將成為未來的核心競爭力。然而,對於P2P平台來講,數據量化風控體系不是簡單的數據堆積,而是一種發現有效數據、數據間的相互關係以及挖掘數據背後隱藏的信息的能力,從而更好地對個人信用風險進行評估。
現在,低廉的線上造假成本和層出不窮的信用詐騙手段,大大降低了網貸申請過程中詐騙難度,給P2P平颱風險識別帶來了很大的挑戰。
據普惠金融信息服務有限公司此前發布的信審資料庫統計顯示,每100個拒貸案件中,就有16起涉及不同程度的蓄意造假或欺騙,欺詐行為已經成為P2P平颱風控要面對的大敵之一。網貸行業存在嚴重造假行為的原因包括:線上造假成本低廉、詐騙技術不斷更新,包裝代辦公司迅速崛起,社會個人徵信體系不完善,大量平台對風控的重視程度低等。
由於P2P目標人群屬於社會信用領域的次級人群,具有信用行為的特殊性和複雜性,無法參考傳統銀行的基於抵押為核心的貸款模式,在進行反欺詐甄別過程中,需要考慮的變數數量更多,各變數之間的關聯性更為複雜。
在高質量數據的基礎上,運用關聯、分類、聚類、異常挖掘等方法構建了多層、多維、多結構反欺詐和量化風控模型,將傳統銀行信貸中的欺詐規則融入到數學模型體系中,並對模型進行集成,通過數以百計的人群行為變數重現借款人的社會特徵,實現對欺詐行為更為準確地識別。
愛錢進會根據歷史數據,分析「壞人」(逾期借款人)有哪些共同特徵,「好人」(優質借款人)又有哪些共同特徵,將這些數據做成評分卡,用統計學建立模型,預測一個借款人未來可能做出的行為,把這個模型套用到新進來的客戶上,「好人」甚至可以當天獲批貸款,而「壞人」會被標黑,有些數據存疑的借款人會被標灰,留待再進行人工審核。
其實,P2P平台拍拍貸此前已表示,通過多年的數據積累和反覆修正,已經建立了自己的反欺詐體系;今年4月,互聯網金融平台愛錢進也宣稱,藉助母公司普惠金融的風控實力,正式推出國內P2P網貸行業首個動態反欺詐模型體系。此外,徵信機構中智誠也於6月15日上線開始運行針對網貸業和互聯網金融機構專門研發的反欺詐雲平台等。 「反欺詐」亦被益博睿、FICO等外資徵信公司提到了一個非常重要的位置。
邦幫堂副總裁王秀萍表示,外資徵信機構的反欺詐技術與服務更加成熟,但在中國並沒有太多的數據積累;類似同盾科技這種本土服務商,對國情更熟悉,反欺詐經驗較多,也更了解國內P2P平台的需求,但由於成立時間不長,加上國內徵信基礎設施的不健全,在數據的豐富上還有很大提升空間;此外,P2P平台在服務用戶的過程中積累了大量數據和反欺詐經驗,反欺詐的方法和手段也更直接有效,但在數據全面性上,與專業第三方機構相比還存有一定的差距。
不單單是反欺詐就能起到風控作用 有業內人士指出,並不是單單的反欺詐就能起到作用,一般都是要組合來用,例如正常的風控系統都是黑名單、反欺詐、評分卡三個組合在一起。這是大數據和專業能力的結合產品,有了數據不會分析、不會建立模型,數據也發揮不了很好的作用。
互聯網的虛擬性給P2P平台的風控提出了更高的要求,傳統風控手段已不足以完全把控風險和收益的關係,在互聯網金融蓬勃發展的背景下,時刻都有資金在互聯網上流轉。因此,保障交易安全、降低網路欺詐發生率的重要性不言而喻。
信通中國首席風控官王加武此前也指出,風控技術一直被看做是P2P行業的隱性門檻,也是P2P企業能夠正常運營的核心與保障,而在國內徵信體系尚不完善等背景下,建立科學、完善的風控體系,促進企業及整個行業的健康發展,仍是每一家企業不容迴避的責任。
為滿足P2P等小微金融機構的反欺詐等風控需求,第三方風控機構神州融與全球最大徵信局Experian聯合開發的大數據風控平台,已率先與眾多徵信機構對接,整合了國內權威的第三方徵信機構和電商平台等信貸應用場景的徵信數據,涵蓋用戶的交易、行為、身份、學歷、工商、通信信息和各類防欺詐規則、評分卡等,幫助小微金融機構快速識別欺詐風險,通過全球最優秀的ExperianSMG3決策引擎工具,幫助小微金融機構實現全信貸生命周期的風控管理和優化。
欺詐主要有申請欺詐、交易欺詐,一般是引用反欺詐系統,在系統中部署相關的規則,通過規則報警,人工調查,來識別欺詐份子。申請欺詐:GBG DecTech,算話徵信,同盾,芝麻信用,百融金服等都有自己的反欺詐服務系統,通常的規則包括黑名單,身份信息是否一致,同一設備、IP、手機等是否進價量大之類的規則。交易欺詐:Falcon、PRM等系統,規則通常是短時間頻繁交易,大額交易,補卡盜刷等。其實不管什麼系統,最重要的是欺詐風險人員的經驗和敏感性,畢竟欺詐份子的手段也是不斷變化,因此規則也是不斷調整才行,我覺得最重要的是欺詐風險人員對數據的分析能力和對業務的經驗和敏感性。常年混跡互聯網金融圈,當下很多p2p,消費分期等都採用大數據支撐,輔助反欺詐,前端過濾,還能幫助貸中補全修複信息,舉幾個簡單例子:
1.前端:信息驗真
很簡單,通過身份驗真、實名認證判斷是否本人;填寫個人資料是否真實,本人手機號碼,真實常用聯繫人信息(通過和電商消費購物數據交叉地址還能得出常用聯繫人地址),等等2.貸中:信息補全交叉驗證:
通過支付數據、消費數據、金融數據、社交數據、移動端數據和運營數據等,運用先進的大數據和機器學習演算法,能深度挖掘用戶的個人身份基本信息、收入支出信息、興趣愛好、個人影響力、社會關係等並形成相關分析報告。
以上都是現在P2P真實在使用的一些在線使用的大數據反欺詐實例,一般都會接入多家數據源實現更全面的信息補全,降低由於信息不對稱的帶來的欺詐風險。
「現階段各家銀行在系統內防範及應對電子銀行交易風險問題已經取得了一定成效,但如果出現電子銀行跨行犯罪,僅憑一家銀行的一己之力難以解決。」CFCA應用開發部副總經理王洪波表示,建立一套跨行的電子銀行風險及欺詐交易聯合防範系統,共享電子銀行欺詐賬戶信息、快速協查跨行風險交易信息、聯合防控跨行欺詐交易十分有必要。
欺詐與反欺詐:互聯網金融新常態 金融O2O時代,消費者對便捷、安全、快捷的支付需求持續增加,與此同時,受到垃圾註冊、盜號、身份冒用、串聯交易、惡意騙貸、盜卡偽卡、套現洗錢衝擊的可能性也在加大。這孕育了反欺詐這一行。以杭州同盾科技為代表的反欺詐及風險管理服務商,這兩年客戶遍及P2P、互聯網理財、電商、SNS、O2O、第三方支付、銀行等多個行業。
其COO馬駿驅在一次演講中,揭示出當下網路欺詐的4個特徵:團伙化、地域化、年輕化。以信用卡欺詐為例,就形成了木馬、盜卡、盜號、欺詐、銷贓的一條龍產業。
2014年,全球平均27%的持卡人遭遇過欺詐,而中國42%的信用卡持卡人遭遇過欺詐,高於美國(41%)、印度(41%),僅次於阿聯酋(44%)。欺詐對信用卡用戶的影響很大,研究表明,21%的用戶經歷欺詐後停止使用現有信用卡,63%的 用戶降低了信用卡的使用頻率,43%的用戶在舊卡被盜用後減少了新卡的使用。
同盾的後台系統能夠實時反映全國各地互聯網欺詐事件的發生情況。內蒙古、山東、甘肅、湖南、四川成為互聯網欺詐團伙化作案最為嚴重的前五大省份。網路欺詐分子顯現出明顯的年輕化趨勢。19到24歲,這是欺詐行為最為高發的年紀。另一方面,攻守雙方的水平極度失衡,用馬的話形容,欺詐分子是特工,很多防禦者只是菜鳥。
同盾的基本策略,是聯絡各個行業共享失信名單,建立全局欺詐信息庫。具體的防禦手段,包括環境檢測(如WI-FI環境是否異常、設備手機是否異常)、代理檢測(準確識別當前用戶是否使用了代理訪問網站,並獲取真實IP)、高危賬號監控(持續 更新高危賬號信息庫,及時發現風險)、地理位置定位(快速精準地定位訪問者的地理位置)等。
互聯網金融反欺詐,如同當年的PC殺毒,或許也將孕育百億美元級別的公司。
互聯網金融行業反欺詐,信貸反欺詐我覺得通付盾做的很不錯,通付盾信貸反欺詐是在線設備識別、規則引擎等多項創新技術,提供風險識別、控制等服務,幫助網貸、電商、第三方支付、O2O、物流、社交門戶、遊戲娛樂、眾籌、航空等企業防範各類業務欺詐威脅,實時監控企業平台上的設備行為,基於深度學習技術對設備行為進行多維度風險關聯分析,並匯總平台用戶欺詐情報,全方位動態預警業務欺詐風險,進而智能化自動攔截欺詐操作,或指導企業
(2)信貸反欺詐:
基於海量數據掃描,通過貸前真實性審核、信用資質核查以及貸後失聯信息修復等嚴格的貸後管理體系,從而實現全周期業務管理。
貸前審核
個性化定製符合信貸企業風控需求的審核策略,如針對申請人的風險數據、消費特徵等核驗,將申請材料、不良信用記錄和多平台借貸記錄等可靠的數據源加以整合。為信貸企業提供完備審核報告,幫助信貸企業高效識別團伙欺詐、機構代辦等高風險行為,實現風險控制,減少資金損失。
貸前審核核心功能
n 真實性核查:對用戶的身份證、姓名、手機號、銀行卡等信息真實性進行校驗,幫助機構節約人力和時間成本,降低惡意欺詐風險。
n 信用資質核查:對借款人的歷史借貸風險數據、日常生活消費特徵等行為數據進行審核,前置性判斷用戶的還款能力(經濟實力)和還款意願(道德風險),為信貸決策提供參考依據。
n 識別團伙騙貸:深度挖掘分析借貸人關聯信息,找出存在騙貸嫌疑的機構團伙,比如黑中介或惡意騙貸團伙。
貸後管理
針對失信借貸人,以海量數據作基,短時高效修復借貸失聯人失信記錄和聯繫方式等信息,協助借貸機構動態監控借款人的信息變更、調整相應的催收策略,進而追討逾期欠款,提高催收成功率,有效降低平台壞賬風險。
貸後管理核心功能
基於大數據挖掘修復失信借貸人詳細信息,提供多種信息修復方式,高效、便捷、全面修複電話號碼信息,幫助催收人聯繫借款人,提高催收成功率。
(3)核心優勢
強大的數據源:合法、準確、穩定、實時更新的豐富數據源,利用精密演算法進行高效清洗,使用靈活策略交叉匹配綜合分析,精準的分析成果對信貸決策具有相當價值。
紮實的技術基礎:將通付盾設備指紋技術融合進反欺詐數據核驗服務,從時間與空間兩個風險分析角度完成借貸人信貸行為的動態畫像,通過設備指紋與設備畫像作為串聯個人信息數據碎片的索引。
定製化服務體系:可根據不同信貸企業需求,在借貸申請和貸後催收環節制定完善服務監控體系,有效識別惡意借貸、團伙欺詐、機構代辦等高風險行為,幫助信貸機構降低風險、減少資金損失。
反欺詐是最重要的環節在中國
一般來講P2P公司或者說互聯網金融公司都有自己的客戶黑名單庫,申請的客戶首先會進入公司自有的黑名單庫,接下來可能會進入自己公司設置的反欺詐規則(公司根據積累的惡意違約客戶的特徵歸納出來的規則集),只要觸發即拒絕。另外有條件的公司還會再接入第三方公司的黑名單庫及深入挖掘的客戶信息相互佐證,用以判斷客戶是否有欺詐嫌疑。
有平台系統 安全軟體之類的 技術風控都會有操作的使用的真實身份信息來借款就不是欺詐了。
反欺詐的防範可以使用知識圖譜
首先解釋一下什麼叫知識圖譜
知識圖譜本質上是語義網路,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。在知識圖譜里,每個節點表示現實世界中存在的「實體」,每條邊為實體與實體之間的「關係」。知識圖譜是關係的最有效的表示方式。通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關係網路。知識圖譜提供了從「關係」的角度去分析問題的能力。
下邊再來說說反欺詐
反欺詐是風控中非常重要的一道環節。基於大數據的反欺詐的難點在於如何把不同來源的數據(結構化,非結構)整合在一起,並構建反欺詐引擎,從而有效地識別出欺詐案件(比如身份造假,團體欺詐,代辦包裝等)。而且不少欺詐案件會涉及到複雜的關係網路,這也給欺詐審核帶來了新的挑戰。 知識圖譜,作為關係的直接表示方式,可以很好地解決這兩個問題。 首先,知識圖譜提供非常便捷的方式來添加新的數據源,這一點在前面提到過。其次,知識圖譜本身就是用來表示關係的,這種直觀的表示方法可以幫助我們更有效地分析複雜關係中存在的特定的潛在風險。
反欺詐的核心是人!!!首先需要把與借款人相關的所有的數據源打通,並構建包含多數據源的知識圖譜,從而整合成為一台機器可以理解的結構化的知識。在這裡,我們不僅可以整合借款人的基本信息(比如申請時填寫的信息),還可以把借款人的消費記錄、行為記錄、網上的瀏覽記錄等整合到整個知識圖譜里,從而進行分析和預測。這裡的一個難點是很多的數據都是從網路上獲取的非結構化數據,需要利用機器學習、自然語言處理技術把這些數據變成結構化的數據。
推薦閱讀:
※城管在城市建設中扮演者什麼樣的角色?
※如何看待摩拜單車完成超 6 億美元的 E 輪融資?可能帶來哪些影響?
※人工智慧這麼熱,有沒有什麼實際落地的好的產品,是和實體行業有深度結合的?
※有哪些拿著望遠鏡都找不到競爭對手的產品?