AI風控落地:同盾科技複雜網路4.0重磅發布,多項創新加碼團伙欺詐分析

AI風控落地:同盾科技複雜網路4.0重磅發布,多項創新加碼團伙欺詐分析

團伙欺詐的泛濫,給傳統風控方式帶來挑戰。同盾科技複雜網路4.0提供實時可視化關聯分析,通過更深層信息挖掘和推理,提供動態分析和監測。在反欺詐領域,如實時團伙檢測、催收號碼識別等,以及客戶價值挖掘等均有廣泛應用。其中,百億級金融圖資料庫(幾百萬團伙及其成員)、風險傳播演算法及知識表示學習系首次發布。

一、欺詐趨勢:團伙欺詐成頑疾

「窮則變、變則通、通則久」

1. 欺詐產業化成新趨勢

近年來,傳統金融機構業務逐漸互聯網化,新金融模式也層出不窮,但金融的本質未變,風控依然是核心。傳統金融風險在互聯網金融領域依然存在。同時,追求速度的互聯網金融也打開了「潘多拉」盒子,「快」意味著效率,也意味著缺陷和額外的風險,事實證明,隨著互聯網金融的普及,金融欺詐也隨之普及,並大有西風壓倒東風之勢,讓從業者聞「欺詐」色變。

「苟富貴,勿相忘」和「逐利性」,讓一部分先「富」起來的人,帶動其他人共同「致富」,並逐漸形成了有組織、有紀律和分工明確的欺詐上下游產業鏈,如專業的技術開發產業、身份信用包裝和虛假身份提供產業、業務漏洞發現和欺詐方法傳授產業。據不完全統計,僅2017年,中國的網路欺詐導致的損失近5000億元。「誰割肉,誰痛苦,誰改變」,因此,金融機構團伙反欺詐的需求強烈而迫切,自是不言而喻的。

2. 團伙欺詐案例

如下選取三個真實的團伙欺詐案例,相關企業及人名已作模糊化處理。

* 案例一:銀行信用卡養卡套現

「某團伙在某村莊以招工的名義大量收取村民的身份證,並申請信用卡,然後刷卡透支,讓村民背負銀行債務。此時,銀行按照過往經驗便會判定該村地址為欺詐地址,使該村村民抹上信用污點。」風控難點:銀行卡套現風險。

* 案例二:汽車金融「零首付」中間團伙騙貸

「某團伙打出『零首付購車』廣告,墊付首付款和代辦貸款,購車人不花錢即可拿到車。於是,購車人購買價值25萬的本田,團伙墊付10萬的首付款後,要求先將車開走用於抵押辦理高額度信用卡,再從信用卡中取走墊付的首付款。當把車開走後便杳無音信,購車人不僅未拿到車,每月得還6000多元的銀行貸款。」風控難點:中間人團伙騙貸已成為汽車金融風險最高的風險類型。

* 案例三:娛樂直播羊毛黨薅羊毛

「某團伙利用某直播平台業務拓展需要,利用大量的新用戶身份信息註冊、登錄平台領取紅包,成功薅羊毛數百萬」。風控難點:快速識別註冊、登錄或營銷場景下,註冊手機號或設備風險。

其他如信貸行業、第三方支付、電商、保險等領域的團伙欺詐也猶如雨後春筍般層出疊見,本文不再一一詳述。

3.團伙欺詐識別的難點&挑戰點

商場如戰場,金融領域競爭激烈,若比競爭對手審核快1s或風控正確率多1%,則市場份額會發生根本改變。「知彼知己」是制勝良策,同盾科技作為智能風控服務商,在分析大量真實團伙欺詐案例基礎上,化繁為簡、歸納總結出團伙欺詐的特點、共性和作案手段,如技術更新快、組織基本穩定、關聯關係強,以及為節省成本,通常會重複利用信息、設備和賬號等(如圖1所示),最終「撥開雲霧見月明」,揪出「狐狸尾巴」。

圖1:團伙欺詐的特點

團伙欺詐導致風控難度急劇上升,基於線性模型的傳統風控,未評估關聯關係對風險的影響。「窮則思變」,單純依靠「增加產品審核流程、全方位的人工調查比對」導致成本居高不下且往往事倍功半,行業迫切需要更多數據源、自動化團伙分析和決策模型。但數據和技術的高門檻讓人望而卻步,非一朝一夕所能解決。

正所謂「當此困頓之局,唯破局者可立」,同盾科技基於」智能誠信網路」理念、技術的持續創新以及新場景的戰略部署,在數據、技術、場景和計算能力方面積累了豐富的實戰經驗,早在2015年即部署複雜網路技術應對團伙欺詐挑戰,經過3年調優,已迭代至複雜網路4.0。

二、破局:同盾科技複雜網路的創新性應用

「工欲善其事,必先利其器」

【知識儲備:人類最擅長的思維方式是將點和線關聯,並由點及面、抽絲剝繭,逐步理清邏其中的輯推理關係。世間萬物是錯綜複雜的關係網,但無論形式多麼複雜,其本質都是簡單的三元組,即:實體-關係-實體。】

1. 複雜網路產品

(1)複雜網路定義

從概念評述:複雜網路能針對複雜對象的關聯關係進行非線性建模,由節點(實體)和節點之間錯綜複雜的關係(實體之間關係)構成拓撲網路,當異常關係聚集出現時,即可識別欺詐行為。拓展了風險識別的邊界和維度,解決了金融場景數據量大、數據複雜和數據不完整的基本問題,幫助金融機構減少風險,降低風控成本,提高決策效率。

從產品評述:複雜網路是同盾科技核心產品和技術之一,融合同盾大數據和外部數據,提供實時可視化關聯分析,將規則、關係及變數通過關係網路表現,通過更深層信息挖掘和推理,提供動態分析和監測。在反欺詐領域,如實時團伙檢測、催收號碼識別等,以及客戶價值挖掘等均有廣泛應用

(2)複雜網路技術原理

「打鐵還需自身硬」,數據和技術是關鍵。同盾科技打通跨行業數據及外部數據,結合文本、圖片等非結構化數據抽取技術,完成結構化與非結構化信息融合,將時空大數據編織成「實體-關係-實體」的拓撲關係網,當輸入「種子數據/線索」,則由點及面、抽絲剝繭,最終順藤摸瓜找到與之有關聯的所有信息,並通過圖計算、知識表示和機器學習等技術進行黑中介團伙等的智能化挖掘分析

圖2:同盾科技複雜網技術原理

知易行難」,同盾科技在複雜網路和知識圖譜領域做了深入探索,在關係網路分析中融合組合、數值和統計思維,積累了一些經驗和技巧。在可擴展性演算法方面:如局部網路推理、高斯-馬爾可夫隨機場中取樣、稀疏化、圖分割、拉普拉斯範式等。數據可視化方面:使用模擬力學模型替代傳統的拓撲圖關係可視化演算法。通過持續的實踐-反饋-實踐,不斷提升複雜網路的精準度。

圖3:複雜網路圖分割探索優化

(3)複雜網路功能

複雜網路在應用上,既可作為產品輸出,也可作為技術能力輸出。

實時風險群體分析、可視化工作台及風險群體報告是複雜網路作為產品輸出的呈現,分別在事前、事中和事後支持欺詐團伙的智能化分析。實時風險群體分析支持靈活的策略配置,可毫秒級返回分析結果(見下圖),如:關聯風險分、豐富的量化指標、關係圖和建議,直觀呈現欺詐團伙的組織形式、核心成員、地址及時間特性。可視化工作台可進行數據動態關聯分析,如分析人員聚類、時間聚類、地址聚類等。風險群體報告則可針對批量數據進行團伙風險分析。

圖4:實時風險群體分析結果

圖5:實時風險群體分析分布圖(中介團伙分布圖,相關詳情已脫敏隱去)

圖6:可視化工作台界面

複雜網路作為技術能力輸出,在催收號碼識別、客戶價值挖掘等產品有應用。

(4)複雜網路應用場景

複雜網路支持全場景的實時數據可視化分析,如:銀行養卡套現、申請欺詐檢測、賬戶保護、羊毛黨識別、惡意刷單作弊等。

2. 複雜網路4.0的創新性

「以終為始」,反欺詐效果是關鍵,創新性體現在三個層面:

其一,數據層面:多源數據融合+NLP,重構金融圖資料庫。

數據比技術更重要」是行業共識,有高質量數據,即使簡單演算法,也能取得好效果。複雜網路4.0融合多來源數據,重構數據清洗、信息抽取和融合方案,使用全新圖資料庫框架,重構金融圖資料庫,新圖資料庫具有分散式、高可擴展性和可維護性,可支持千億級數據毫秒級實時查詢響應。同時,使用NLP技術,將非結構化與結構化數據融合,形成包含100億節點(實體)、300億邊(關係)的金融圖譜

其二,技術層面:結合風險傳播演算法、知識表示和機器學習,進行深度挖掘分析,開啟AI風控。

風控作為金融平台競爭力的核心,最早依賴於規則架構,後來演化為規則加模型架構,現在趨向於 AI。AI風控體現在兩方面:風險傳播演算法、知識表示和機器學習。

1. 風險傳播演算法

風險傳播演算法依據「近朱者赤,近墨者黑「的原理,從已知風險節點角度評估整個網路節點的風險程度。利用網路結構進行風險傳播,進而提高風險節點的覆蓋度。

2. 知識表示和機器學習

構建數據關係網路是「智能分析」的第一步,利用合適方法將數據價值充分發揮,進而挖掘未知的關聯才是目的。使用network

embedding方法將高維信息映射到低維空間,解決數據稀疏問題,使知識融合和推理的性能顯著提升,結合機器學習,利用無監督演算法進行風險群體的識別。實際應用中,通過機器學習對圖分割演算法不斷調優,劃分不同的團伙和團伙特徵,對判斷團伙性質有重要決策作用,如"30%的節點為風險名單"、"40%的節點命中疑似垃圾註冊風險類型"。

其三,應用層面:行業化+本地化並駕齊驅,複雜網路全方位技術輸出。

數據壁壘導致通用關係網無法適應行業特性,在抽取行業特徵基礎上、消除雜訊、構建行業化關係網路勢在必行,如:信貸關係網路、汽車金融關係網路、保險關係網路、羊毛黨關係網路等,提高反欺詐效果。

針對銀行、汽車金融及保險公司,在風控雲方案之外,本地化部署也是著力點之一,可解決強監管,數據無法上「雲」的問題。由於本地化數據業務閉環屬性更強,數據更全面,在標籤數據基礎上,可深度優化有監督學習模型,取得更精準的效果。但無論本地化數據量級多大,相對於跨行業大數據而言,都是「小數據「。融合本地化數據與同盾大數據,結合監督演算法和無監督演算法,進一步反哺原有本地化風控規則,完善本地化方案的不足,進而提高反欺詐效果。

複雜網路作為技術能力全方位向同盾各產品線輸出,如評估系統性風險的小微企業的擔保關係圈、催收號碼識別及基於關係網路的客戶價值挖掘等

三、實踐:典型案例及應用示例分析

「實踐是檢驗真理的唯一標準」

1. 銀行信用卡養卡套現

【行業風險點】信用卡非法套現。

【案例分析】案例一,銀行可以利用複雜網路,抽取現數據關聯性,從關聯中分辨出是否使用類似的電話號碼、地址以及區域,將關聯屬性與其他金融數據輸入深度學習網路做有監督的訓練,在數十萬欺詐案例數據上得到一個動態識別模型。

【複雜網路分析】兩個人共用一套信息(手機號和身份證),進而逐步關聯,形成鏈條型關係網路。

圖7:複雜網路分布圖(id=身份證,mob=手機號,card=銀行卡)

2. 汽車金融中介欺詐

【行業風險點】汽車金融是特殊的金融產品,風控難點:如身份偽造、中介欺詐、團伙欺詐、騙車二抵等,二手車金融作為最有潛力的產品之一,其團伙欺詐風險尤其泛濫。

【案例分析】案例二的汽車金融團伙欺詐,具有典型的地域性和組織性。

【複雜網路分析】

3. 直播娛樂羊毛黨識別

【行業風險點】消費金融、娛樂直播等行業推出的優惠活動,吸引羊毛黨們有組織的參加,逐漸形成了羊毛黨「專業化」、「組織化」和「地域化」的發展趨勢。

【案例分析】案例三可通過複雜網路識別註冊、登錄手機號或設備群體風險,找出團伙的核心成員,分析地址聚集性和組織形式等。

【複雜網路分析】箭頭所指手機號未知風險,單純通過專家規則無法識別其風險。但通過複雜網路分析可知,該手機號所關聯的設備與大量虛假號碼關聯(羊毛黨典型特徵),因而可判定箭頭所指手機號為虛假號碼,為羊毛黨所掌控。

圖9:複雜網路分布圖

「行百里者半九十」,同盾科技複雜網路4.0是又一個新起點。未來,將不斷推陳出新、加快產品技術迭代,如:關係類型深度挖掘推理、資金鏈關係圖等。在應用領域,與銀行、汽車金融和保險領域深度融合,如保險領域的理賠反欺詐場景,如車險,醫療險等場景的團伙欺詐分析,進一步提高團伙欺詐風險識別的精準度和效率。

推薦閱讀:

Python3學習系列(二):編寫屬於自己的網站後台掃描器
法律法規、採購中的風險和安全教育(Day007)
歷時兩周,總算把開源堡壘機的坑給填了
2017年度安全報告 — 平台漏洞
HTTPS那些事之HTTPS原理

TAG:網路安全 | 反欺詐 |