誰能談談銀行的風控模型做什麼的,大致實現是怎樣的?

P2P金融和寶寶們8%的保底金融的風控是如何實現的?互聯網金融的風控模型和傳統的金融界的風控有何不同?現在的各大互聯網、P2P金融的風控模型大致能做到什麼程度,何如評價他們的現實意義?

------------------------------

據我了解,很多P2P他們不僅在做分類,而且還在做預測,他們把一個投資人的錢,分散給不同的借貸人,
來降低風險


一般來講,

餘額支付的風險識別模型分為兩類:(1)盜號交易識別風險和(2)盜卡交易識別風險。其中盜卡交易識別風險和餘額有關主要是由於騙子註冊號碼幫盜來的卡,然後進行充值到餘額,通過餘額支付銷贓。(1)和(2)兩種針對的情景不一樣,採用的特徵變數和變數的重要性很大程度是不一樣的。針對(1)的問題,主要是看當前交易相對用戶之前的行為是否存在異常。針對(2)的問題,主要看用戶信息和綁卡的信息匹配的一致性,可信性,以及當前賬號的可信度。

在整體篇,提到風險識別領域採用的常規的方法是專家規則系列和模型系列。規則體系中每個規則針更多對單一風險場景和問題來制定的,偏重精準性和稍微兼顧覆蓋率。模型系列更加覆蓋率,模型不斷學習來增加識別各種風險場景的能力。模型的一個好處就是可以不斷學習,對各種風險場景可以有個統一的量化評估,比如0-100分。如果一個風控團隊想對外輸出風控能力,一個必備的能力,就是必須對外輸出風險評分,決策層讓客戶自己做,而不是直接輸出拒絕,還是放過。這篇,我主要談談關於盜號的風控模型:餘額支付盜號交易識別的風險評分模型。主要圍繞圖1展開:

http://mmbiz.qpic.cn/mmbiz_png/fjCibJUhD7aeuNbQWhIP1gWAHNWe8yE77yjSAGunYAiczzibOEHKFluyqPKl8ZOmYkDbVwUKXun5POSgibjYma22dQ/640?wx_fmt=pngtp=webpwxfrom=5wx_lazy=1移除點擊此處添加圖片說明文字

二 樣本和特徵

風險評分模型可以看成一個二分類問題,就是設計個模型能把好的交易樣本和壞的交易樣本儘可能區分出來。做風險評分模型這個項目前,先得積累足夠多的數據(樣本和特徵),不然真是巧婦難為無米之炊。所以,系統需要有套收集數據的機制,尤其是壞樣本的數據收集機制。對於交易而言,可以以訂單號來標記一條樣本,樣本由多個特徵變數組成,這些特徵變數基本可以包含交易維度的變數,交易雙方的特徵變數等。

首先,系統需記錄整體交易這些相關的數據。然後,通過人工標記壞樣本的方式來記錄壞樣本訂單號,在支付領域壞樣本人工標記方式可以通過用戶報損反饋,也可以是人工通過相關黑信息關聯找出來的標記樣本。系統設計是儘可能多的和並且儘可能精準的的收集到壞樣本。對於好樣本,如果樣本特徵變數中不包含某些周期性變數,可以負採樣過去幾天的交易樣本,最好有距離目前時間一周以上的時間間隔,方便用戶反饋,從裡面剔除壞樣本和某些設定規則下的過濾的樣本(存在異常樣本和沒有報損的樣本)。

在風控建模領域,一個典型的問題就是樣本有偏。舉個例子說明:假如你發現騙子符合某些聚集特徵,你指定策略1進行打擊後,騙子的這種欺詐手段被控制,以後的損失案例都不具備這樣的聚集特徵。如果你的壞樣本的收集時間在策略1上線之後,這個時候模型訓練的結果極有可能出現滿足聚集特徵的風險低,不滿足聚集特徵的交易反而風險高,也就是說聚集特徵的權重是負數。這時候模型的解釋性出了問題,這個也是模型訓練中一個過擬合問題的範疇。為了有效解決這個問題,可以根據業務經驗來查看模型中變數的權重是否與經驗相悖,如果相悖,需要仔細評估。對於是樣本有偏帶來的問題,可以通過重新加入符合某些條件的樣本來彌補。對於這些彌補的樣本獲取方法一種可以從攔截樣本中選擇,一個可以根據經驗來人工生成樣本。

談談模型的不平衡學習。風控模型學習是個典型的不平衡學習問題,他同時具備不平衡學習領域兩個問題:(1)正負樣本比率懸殊,但是正負類樣本都足夠多;(2)正樣本樣本個數也很稀少。第一個問題是基本滿足樣本在特徵空間的覆蓋情況,只是比率較大導致某些學習模型應用會出現問題。第二個問題是樣本太少,導致樣本在特徵空間的覆蓋很小,極容易過擬合,不能覆蓋特徵空間和對欺詐場景的覆蓋。對於第二個問題,最好的方法還是先收集樣本+一些不平衡學習方法。對於正負樣本的比率問題,有的用1:1,有的人用1:10,有的說是1:13.這些大多都是經驗。我一般用,其實也是經驗,1:10。其實,對於比率這個問題,說到底就是負樣本該採樣多少的問題。我覺得只要保證負樣本也儘可能多滿足覆蓋特徵空間就好,因為很多負樣本(好的交易樣本)模式都是很相似的,對於相似的模式不用保留太多的樣本。但是本來正樣本就少,如果負樣本和正樣本一樣多,我個人認為隨機採樣的負樣本覆蓋的特徵空間會很小,所以,我個人不是很贊同1:1的比率。

三 特徵預處理

特徵大體可以分為連續特徵變數和類目特徵變數。特徵預處理主要會圍繞這兩類特徵來進行的。主要分為缺失值填充,異常值處理,連續特徵歸一化處理,連續特徵離散化處理。

3.1 缺失值填充

特徵的缺失值填充前,我們需要先統計特徵的缺失值比率。採用某個特徵來區別正常交易和異常交易前,這個特徵的缺失值比率不能超過一定的閾值。對於缺失值填充的常用方法有:均值,中值,0值等。

3.2 異常值處理

可能由於某些原因,導致系統在收集樣本時候,出現錯誤,特徵值過大或者過小。當然,這個可能本來數據就是這樣,但是,我們也需要做個處理。常用的方法:設置分位點做截斷,比如0.1%,99.9%分位點等。

3.3 連續特徵歸一化處理

對於連續特徵,比如用戶的註冊時間間隔,原來的值範圍各自不同,不在統一的尺度。有的連續特徵值範圍大,有的連續特徵值範圍小。如果不做歸一化處理,連續特徵中值範圍的大的特徵會淹沒值範圍小的連續特徵對模型的影響。所以,有必要對連續特徵做歸一化處理。

常用的連續特徵歸一化處理方法:(1)min-max方法; (2)z-score方法。

對於互聯網數據,很多特徵呈現長尾power-law分布,所以,大多場景針對這種情況在做min-max 或者z-score之前,會對連續特徵先做log(x)變換。

3.4 連續特徵離散化處理

相對連續特徵歸一化處理,還可以對連續特徵進行離散化處理。在logistic regression中,大家經常會把連續特徵做離散化處理,好處:(1)是避免特徵因為和目標值非線性關係帶來的影響;(2)離散化也是種給lr線性模型帶來非線性的一種方法;(3)方便引入交叉特徵;(4)工程實現上的trick。

常見的離散化處理手法:非監督的方法和監督的方法。非監督的方法:等寬,等頻,經驗,分布圖劃分等。監督方法:基於信息增益或卡方檢驗的區間分裂演算法和基於信息增益或卡方檢驗的區間合併演算法等。我個人常用的監督的方法是合併演算法。

在風控採用lr模型的時候,對於連續特徵採用離散化處理會有個這樣的問題:因為我們的壞樣本是針對過去的欺詐場景的,欺詐手法在長期博弈中不斷升級。我們不僅要讓模型儘可能多的覆蓋過去的欺詐手法,對未來產生欺詐對抗有一定的適應性,不至於失效太快。採用離散化處理後,就可能出現很大的跳變性。假設我們過去的的壞樣本都是剛註冊不久的用戶,那註冊時間間隔做離散化處理時候,就可能分為A,B兩段,離散化處理後可以看成0-1二值變數,落在A段為1,否則為0。為1時候風險高,權重為正值。如果這個變數在過去對正負樣本區分度很高,可以看成核心變數的話,那如果騙子繞過A段,跳到B段的話,對模型的預測能力衰弱會是致命的。

四 特徵選擇

模型訓練前必不可少的一項工作就是特徵選擇,包括特徵重要性和決定最終哪些特徵會進入模型。對於一個領域專家來說,看你採用的特徵集合和以及特徵的重要性分布基本就能看出你模型大體會對那些場景預測的准,哪些場景你是預測不出來的。在風控領域就相當於特徵集合決定你能覆蓋哪些欺詐場景,會對哪些場景的正常交易進行了誤判。對於一個風控領域新人來說,最快的進入領域就是看目前風控系統模型採用了哪些特徵集合以及特徵的重要程度。

談談在模型訓練前做特徵選擇的幾個好處:(1)去除冗餘,不相關特徵;(2)減少維度災難;(3)節省工程空間成本。常用的方法:(1)信息值:information value,簡稱IV值;IV值越大,重要程度越高。(2)信息增益: information gain; 是採用信息熵的方法,信息增益表示信息熵的變化, 增益越大,說明特徵區分度越明顯。(3)前向後向選擇,依賴模型,通過AIC或者BIC來選擇最優特徵集合。

五 模型

5.1 模型簡介

這裡採用的模型是logistic regression ,簡稱LR模型。選擇這個模型的理由:(1)簡單,可解釋性強;(2)線上實施響應時間快,風控有在線實時響應時間限制,所以在特徵變數使用和模型複雜度上都有要求。

特徵變數方面:基於歷史的變數需要提前計算好,調用外部介面所需要的變數要麼在支付環節之前某個環節預獲取或者採用非同步方式(非同步方式會影響當前判斷的準確性)。

模型方面:最好選擇簡單和泛化能力強的模型,複雜或者ensemble model在離線實驗也許表現好,但是在線上未必好,複雜模型尤其是GBDT這種ensemble模型在風控數據下容易過擬合(風控數據小)。從我在風控應用模型的經驗來看,目前階段還不是拼模型的階段,更多是找到風險特徵。模型對惡意行為識別不好,更多可能是惡意特徵沒覆蓋或者突破了當前模型的幾個核心變數。

下圖是LR模型的簡介:

這是個預測函數,訓練樣本就是為了求解這個w。這裡面涉及損失函數設計問題和最優值求解問題。常用的損失函數是logloss:

模型中採用正則化是為了避免過擬合,我覺得風控建模上一個重要問題就是過擬合,避免幾個核心變數的權重過大。常用的最優求解方法有如下幾種:(1)batch 梯度下降法;(2)L-BFGS。

5.2 模型訓練和評估

訓練: 劃分數據集為訓練集和測試集: 採用 k-fold cross-validation 交叉驗證。K可取5或者10等。選擇模型,如Logistic Regression 模型,調節參數,對訓練集進行訓練,直至模型收斂,然後對測試集進行預測。可以用k-fold的平均結果作為整體預測結果來衡量模型。

評估指標: AUC,準確率和召回率, F1-score等。

下圖是ROC曲線和風險評分預測分值的累積分布:

這裡面再提一點:就是上面這些評估指標即使表現良好,但是也未必說明模型應用沒什麼問題。常見的一點:特徵的相關性影響(特徵相關性對模型抗噪性有影響)。對於強相關的特徵需要做下處理,能整合成一個變數最好。特徵相關性在模型結果的表現上可能會出現特徵的權重正負方向和大家認知相反,比如某個高風險特徵和預測結果應該呈現正相關,但是模型結果顯示卻呈現負相關。這個大多由於另外一個更強特徵和該特徵呈現相關性造成的。相關性導致的這些問題,會讓模型的解釋性出現問題。在風控領域,模型解釋性很重要。

5.3 風險評分的應用

計算線上不同分值段交易量大小,最好能給出不同分值段惡意交易比率。可以根據不同業務場景設定不同分數閾值,即使同一場景也可以根據不同分數閾值來進行不同的懲罰手段,分數很高的時候可以進行凍結賬號等。值得一提的是,交易行為中有一定數量的高危行為,但是這些高危行為未必都是欺詐行為,異常不代表欺詐。很多正常的人某些行為和欺詐很相似,同樣欺詐者隨著博弈對抗加劇,也越來越偽裝成正常交易。在風控,有時候為了增加對欺詐行為的覆蓋,犧牲一小部分用戶支付體驗,也是值得的。我認為,風控一個重要的工作就是在風險和支付體驗上獲取平衡,如果支付體驗不好,風險控制再好,也是沒有意義的。

風險評分應用一個重要的方面:對交易評分實時查詢,相應變數值展示,以及重要變數觸犯展示等一些列解釋行為。這塊叫做告訴別人為什麼你風險高或者為什麼風險低。

更多互金職場信息請關注【互金職場】

http://weixin.qq.com/r/Sy4mPonE3NSjrc1d93tZ (二維碼自動識別)


謝邀。但這個問題真回答不了,因為跨度太大,我只能談一些原則性問題。

所謂風險定價模型,其實大多是毛估估的,我想除阿里外,大部分應該這樣。

銀行的風險也是很粗的,按照類別進行分類定價而已,例如按照客戶類型或保全方式來分類,只是所定價格應該能覆蓋風險就可以了。然後排除一些類型,基本上就構成了風險模型。有些則採用評分標準,按照分數評估風險,所以沒有那麼神秘。


這一個問題基本上是問了7個問題,跨度大到都不知從何答起,未必能夠全部一一回答,但嘗試談幾個觀點看看是否能解答到。

1. 銀行的風控模型的出發點主要是測量借款方的還款能力,即借得起多少錢和還得起多少錢,也就是對借款方做個評級。一般來講,模型都包含了兩部分的評判,即客觀性的和主觀性的。客觀性的主要是數據類型,能量化的。如公司的年度審計財務報告,銀行流水,繳稅金額等,這些數據放在已設定好的模型里就能給出個分數或等級,做為參考。但光靠客觀數據還不夠,比如說這公司所在的行業是淘汰落後的行業(如鋼鐵、水泥等),那麼評級可能需要有些降級,再比如說公司的管理人在該行業的經驗年限的長短,都會影響到這家公司的風險,所以這部分就得靠人為主觀的去做些調整。

2. 寶寶類的產品基本沒有8%收益的,因為寶寶類的主要對接的是貨幣基金。貨幣市場都是機構市場,如果有大的流動性變動都會影響到寶寶類產品的收益率,如央行宣布降准,即給市場注入流動性,理論上資金成本會下降,即寶寶類的收益率也會下降。P2P理財當中有些是活期8%的,背後對接的資產不可能是貨幣基金,一般都是對接貸款資產。有部分P2P是做個人借款的,那麼即多個貸款資產做成個資產包,然後包裝成產品,投資者投了這產品後,即是分散的投資了整個資產包的一小部分,從而達到了分散投資的效果,降低投資風險。

3. 「互聯網金融的風控模型和傳統的金融界的風控有何不同?」,我在另外話題答過相似的話題,可以參參考一下。傳統風控手段(經驗)會被大數據風控替代嗎?還是大數據只能用來輔助? - P2P 網路借貸平台

4. 關於如何評價現在互聯網金融的風控體系,這裡我個人將現行市場的情況歸納為三類。第一類也是較普遍的,大多數都還是參照銀行或金融機構的風控標準,再結合自己的數據基礎及模型做些調整,但大體上還是偏傳統方式的;第二類即是利用大數據的,目前這類都算是在嘗試階段,並只能做些貸款金額較小的業務,基本上都不敢大規模的放開來做;第三類是以互聯網思維來做風控,比如說有不少做大學生消費信貸的平台,利用了借款人的強關係網路,作為風控的一個重要評判標準之一。當然這在一定的小金額範圍內是能起到作用的,一般人也不希望借個幾千元不還然後被所有朋友、家長、老師等都知道,這個違約成本也太高了。但對選擇大學生市場的平台來說,本身就選擇了一個沒有主動收入來源和還款能力較低的群體,所以肯定會有一定的壞賬率的。現在整個市場也還沒經歷過一個完整的貸款周期,這種風控手段的有效性也還無法正確評估。

總體而言,我認為時代在改變,方法也得不斷改進和升級,在這進步的過程中一定會付出學習的成本,但對整個社會而言是符合歷史大潮的變動,都是正確的。


銀行放款有一部分業務是融資擔保公司擔保項下貸款,或者企業互保貸款。用款人實際成本是高於8%的。p2p平台的風控只要沿著原來的思路即可。

線下好多業務模式是實際存在的,p2p多數只是把業務搬到網上,風控體系不夠成較大變動。


費埃哲……益博瑞……一般用他們二家風控模型


風控分析包括定量分析和定性分析,定量分析首先得有真實的數據來源,而真實的數據來源談何容易?借款人提供的財報誰敢直接採納?

只能通過人行的徵信系統查詢其在金融機構的融資及對外擔保情況,實地調查其經營及財產情況,結合起來分析財報的可信度,大概地進行定量分析。

民間借貸,或有負債,隱藏的關聯公司,實際的貸款用途等等可能根本無法調查清楚,很多時候風控只能靠感覺,靠經驗去猜測,怎麼可能建模搞定?


銀行大多有的是公司客戶的評級模型,評級過程結合了定量定性很多客戶信息(對於客戶財務報表作假除了客戶經理的核實過程以外,部分銀行已經對審計報表的會計師事務所建了庫,不在庫內評級要下調),並且對評級推翻(主觀上調,下調)的過程進行了嚴格的限制,等等限制很嚴格。小企業,個人也有相應的模型。出了評級結果才談的上後面願意貸多少錢,以及擔保措施,期限,信貸產品的調整等等。至於整體的風控模型,我想目前來說就結合了評級授信審批貸中審核貸後管理方方面面的後台機控,文件規定和人控手段的結合吧…至於p2p風控?呵呵


分散給不同借貸人在現階段並不怎麼管用。如果客戶准入門檻低,放給誰都是不良。


推薦閱讀:

BRC, DBC,Unicareer這幾家公司怎麼樣?
中國體制內高官和華爾街的精英人才對比,哪家強?
決定轉學美國,想入IBD,該選擇top30文理學院還是top50商學院?
為什麼在國家整體支持互聯網和金融創新的大環境下,還要很多條款限制互聯網金融?
餘額寶的風險在哪?在發生什麼事之後我們應該儘快把餘額寶里的錢提出來?

TAG:風險控制 | 互聯網金融 | 金融 | P2P金融 |