信用風險評分卡開發指引第五章----評分卡生成

當模型通過檢驗以後,就進入標準評分卡開發階段,標準的評分卡(如下表所示)就像一連串的if…else…條件語句,讓數據中的每一個變數落入相應的條件區間以對應相應的分數。例如某個客戶年齡為一個32歲的已婚男性,那麼他的分數就為30+30+10=70。

採用評分卡的優點:

一是每一條總得分對應於一定的違約概率,這樣可以很方便地讓風控人員科學地制定信貸政策。

二是總得分是由每個變數對應的分數加總得來的,這樣,每個變數如何影響總得分也十分清楚明了。

5.2從logistic回歸模型到評分卡

之前論述了logistic模型的形式如下,其中,t為模型變數個數。

其中A與B是常數,該表達式中B前面的負號可以讓違約概率越高的客戶分數越低。而這兩個常數可以通過兩個假設的分值代入公式求出。這兩個假設分別是:

1. 某個特定的違約概率下的預期分值

2. 指定的違約概率翻倍的分數(PDO)

例如:假定比率odds為時設定的特定分數為,然後比率為時的分數為,代入以上線性表達式,可得:

我們結合標準評分卡列表的例子闡述如何由模型到評分卡。

模型變數為Age、Sex、Marriage,假設Age分成5個分箱,Sex下有2分類,Marriage有3個類別,三個變數進行WOE轉換之後變為下表,其中w為變數取某個分段下的woe值。例如Age有5個分段, 就有5個WOE值。

其中的是0,1邏輯變數,代表自變數是否取該區段的值,整理可得如下形式的評分卡:

由上表可以看出,一個客戶的信用評分有兩部分組成,基礎分以及各個變數分段的得分,而各個變數分段下的得分由三部分決定:

1. 評分刻度值B

2. 參數估計值

3. 該變數分段下的WOE值

「腳本評分卡生成.py」的creditCards函數可以輸出如上的標準評分卡,該函數接受7個參數,paramsEst代表參數估計表, woe_maps代表woe值映射, bin_maps代表分箱映射,red_maps代表降低基數映射,basepoints為基礎分,odds為期望違約比例,PDO為翻倍分數。

根據本案例,設定odds = log(1/60)時的信用得分為600,PDO為20,並且需要搜集各個woe以及分箱、降基等映射結果。具體代碼調用如下。

得到的評分卡部分結果如下:

評分卡示例(部分)

由於評分卡變數較多,表格太長,這裡只展示部分結果。上表的var_name為變數名稱,bins為分段標識,points為相應分段的分數,range為變數值範圍,range裡面「- -」號隔開的是連續型變數各個分段的範圍,分號「;」隔開的是降基的結果。

而basePoints一行是基礎得分。由此評分卡計算得出的信用評分最高分為597,最低分為327。

而從評分卡上也可以看出,AGE在兩端的上為負分,說明年輕群體和中高年群體的評分會較低,而SEX上,男性為-3分,女性為2分,也符合一般風控理念,男性群體發生違約的概率更高。

5.2結束語

本文採用的方法和思路都是圍繞已經進件且客戶狀態已知的情況下,運用基於信息值的最優分箱和降低基數對數據進行轉換,並對數據進行WOE轉後,然後運用logistic回歸建立風控模型,最後根據模型輸出評分卡。在評分卡開發之後,技術人員可以將輸出的評分卡決策規則轉為其他代碼進行風控決策引擎開發。

另外,評分穩定性監測在評分卡上線之後也非常重要,畢竟申請評分只是作為客戶進件管理的一環,有興趣的讀者可以進一步了解穩定性指標PSI。

參考文獻&案例腳本函數索引

1.<信用風險評分卡研究—基於SAS的開發與實施>,作者:Mamdouh·Refat

2. <消費信用模型:定價、利潤與組合>,作者:Lyn C. Thomas

腳本獲取方法:

進入瑞賽官網主頁(reedsec.com/),進入新聞中心後即可查看代碼。


推薦閱讀:

逾期、壞賬時有發生,互聯網金融如何跨過風控這道坎?
互金時代大數據在貸後管理中的應用
騙貸套路深,千萬要認真(車貸風控必看)
"微出行"上線 巨量數據下的風控挑戰
2017年度中國互聯網黑灰產報告

TAG:風險管理 | 反欺詐 | 大數據風控 |