解析信用評分模型的開發流程及檢驗標準

03-28

評分模型的檢驗方法和標準通常有：K-S指標、交換曲線、AR值、Gini數等。例如，K-S指標是用來衡量驗證結果是否優於期望值，具體標準為：如果K-S大於40%，模型具有較好的預測功能，發展的模型具有成功的應用價值。K-S值越大，表示評分模型能夠將「好客戶」、「壞客戶」區分開來的程度越大。

信用評分模型介紹

信用評分模型是一種有監督的學習模型（Supervised Learning），數據由一群自變數X和對應的因變數y構成。傳統零售信用模型中，X大致分為客戶的基本信息（年齡、性別、職業、學位等），財務信息（收入，每月生活消費，每月信貸還款額等），產品信息（LTV，信用卡類別，個人貸款用途等），徵信信息（前6個月被查詢次數，前6個信用卡最大利用率，未結清貸款數等）；而一般取值0-1因變數y可以定義為在未來12個月是否出現欠款90天等。

而在大數據下，很多互聯網公司對個人的評估不再局限於以上幾種信息，而是根據更為廣泛的數據源對個人進行更全面的刻畫，故有稱之為客戶畫像。數據維度會考慮個人在社會上留下的任何數據，如手機使用行為，理財行為，社交圈，網購行為，旅遊行為等等。

目前比較流行的模型主要有以下幾種：

Logistic 回歸（Logistic Regression）

決策樹（Decision Tree）

支持向量機（Support Vector Machine）

人工神經網路（Artificial Neural Network）

生存分析模型（Survival Analysis Model）

除此上述之外，還有些高級方法或演算法：集成方法（Ensemble Method）（例如隨機森林（Random Forrest），Boosting，AdaBoost），深度學習方法（Deep Learning），隨機梯度下降演算法（Stochastic Gradient Descent）等。

信用評分模型的開發流程

信用評分模型的開發流程包括：模型的總體構想、選擇合適的樣本空間、清洗整理數據、確定預測變數、制定評分模型、評估和檢驗模型效果、實施優化模型等七個步驟。

一、開發目標、方法及業務問題

開發目標：

（1）減少人為影響，提高信貸政策的執行力度。

（2）用定量的方法反映客戶的風險級別。

（3）縮短審批時間，提高貸款發放速度。

（4）實現審批流程自動化，減少人工成本。

二、模型建立方法

按模型的實證化程度劃分，模型的建立方法可分為三種類型：

第一類是統計型，即採用統計方法從歷史數據中推演出來的模型，主要採用多元線性回歸分析、邏輯回歸分析等線性分析技術和最近鄰方法、神經網路模型等非線性分析技術，通過科學、嚴密的分析流程而建立。

第二類是專家型，即由專家判斷和機構經驗形成的模型，主要依靠信用評分人員的經驗判斷，形成簡單的信用評分體系，一般遵循5C原則：品行(Character)、償還能力(Capacity)、資本(Capital)、抵押(Collateral)與環境(Condition)。

第三類是混合型，即由統計方法和經驗判斷結合運用形成的模型。

在歷史數據完備性不足的情況下，對於開展微小貸款業務的信貸機構來說，在應用初期採用混合型的評分卡模型可能是比較好的選擇。即在統計模型的基礎上，結合模型變數之外的制度、經驗因素進行綜合評估，以綜合確定是否給予授信以及授信的額度和利率。

這裡的統計模型是指在分析歷史數據的基礎上形成的評分卡模型，而制度、經驗因素的結合則體現在兩個方面：

一是在模型評分指標之外設置相關的制度規定和經驗因子，這些因子我們可以劃分為兩類：一類是「硬政策」因子，它是評分模型變數之外的基於制度規定和經驗的一些條件，包括「自動通過硬政策」和「自動拒絕硬政策」；另一類是「篩選政策」因子，同樣是評分模型變數之外的基於制度規定和經驗的一些條件，包括「低分篩選政策」和「高分篩選政策」。

二是在模型變數和制度、經驗因素判斷之後，被拒絕或存在較大不確定性的貸款，在評分卡應用初期，可採用人工加系統相結合的審批方式。

三、確定數據來源，選取數據樣本

數據來源：客戶信息系統資料庫和其他相關業務系統。

樣本總數量：選取某地區兩三年間的所有貸款申請人（包括「好客戶」、「壞客戶」及被拒絕的申請客戶）。

抽取、整理數據，建立數據集合

數據質量的好壞是決定建立的模型能否成功的關鍵因素。

在確定了數據來源之後，由於所採集的數據資料來源廣泛，數據量大，抽取所耗時間較長，就需要在大量的原始數據基礎上，根據業務的需求、數據結構、性質及內在邏輯性，對大量的數據進行歸納分類、合併、分組。

即不同來源的數據對同一個概念有不同的表示方法，在集成多個數據來源時，需要消除數據結構上的這種差異。此外，對於相似或重複記錄，需要檢測並且合併這些記錄，最終建立數據集合（或稱數據倉庫）。

分析數據、選擇變數

現在越來越多的模型技術被應用於信用模型，但是個人覺得無論高級模型還是初級模型，最為重要的是更廣泛的數據和產生更多更具有預測能力的自變數。

選取變數，即從整個指標體系中選出最終量化模型所需要使用的一組解釋變數，其過程大致為：用所有變數分別對違約記錄進行單變數回歸。找出對違約解釋能力最強的單個變數，再將該變數與每單個剩餘變數組合後再對違約記錄進行雙因素回歸。找出對違約解釋能力最強的兩個變數，將這兩個變數再與每單個剩餘變數進行三因素回歸。找出對違約解釋能力最強的三個變數，不斷重複以上過程直到所選擇的變數個數達到預定的違約解釋能力。

自變數的生成

自變數是信用風險的來源，除了考慮直接收集的變數，信用評分建模過程中往往需要建模人員產生更多的衍生變數。這部分工作要分析人員的直覺、長期經驗的積累和數據挖掘技術的應用。大家可以通過京東和支付寶的評分一窺其自變數的維度：芝麻信用分為5個維度：身份特質，履約能力，信用歷史，人脈關係，行為偏好；小白信用分也分為5個維度：身份，資產，關係，履約，偏好。

自變數的篩選

自變數一旦豐富了起來，就涉及到有效變數的篩選，大致可根據一下幾個原則或方法：變數的直觀意義（是否跟y有關），變數的單調性或合理性，未來是否可以獲取以便模型可實施，變數的區分能力（IV），變數間相關性（變數聚類），變數缺失率，分檔之後的穩定性等等。

對於區分能力太強的變數，或缺失率很大的變數，不建議直接放入模型，可以考慮做成規則或者做成最後模型的調整。在大數據下，人們經常強調自變數與因變數的相關關係，應用於精準性要求不高的營銷模型問題不大。而對於精準度要求極高的信用評分模型，相關關係的應用值得推敲。

自變數分檔和轉換

為了保持模型的穩定性，信用模型一般對自變數進行分檔，比如根據風險不同把年齡分成幾檔。這樣每檔需要一個值來代表這段的自變數輸入，這就是變數的轉換，常見的有WOE和Logit轉換。通過轉換後不僅實現了穩定性要求，也克服不同變數間刻度不統一的問題，還克服回歸中缺失值的填充問題。

如果分檔過粗糙，不但會降低單個變數的預測能力，也會造成最終評分集中度過高的問題。可以考慮每檔用線性插值來代替常數，也可以尋找更多能區分分數集中樣本的自變數放入模型。

四、創建評分模型

通過前面的分組產生了最新的數據集合，就可以應用邏輯回歸運算建立初始回歸模型。在回歸模型的基礎上，運用概率與分數之間的轉換演算法把概率轉換成分數進而得到初始評分卡。下一步要將初始評分卡進行拒絕推論。拒絕推論是指由於申請被拒的客戶的數據沒有輸入評分系統內，導致樣本的選取非隨機，整體信用情況被改變，降低了信用評分模型的有效性。

因為信用評分模型是用來評價未來所有申請貸款的客戶的信用，則樣本必須能夠代表所有的申請貸款的群體，而不僅只代表信用質量較好、通過審批的那部分客戶的信用狀況，所以樣本必須包括歷史上沒有通過審批的客戶，否則，樣本空間本身就會出現系統性扭曲。

運用拒絕推論時，由於這部分被拒絕的客戶信用表現是無法獲得的，只能運用一定的統計手段進行推測。推測的方法有很多，可以通過信用評分卡對被拒絕的申請人打分，從而得出每個被拒絕的申請人如果被審批成為信用良好的客戶的概率和信用不好的客戶的概率，再按其權重放入模型樣本中，這樣能夠減少樣本的偏差，同時把拒絕樣本的不確定性考慮在內。

我們利用拒絕推論後產生的樣本（包括通過和拒絕的）重新對每個變數進行分組，所用方法與初始分組相同。然後對第二次分組所形成的數據集合建立邏輯回歸模型。最後在第二次回歸模型的基礎上，再通過轉換演算法把回歸模型得到的概率轉換成分數，從而得到最終得信用評分卡。

五、檢驗模型

模型建立之後，模型的預測能力、穩定性必須通過檢驗之後，才可以運用到實際業務中去。評分模型的檢驗方法和標準通常有：

1.交換曲線

2.K-S指標

3.區分度

4.擬合度曲線

其中，前三者表現的效果為：「評分越高，則好賬戶出現的越多」;而擬合度曲線，則用於對比預測情況與實際情況差異。

例如，K-S指標是用來衡量驗證結果是否優於期望值，具體標準為：如果K-S大於40%，模型具有較好的預測功能，發展的模型具有成功的應用價值。K-S值越大，表示評分模型能夠將「好客戶」、「壞客戶」區分開來的程度越大。

六、對模型進行監控和調整

在模型實施之後，要產生許多報表對模型的穩定性和有效性進行監測，如：穩定性監測報表，比較新申請人與開發樣本客戶的分數分布，對模型的有效性進行監控。特徵分析報表，比較目前和模型建立期間的所有評分卡特徵的分布，對模型的有效性進行監控。不良貸款數據分析報表，評估不同分值區間的不良貸款，並且與模型建立階段的預測進行比較，監控客戶貸款質量。

另外，經過一段時間之後，經濟環境、市場情況和申請者、持卡者的結構會不斷變化，信用評分卡的預測能力會逐漸減弱，同時，信貸機構經營策略和信貸政策的改變也要求評分模型進行適時調整，所以，信用評分卡在建立後需要進行持續的監控，在應用一段時間（一般2～3年）後必須適當調整或重建。