狗熊會精品案例 | 天啦嚕!單憑這幾條,就能知道你的信用卡會逾期多久

原創 狗熊會 水媽

進入移動互聯金融時代,持卡人的消費、還款等使用行為已經成為個人徵信的重要依據之一。逾期還款會給持卡人留下不良信用記錄,會對持卡人今後的貸款等行為的順利進行造成不利影響。

那麼,什麼樣的人容易發生信用卡逾期行為呢?哪些因素會影響逾期行為的嚴重程度?本案例收集了信用卡逾期行為的相關數據,嘗試建立統計模型探究持卡人逾期行為的影響因素,並對逾期狀態開展預測。

本案例所使用數據來自某銀行的信用卡用戶逾期相關數據,共包含8371條記錄。將用戶最近的逾期狀態作為因變數,將用戶的個人特徵和行為特徵作為自變數。

因變數逾期狀態包含了8種逾期情況,屬於定序數據(ordinal data)。可以看出,頻數最高的是沒有逾期,其次是逾期31到60天,而逾期90天以上的行為較少。

接下來,考慮性別、有無住房貸款等自變數與逾期狀態之間的關聯。

  • 在整體人群中,男性居多,但男女比例在各逾期狀態差別不明顯;
  • 在整體人群中,無住房貸款佔比更大,但有房貸的比例在各逾期狀態差別不明顯;

在信用卡使用率方面,從平均水平上看,沒有逾期行為的人群,信用卡使用率比逾期人群低,而有逾期行為人群的信用卡使用率並沒有明顯規律;在信用卡額度方面,從平均水平上看,信用卡額度較低的人群,更加傾向於逾期。

綜上,本案例認為信用卡的使用率、額度和歷史逾期行為都很可能會影響逾期行為的發生與否

本案例中,若直接使用定序回歸模型進行建模,預測效果較差,無逾期行為和逾期30天以內無法顯著地區分,因此分為兩步建模更好:

第一步:0-1回歸,預測是否有逾期行為;

第二步:定序回歸,預測逾期行為嚴重程度。

由於篇幅限制,這裡僅展現定序回歸的建模結果。對全部建模過程和結果感興趣的讀者,可以點擊本文下方的「閱讀原文」購買案例報告。針對逾期人群(即因變數取值>0的樣本),對所有變數建立定序回歸模型。

可以看到,在控制其他因素不變的情況下:

  • 男性人群逾期程度比女性人群更嚴重;
  • 信用卡使用越頻繁,逾期行為越嚴重;
  • 信用卡額度越低,逾期行為越嚴重;
  • 存在歷史逾期行為的人群,更容易發生逾期行為;
  • 存在開戶行為的人群,更容易發生逾期行為;
  • 有無房貸對是否發生逾期行為的影響並不顯著。

在本案例中,逾期行為嚴重程度的定序回歸的預測效果差。可能的原因有:(1)自變數較少,缺少對逾期行為嚴重程度的深入理解;(2)定序回歸對於臨界值估計的欠缺導致預測效果較差;(3)因變數中嚴重逾期行為和逾期行為本身沒有顯著差異。

狗熊會簡介:

致力於數據產業的高端智庫。狗熊會幫助合作夥伴制定數據戰略,培養數據人才,研究數據業務,發現數據價值,推動產業進步!

狗熊會使命:

聚數據英才,助產業振興!

狗熊會關注數據科學基礎教育,希望通過生產優質的數據科學教育內容,提供卓越的研究、實踐、就業機會,幫助相關專業 的老師、同學、從業者充分享受數據分析的快樂,促進個人職業的終身幸福與成長。

狗熊會認為優質的數據科學教育一定不能脫離數據產業實踐。


推薦閱讀:

某行信用卡固額3萬,臨時額度出12萬,要不要提?
如期分期支持什麼發卡行的信用卡
吃驚!信用卡還能這麼還?

TAG:信用卡還款 | 數據分析 |