狗熊會精品案例 | 天啦嚕!單憑這幾條,就能知道你的信用卡會逾期多久
原創 狗熊會 水媽
進入移動互聯金融時代,持卡人的消費、還款等使用行為已經成為個人徵信的重要依據之一。逾期還款會給持卡人留下不良信用記錄,會對持卡人今後的貸款等行為的順利進行造成不利影響。
那麼,什麼樣的人容易發生信用卡逾期行為呢?哪些因素會影響逾期行為的嚴重程度?本案例收集了信用卡逾期行為的相關數據,嘗試建立統計模型探究持卡人逾期行為的影響因素,並對逾期狀態開展預測。
本案例所使用數據來自某銀行的信用卡用戶逾期相關數據,共包含8371條記錄。將用戶最近的逾期狀態作為因變數,將用戶的個人特徵和行為特徵作為自變數。
因變數逾期狀態包含了8種逾期情況,屬於定序數據(ordinal data)。可以看出,頻數最高的是沒有逾期,其次是逾期31到60天,而逾期90天以上的行為較少。
接下來,考慮性別、有無住房貸款等自變數與逾期狀態之間的關聯。
- 在整體人群中,男性居多,但男女比例在各逾期狀態差別不明顯;
- 在整體人群中,無住房貸款佔比更大,但有房貸的比例在各逾期狀態差別不明顯;
在信用卡使用率方面,從平均水平上看,沒有逾期行為的人群,信用卡使用率比逾期人群低,而有逾期行為人群的信用卡使用率並沒有明顯規律;在信用卡額度方面,從平均水平上看,信用卡額度較低的人群,更加傾向於逾期。
綜上,本案例認為信用卡的使用率、額度和歷史逾期行為都很可能會影響逾期行為的發生與否。
本案例中,若直接使用定序回歸模型進行建模,預測效果較差,無逾期行為和逾期30天以內無法顯著地區分,因此分為兩步建模更好:
第一步:0-1回歸,預測是否有逾期行為;
第二步:定序回歸,預測逾期行為嚴重程度。
由於篇幅限制,這裡僅展現定序回歸的建模結果。對全部建模過程和結果感興趣的讀者,可以點擊本文下方的「閱讀原文」購買案例報告。針對逾期人群(即因變數取值>0的樣本),對所有變數建立定序回歸模型。
可以看到,在控制其他因素不變的情況下:
- 男性人群逾期程度比女性人群更嚴重;
- 信用卡使用越頻繁,逾期行為越嚴重;
- 信用卡額度越低,逾期行為越嚴重;
- 存在歷史逾期行為的人群,更容易發生逾期行為;
- 存在開戶行為的人群,更容易發生逾期行為;
- 有無房貸對是否發生逾期行為的影響並不顯著。
在本案例中,逾期行為嚴重程度的定序回歸的預測效果差。可能的原因有:(1)自變數較少,缺少對逾期行為嚴重程度的深入理解;(2)定序回歸對於臨界值估計的欠缺導致預測效果較差;(3)因變數中嚴重逾期行為和逾期行為本身沒有顯著差異。
狗熊會簡介:
致力於數據產業的高端智庫。狗熊會幫助合作夥伴制定數據戰略,培養數據人才,研究數據業務,發現數據價值,推動產業進步!
狗熊會使命:
聚數據英才,助產業振興!
狗熊會關注數據科學基礎教育,希望通過生產優質的數據科學教育內容,提供卓越的研究、實踐、就業機會,幫助相關專業 的老師、同學、從業者充分享受數據分析的快樂,促進個人職業的終身幸福與成長。
狗熊會認為優質的數據科學教育一定不能脫離數據產業實踐。
推薦閱讀: