婚姻狀況與違約率

分析完年齡,再看婚姻狀況。

大家都說,已婚的人比未婚的人違約成本高,家庭越和睦,違約成本越高,事實是這樣的嗎?拿數據來說話。

df4=df1.copy()nprint(df4[婚姻].value_counts(ascending=True))nprint (df4.shape)n

婚姻狀態有缺失值,還有空格,下一步就是整理數據。刪掉這些有缺失的數據,把空格刪掉。

df4=df1.copy()ndf4[婚姻]=df4[婚姻].map(str.strip)ndf4=df4[(df4[婚姻] !="--") ]nprint(df4[婚姻].value_counts(ascending=True))nprint (df4.shape)n

參考上節年齡特徵的計算方法,通過數據透視表得出不同婚姻狀態的平均借款成功比率:

未婚的客戶較難獲得貸款

(當然,也可能是其他更底層因素,比如:收入低導致未婚,收入低導致貸款難)

奇怪的是離異客戶並不像傳統想像的那樣難獲得貸款。

在獲得貸款的客戶中,未婚客戶的違約比率最高,未婚客戶的違約率較高

由於喪偶、離異的客戶樣本量較少,結論有偶然因素。但數據分析還是表明,已婚客戶違約率明顯低於未婚客戶

(當然,也可能是其他更底層因素,比如:經濟狀況窘迫導致未婚,同時導致還款困難)

推薦閱讀:

為什麼要搞錯行業分類
信貸業務中,你認為排名前三的風險來源是什麼?
2014年經濟形勢有種風雨欲來的感覺,各大行的貸款利率會不會較大幅度走高?融資成本的難度會不會大幅增高?

TAG:数据 | Python | 信贷 |