婚姻狀況與違約率
02-03
分析完年齡,再看婚姻狀況。
大家都說,已婚的人比未婚的人違約成本高,家庭越和睦,違約成本越高,事實是這樣的嗎?拿數據來說話。
df4=df1.copy()nprint(df4[婚姻].value_counts(ascending=True))nprint (df4.shape)n
婚姻狀態有缺失值,還有空格,下一步就是整理數據。刪掉這些有缺失的數據,把空格刪掉。
df4=df1.copy()ndf4[婚姻]=df4[婚姻].map(str.strip)ndf4=df4[(df4[婚姻] !="--") ]nprint(df4[婚姻].value_counts(ascending=True))nprint (df4.shape)n
參考上節年齡特徵的計算方法,通過數據透視表得出不同婚姻狀態的平均借款成功比率:
未婚的客戶較難獲得貸款。
(當然,也可能是其他更底層因素,比如:收入低導致未婚,收入低導致貸款難)
奇怪的是離異客戶並不像傳統想像的那樣難獲得貸款。
在獲得貸款的客戶中,未婚客戶的違約比率最高,未婚客戶的違約率較高。
由於喪偶、離異的客戶樣本量較少,結論有偶然因素。但數據分析還是表明,已婚客戶違約率明顯低於未婚客戶。
(當然,也可能是其他更底層因素,比如:經濟狀況窘迫導致未婚,同時導致還款困難)
推薦閱讀:
※為什麼要搞錯行業分類
※信貸業務中,你認為排名前三的風險來源是什麼?
※2014年經濟形勢有種風雨欲來的感覺,各大行的貸款利率會不會較大幅度走高?融資成本的難度會不會大幅增高?