借鑒微貸的不對稱偏差分析法

在人人貸數據分析中,年齡與婚姻分別作了描述性統計分析。當然,還可以從學歷、行業、地區等維度來統計。

上回結論是未婚客戶逾期率高,其實我們只能說未婚與高逾期率同時出現了,不能說因果關係。

比如:年齡和婚姻有相關性,年齡小的客戶很可能未婚。到底是年齡在影響逾期?還是婚姻狀態在影響逾期?年齡相同的客戶,婚姻狀態對逾期還有沒有影響?


說起來,這個問題還是比較普遍,以很多傳統銀行的個人客戶信用評分表為例:

來自網路

這裡分別從自然情況(婚姻狀況、文化程度、戶口性質)、職業情況、家庭資信情況(個人信譽、家庭人均月收入、家庭資產凈額、住房情況、社會保障情況)等方面進行評分,然後累加分數。

以職業情況為例:

工作年限與職場競爭力分別評價,合計分數。

這裡有個問題,工作年限與職場競爭力有沒有聯繫?企業單位,工作10年以上的普通員工,得分9分。工作5年的經理,得分8分。常識來看,似乎前者的工作能力較弱,為何工作了10年,還是普通員工?而後者工作了5年就晉陞為經理,似乎工作能力更強些,發展潛力更大,社會評價也更好。而傳統的評分表累計反映不了這些因素,最後的評分結果就有問題,經理的分數反而低。

所以,有的時候不能這樣單獨分析,要聯繫起來看。年齡、工作年限與職務、收入狀況、婚姻狀況、資產情況,這些都有很大的關聯性(特徵共線性)。


上述這些問題都要通過統計技術加以解決,很複雜。那麼實務中,如何最簡單的規避這樣的問題?這讓我想到了微貸技術,其通常的做法是信息交叉驗證。

多問為什麼?年齡不小了,為什麼工作年限這麼短,他以前是做什麼的? 年齡不小了,為什麼婚姻狀況是未婚?

2017版丈母娘提問及標準答案

未來丈母娘問:「小X,你家車庫物業費現在交多少哦?」。 該問題是今年丈母娘提問流行款:確保有房有車有車位,從物業費判斷小區檔次。

而標準答案是:阿姨,您問的是哪一套哦?

這就是不對稱偏差分析法(Asymmetric Difference Analysis)

不對稱偏差分析法是一個軟信息方面的決策支持工具,它能有效指出風險點。根據我們的工作經驗,它能幫助信貸人員迅速發現潛在風險點,並幫助決策人員做出決策。

對非財務信息的驗證, IPC 的微貸技術主要利用信息不對稱偏差分析法來對客戶進行具體量化和判別,以有效的發現風險點。

根據客戶年齡、學歷等情況,判斷客戶應該「發展得什麼樣?」,然後根據實際情況,是否「達到預期」,進而判斷客戶的努力狀態,推斷一些我們看不到的東西,例如性格因素、為人處世,畢竟還款意願這種主觀心理是需要我們推斷的。如果客戶「應該」收入不高,而提供的收入證明、流水顯示的很高,我們就必須了解為什麼?而不是簡單的累加這些評分。

而要知道「應該是啥樣」,每個風控人員必須要有一定的閱歷和見識。當然,也可以建立下面這種分析表格,遇到了套用即可。

比如圖中,客戶的年齡、婚姻狀態、工作年限、財產狀況處於一條直線上,說明這些信息能夠匹配起來,能夠自圓其說,不會自相矛盾。

物以類聚、人以群分,什麼樣的客戶往往能找到什麼樣的保證人,能夠提供擔保的朋友,往往是從小玩到大的夥伴,關係相當鐵。地位相差很大的,保證人往往是實際用款人,借款人是馬仔而已。

假如圖中的線條是下面這條,紅色線

借款人四十多,未婚,工作才幾年,財產良好。經驗豐富的風控人員就會感到不對勁。

當然,IPC微貸和網貸的風控模式是不一樣的,但是這種不對稱偏差分析的思路還是很值得各類信貸業務(包括公司信貸)借鑒。網貸數據中是否有這種現象?出現信息偏差的客戶逾期率是否高?

下次有空再看看數據。

以上。

H Howard:如何做一名合格的商業銀行貸款審查人?

…更多文章請到信貸風控手記-知乎專欄

…更多回答請看H-Howard

感覺有用就賞個贊吧。


推薦閱讀:

TAG:数据分析 | 信贷 | 小额贷款 |