揭秘!我們常用的信用評分竟然是這樣做出來的!
今天的貝專家分享的主題是關於信用評分的,那麼我們經常用的信用評分是怎麼做出來的呢?
說到信用評分,那麼我們先來說一下信用評分模型是怎麼做出來的。
首先做模型要先問一個問題,就是我們做模型是什麼?其實他和我們知道的一些物理規律或者定律是不一樣的,需要我們在有限的信息量里,嘗試著抽象出邏輯,抽象出智慧。所以非常著名的統計學家曾經說過,所有的模型都是錯的,但是有一些是有用的,那麼這個過程就是什麼樣的場景下什麼樣的模型,他的作用才能發揮更大。
01兩種評分模型
在我的認知里,其實有兩種,一種是數據驅動模型我們通過歷史數據,從中抽象出規律,然後形成模型。還有一種更偏向智能的模型,區別在於機器變成「會思考」的了。那麼演算法賦予他的其實是一個「會思考」的能力,比如Alpha Go,他其實是在學習歷史的知識,學習歷史的數據,但是他加了一步,相當於是隨機模擬的過程,那麼這實際上是他對未來未知性的一個判斷,然後來決定哪一個是最優的路徑。
下面說一下比較傳統的信用評分模型思路,以及目前互聯網金融行業我們做的一些比較新的東西,但是這些事情還是基於已有歷史數據做的。
02做模型的過程
首先把他抽象成一個比較簡單的數學公式就是y=f(x)的過程。
y是什麼?比如一個借款人是不是壞賬,或者一個保險產品他到底會不會買,其實這就是y,是要預測,或者最後要應對的場景。
x是什麼?x就是我們可以獲取到的針對個體而言,針對單位而言所有的一些數據或者他的一些行為表現。比如他的年齡、他的工資水平、他歷史的還款表現、他的家庭成員、收入等等。
f是什麼?實際上就是演算法,通過不同的演算法來構建這些數和最終要呈現的場景之間的映射關係。在做模型的時候,會更多的考慮這幾個部分怎麼處理。
03信用評分的模型怎麼做
x 部分
x的來源:現在非常多的金融機構自己可以獲取到,或者通過官方的徵信渠道和一些第三方的數據機構,拿採集過來的數據做一些數據清洗,還有特徵提取的工作。
做信用評分的模型會比較注重單變數的分析。我們拿美國的行業來舉例,對於這個比較標準的流程有一個環節,消費者會根據評分是什麼,有權利去質詢分數以及形成這個部分的機理是什麼。我需要知道我的哪些變數發生了改變,那麼每個單一的變數和y之間的關係是非常重要的。比如說有一些關聯關係的分析方法,是不是可以去做。
做評分模型中有一部分是非常重要的,就是概率的關係。比如說消費收入的變數和是否還款的關係,他其實是連續性的變數,這個過程中間會有一個步驟,是把消費收入分成不同的區間,然後每個區間實際上的還款概率是什麼樣子,或者壞賬的概率是什麼樣子。
理想的狀況下,我們希望他是一個線性可解釋的關係,如果他出現凹下去或者凸起的也可以接受。但是他出現了一個從業務邏輯上來說比較難解釋的折線的關係,即使這個變數非常有效,也是要被扔掉的。這在特徵處理的過程中間,需要做大量的工作。
所以一般常見的流程,比如說有幾百個變數,一些質量不好的,我們把他扔掉;或者在業務邏輯上面不符合我們認知的,也會把他扔掉,就會有很多這種往複的工作量,這就是我們處理特徵的一個過程。
y 部分
y就是選擇我們的樣本。實際上大家是否購買一個產品,或者是否壞賬,整個流程中間要定義他是不是一個壞人,其實並不是那麼簡單的事情。就以壞帳為例的話,大家可能都有忘記還信用卡的經歷。所以說你忘記還信用卡可能是1天、15天、45天,但是之後又把他還上了,那麼我可以把你定義成壞人嗎,實際上這不是一個特別好區分的事情。
首先針對我們做的信用評分,以徵信局為例的話,是有嚴格的區分什麼是壞人的標準的,那麼他嚴格的定義就是24個月內連續90天逾期,也就是說我在24個月的還款周期內,我有三個月以上不還款就是壞人,這就是嚴格定義的逾期人群。但是針對於現在的場景來說,像很多小額現金貸這樣的,實際上是一個蠻壞的標準。
所以在做的過程中,是要通過歷史數據,去看這個人群的遷移,比如說有10萬人,那麼有多少人他從正常變成了30天逾期,從30天變成60天,逾期60天變成90天。有的人可能從30天逾期又還款了,有的人從60天逾期又還款了,那有多少人從三十天逾期的時候,變成了60天逾期或者在30天的時候又還款了呢。
那如果有更多的人是回來還款的,那30天逾期其實並不是一個很好的讓我能介定好人壞人的標準,我是不是需要把期限拉長一點,所以我們需要構建一些數據矩陣,來幫助我們更好的建立好壞的定義。
在做這個的時候,會通過按比例取樣,保證我的人群在每一個樣本群裡面都有一定的樣本進到我的模型裡面,或者這個模型特別想要知道的那些完全跑路的人,那麼就可以把這部分樣本的佔比增加一些。這也是在做整個模型的過程中,需要考慮的一些問題。
做模型的時候,會遇到好壞正負樣本不平恆的問題。一般來說壞人相對是比較少的。那麼通過什麼樣的採樣方式使我們的樣本做到比較均衡、模型表現比較穩定,也是我們需要考慮的問題。
選樣本是有一個觀察期和表現期的。就是我選這個建模的數據,需要我申請實點之前的所有數據。我不可能看到未來的數據,然後來判斷今天的信用水平,所以我們需要找到一個實點,然後拿之前兩年、五年甚至七年的數據來建模型,然後測試樣本需要在實點之後的一年、兩年來做,那也就是如果我現在要做個模型,我可能至少拿兩年之前的數據來建這個模型。那在拿這兩年的數據來驗證這個模型之後,還要花一段時間建模型,然後我再花半年的時間上線。
這時,我做這個模型的數據已經是三年之前的了,整個行業現在已經發生了翻天覆地的變化,很可能這個模型一上線就失效了。所以這種方式實際上也是被越來越新、越來越快的一些建模技術所取代。包括前面提到的一些機器學習的方法,本身就是在處理這種變數的邏輯,比如缺失值、噪音,新的技術會有更大的容忍度,效果也會更好,更多的引入演算法,實現模型的相對快速迭代,也是互相交互的一個過程。
在整個互聯網金融高速發展的背景下,真的很難花一年時間做一個模型出來,可能三個月的時間就需要把他部署上線。
f 部分
接下來是演算法層,應該怎麼抽象出這個映射關係。f的話,針對行業來說,尤其在美國的信用評分的構建中,不管是徵信局也好,還是銀行也好,只能採取的是邏輯回歸。通過一個線性的方法把他疊加起來,然後再增加一層映射,使得映射成從0到1這樣的一個概率。
這就是保證模型的可解釋性,因為我是可以知道每個變數他的正負向是怎樣最後影響違約概率的,需要採取這樣的模型,是寫在監管條例裡面的。
大家不要覺得國外的金融行業都在用非常複雜的模型,或者是很高深的技術在做構建模型,實際上他們在做整個模型、變數選擇,演算法選擇是受到嚴格監管的。在做的過程中間,這個線性模型一般會是我們的基準。根據這樣的基本模型,考慮最差的表現或者是最基本的表現可以到什麼樣的程度。
隨著這些年機器學習演算法的興起,針對國內外整個項目建模行業來說,基於機器學習像決策樹等很多集成式的演算法也是大規模的,然後會應用到建模場景中間來。
04建模時會用到的幾種演算法
決策樹演算法
我們可以理解成他是一個老中醫,會經過一系列規則的篩選,比如說望聞問切,通過一層一層的信息採集做出判斷你是否得了某種疾病。我們構建的決策樹,其實也是類似的一個過程,我們有非常多的變數通過演算法構建這樣一棵樹,那麼一個人來了,他把這些東西輸進去,我們是可以通過這個程序自動給他一個概率值。
基於決策樹的隨機森林
我們可以把他想像成一大堆的老中醫,這些老中醫每個人都有自己的專長,那麼我們做的實際上是隨機從老中醫裡面隨機抽取一百個。隨機抽取的過程中,有的老中醫可能擅長看腎病,有的擅長看心臟,有的擅長看皮膚,他的變數是不一樣的,然後再把這些老中醫放在一起,大家一起投票,然後再決定這個人到底有沒有得病,那麼這是基於隨機森林的方法。
像GBDT這樣的方法
他實際上最開始也是有個老中醫。這個老中醫哪些地方看錯了,在這個錯的上面去修正,然後再有一個老中醫根據他修正的結果,會把這些錯的權重給加大,然後一個一個坐診,最後得到一個結論。
所以這是一個集成演算法,當然後面還有非常多的一些演算法的原理,還有一些可以持續優化的方式,但是這樣一系列的操作下來,有效的規避了我們單一的模型可能出現的錯誤。通過隨機抽取,或者構建多棵樹的方式,可以比較好地規避問題。
實際的數據測試驗證中,我們會基於線性模型的基準之上,用到相對比較新的演算法,然後來看他的模型改進是什麼樣子,他是從哪些方面來改進到這個東西,那麼這是F的一個選擇。
05怎樣評估模型效果
在信用評分里,我們不僅僅需要關注模型的準確率,還需要關注模型的區分度。我們需要判斷好的、壞的人群,他們區分度是什麼樣子,如果這兩個分部交點特別近的話,實際上還是沒有找到區別的。但是如果這兩個人群分的特別開,是不是也不是一件很好的事情?其實這時做的評分就沒有用了。
決定金融機構水平的是,他在一部分交疊的人群里怎麼根據人群的風險來決定利率。賺錢來自於哪裡呢?每期都按期還錢的人是賺不到錢的,他要賺的錢是從不還錢的人裡面賺出來的。通過利率測算然後賺到這部分人的錢,這才能說這個金融機構做得好,所以區分度其實是一個比較重要的指標。
另一個指標就是模型的穩定度。比如我們去一個金融機構貸款,我今天去的時候給我的是700分,那我可以拿到一筆房貸,然後我明天突然變成680,我可能就拿不到了,或者我的利率就高了,這對於我來說是不是一個很不公平的事情?所以我們說的穩定度,也就是實際上這個模型需要去看的一個基準人群的評分,在一個時間段或者三個月之後的另外一個時間段,甚至半年的這個時間段,他的差距有多大、穩定性有多好,我們實際上是更傾向於用濃度高的模型的。
所以這實際上是綜合起來衡量一個模型到底好不好的一個指標。所以這就是諮詢公司為什麼會花時間讓一個人特別多的團隊,扎在銀行里花一年多的時間來開發模型。剛才只是粗略的說一下每個步驟,如果要去細摳的話,是一個非常系統性的耗時耗力的工作。
推薦閱讀:
※大華諾斐灣 上海法拍房6萬/平米在售 可墊資 可貸款 不限購
※解析信用評分模型的開發流程及檢驗標準
※外部信用評級機構全覽
※西唄信用怎麼樣
※這種POS機千萬別刷! 刷了封卡、降額、關黑屋!