小額現金貸用戶群體分析及風控體系搭建

我國擁有龐大的現金貸人群,這些人普遍未被傳統金融機構覆蓋,徵信記錄較為空白,風控是當前現金貸健康可持續發展的關鍵。那麼,如何構建現金貸的風控體系?如何將風控貫穿在客戶生命周期的每個環節?數據究竟在其中起到什麼樣的作用?

現金貸的用戶群體分析

我國擁有四億多現金貸業務的適配人群。這個適配人群,基於市場調研,是在18-45歲之間,未被傳統金融機構覆蓋的人群。這些人普遍徵信點比較空白,因為沒有自身的融資渠道,所以他會有現金貸的需求。這些人群的收入基本在3000-7000之間,收入偏低,有些人的收入可能會上萬,但相對來說,這些人每個月可支配收入不會太高,大概在3000左右。由於生活中的一些非穩定支出需求,比如租房有可能需要押一付三,比如一些偶發的花費,這時候這部分人群的資金周轉就會出現一些問題,產生借貸的需求。此外,這部分人群的手機使用度非常高。所以他們很適合線上借款的場景。他們希望自己的借款流程是非常方便快捷的。

如何構建現金貸的風控體系

風險管理必須從數據、IT、模型、業務、管理機制等方面防範

數據層

為什麼數據很重要?因為在客戶進行借貸申請的時候,只有通過內外部數據才能儘可能的充分描述這個人的相關信息。這些信息不僅限於客戶提供的信息,還包括內部數據、徵信數據以及其它數據。內部數據包括表單信息、APP使用信息、內部歷史信息、相關連用戶信息,APP使用信息等。比如客戶在完成第一次借款後,有多頻繁地使用你的APP也是一個非常重要的參考維度。

徵信數據包括央行徵信、民間徵信以及黑名單。這些數據是否有用?最好的做法是把這些數據一一進行評測,評測的結果如果是好的,就留下來。最終的目的是要通過這些數據來判斷這個客戶究竟是不是一個好客戶。很多因素決定了哪些數據對你有用或者沒有什麼用處。比如你的客群,你的業務場景等等。一個好的相關的數據源能明顯提升對風險的預測能力。

數據層的搭建,如果產品不同、客群不同,那麼你需要的數據源也不同。比如說民間徵信公司提供的黑名單、多頭借貸數據、爬蟲爬取的運營商數據、公積金&社保、通過技術捕捉到的設備指紋等等,通過上面的數據採集去構建反欺詐和信用模型 。大額現金貸和小額現金貸針對的客群是不一樣的,它的息費不一樣,所以它需要的數據源也是不一樣,在設計的時候大家要注意到這一點。

系統層

上一層是系統層。比如說業務系統,市面上的業務系統有個缺點,就是系統開發時各部分是強耦合的,變數是寫死在裡面的,如果後期修改風控規則和更新模型,需要排期,排到期又得有幾天到2個星期的開發時間,這個問題可以通過引入決策引擎來解決。另外,為了方便數據分析,數倉的建立也是很有必要的。

分析/模型層

有了數據和數據管理系統,可以開始分析和建模。分析的重點是圍繞業務中的關鍵點來開展,比如風險和盈利。值得一提的是在分析中需要用VINTAGE去分析。VINTAGE一詞和紅酒相關,由於光照蟲害等因素,每年各個地區的的葡萄酒質量會有差異,所以葡萄酒會標明年份和產地。

VINTAGE分析就是根據客戶的借貸日期或者月份去分析,將客戶根據進件月份分群去做分析。這個聽上去簡單合理,在我們做諮詢時發現相當多的客戶不是這樣做的。比如逾期率,因為沒有用VINTAGE方法,是很不準確的。業務衝量的時候,逾期率就會自然低;反之,業務減量的時候,逾期率就高。所以做分析的時候建議大家採用VINTAGE的方法。

建模有好多方法,傳統的邏輯回歸和現在流行的機器學習,比如GBDT,XG Boost 等。哪種方法好,我的觀點是,不論黑貓白貓抓到老鼠就是好貓。只要能有效可以區分風險和保持一定的穩定性就可以。

業務層

分析和模型完畢後,要將結果轉化成業務策略。比如通過外部數據和欺詐的關聯分析建立反欺詐規則,比如利用收入負債比制定額度。值得指出的,業務初期時,經常根據經驗設計規則,但這些規則到底是否有效,需要在未來的業務中不斷測試。

在這兒提一下測試,在數據驅動的理念中,測試是相當重要的一部分。業務初期的時候可能設計的一些規則你無法知道它是否有效,判定是否有效的唯一方法就是測試。

管理層

最後是管理制度和崗位職責等的建立。比如風險部門和業務部門的合作關係,業務使勁往前沖,風險則拖後腿,如何平衡兩個部門關係。另外,為了防止內外勾結和欺詐,我們的風控策略必須做到保密,如何建立機製做到保密?大家可以想一想。

具體風控流程

渠道進件

第一步是渠道進件,這是相當重要的一步,因為它決定了你的客源。不同渠道的客源質量相差比較大。選擇客源後可以做分析。比如說年齡分布、性別分布等一些維度。根據客群分析,來設計規則。各個渠道良莠不齊,哪一部分是我們的目標客戶。哪一部分是我們非目標客戶,在這一部分設置准入規則可以降低成本。

渠道本身應該進行監控,來衡量渠道進件客戶量和客戶質量的穩定性。有些渠道會在商務談判時短期內增加客戶量,提供高質量的客戶,審批通過率高。後期業務開展的時候,會發現客戶量或者審批通過率降低,這個需要大家注意。

不要盲目地相信渠道提供的數據質量,必須建立數據質量監控系統,從而有效捕捉渠道方的數據錯誤;另外,如果渠道方更新變數加工邏輯,通過監控也能及時發現。

反欺詐

反欺詐根據欺詐主體分為第一方和第三方。

第三方欺詐就是身份冒用、盜用去申請貸款。這部分的防禦技術其實比較成熟比如人臉識別等。

第一方欺詐就是惡意騙貸。如何控制第一方欺詐?通過數據、爬蟲、外部黑名單等方法。考慮黑名單的時候要考慮黑名單的覆蓋率、更新頻率等等;做反欺詐規則的時候要考慮是建模型還是規則。有些客戶會擔心規則只有幾條可能容易被外面的黑產、中介攻破,而模型較難攻破,大家自己可以考慮一下。

第二個在做反欺詐設計的時候需要平衡客戶的體驗。爬蟲的時候需要客戶填寫一些賬戶信息和授權。

第三個要注意的是數據的質量、成本和性價比。

信審階段

信審階段一般有兩個,一個是信用模型,建完模型後需要注意的是對入模變數和應變數的解釋,入模變數和應變數之間的關係是否能夠解釋地通,是否有選擇偏差。這個不僅僅是說服業務去用你的模型,更重要的是在發現選擇偏差的時候是否能理解它,模型是否可以推廣到被拒絕人群。

有朋友提到拒絕推斷。建模型的時候實際上是針對審批通過的人來建模,是通過你的渠道、反欺詐規則、信審規則、有貸款的這部分人建的模型。但是最後你的模型用在渠道進件的人群。所以模型應用起來是否會產生偏差,是否用拒絕推斷來矯正呢?

第二個,授信規則考慮收入負債比。這個比較有爭議。一是如何界定?通過公積金、社保並不能正確的界定?二是負債。人行徵信是比較準確的。但是大量的負債沒上人行徵信的,如何去界定它?額度是多少?小額的時候需要做收入負債比還是大額的時候做收入負債比?這都是要考慮的問題。另外一點是生活水準,每一個地區的生活水準不一樣的。

貸後管理

在這兒提兩點:

第一是監控。監控是相當重要的。其實監控是全流程的,不僅僅是貸後管理的一部分。

監控有幾個主要目的:

①監控異常行為,及時捕捉欺詐;

②監控逾期趨勢,尤其是同信用欺詐分段的逾期走勢;

③監控反欺詐策略和信用評分的有效性,及時迭代。

第二是催收。催收要考慮如下幾個因素:

①優化催收資源;大部分公司會有內部催收和外部催收,做到客戶級的委外策略可以節省成本,優化資源;

②客戶體驗:對不同的客戶有不同的話術,決定什麼時候催收也很重要;

③違約金是盈利重要來源,不是每一個客戶都要及時催收;

④失聯:考慮失聯修改。

貸後管理是很重要的,貸後管理收集客戶在貸後的表現,對客戶的進一步細分,以便於制定差異化的管理策略。復貸就是貸後管理策略的一種。

復貸

對於低風險存量客戶,可以考慮繼續貸款,提高額度等,所以就有了復貸的策略。復貸的時候可以考慮補充外部數據。如多頭借貸數據。Payday loan現在多頭借貸特別嚴重,可能會出現擊鼓傳花的現象,拐點出現時會風險會集中爆發。這是需要關注的現象。


推薦閱讀:

逾期、壞賬時有發生,互聯網金融如何跨過風控這道坎?
2017年度中國互聯網黑灰產報告

TAG:現金貸 | 大數據風控 | 風險控制 |