如何深入消費金融風險控制領域
來自專欄白條說17 人贊了文章
如何深入消費金融風險控制領域?
風險控制業務是消費金融最為重要的業務之一。準確地說,只要是信貸類行業,風控永遠是業務核心,決定了其他業務能否「出得去,收得回」。
風控業務本身有相當多的子業務劃分,按照不同的劃分標準可以有模型量化,策略設計,催收管理等。每個模塊針對的業務對象和所需知識技能也大不相同。接下就分別講一下。
- 模型量化
國內自2014年掀起消費金融的浪潮後,伴隨著的是對數據量化風控體系的渴求,即以數據為基礎,數學/統計/計量/計算機等量化模型為實現手段,以模型/策略輸出結果為風險判定指標的風控體系。
現階段國內大部分消金平台的風控團隊都是以量化風控體系為主。該體系實現了自動化,差異化的風控模式,相較於傳統的人工信審以及「一刀切」的風控體系來說,極大的提高了風控效率和精度且降低了成本。
量化風控的核心在於量化模型,即客群各行為變數之間的數學函數。該函數描述了在當前環境下,與客群風險水平相關的各行為變數的權重和方向,權重衡量了該行為變數對風險的影響力度,方向則是表明該行為變數是風險正相關還是負相關。
要掌握大數據建模技能還需要以下條件
首先是豐富的理論知識儲備。
必須掌握和了解:計算機基礎;數據分析軟體;機器學習演算法基礎/進階; 統計分析基本方法;計量模型體系以及資料庫基礎。
建模數據的抽取,清洗和加工以及建模演算法的訓練和優化會涉及大量的計算機語言和技術。比如:數據查詢語言SQL;數據環境Hadoop和Spark;數據操作系統Linux; 數據分析軟體R、Python、SAS、Matlab等。
特徵工程涉及到統計/數學/資訊理論/計量等學科的基本概念。比如:變數的均值;分位數;峰度;譜;信息熵;cosi;衰退速率以及馬氏距離等。
建模階段涉及多種量化模型,比如:統計模型;計量模型;機器學習模型;複雜網路等。比較常見的模型有:回歸分析模型;隨機森林;時間序列;神經網路;SVM等。
想要在實際的項目中自如的運用這些模型演算法,不僅僅需要了解基本的數學原理,還需要深入掌握對應的計算機語言實現。至少要會在主流的分析軟體中調用演算法包,更高階的要求是能自己實現演算法的編寫和精進。只有這樣才能相對正確地設計並依據實際數據結構優化演算法,得到各方面表現都相對優異的模型。
這部分內容推薦前Discover資深風控專家喬楊的《數據化風控 信用評分教程》
其次是積累實戰技能。
實戰是將理論和現實結合重要一環,對於那些無法在實際工作中積累大數據建模經驗的同學來說,參加各平台的數據建模競賽也許是個不錯的選擇。
已被谷歌收入旗下的美國著名大數據建模競賽平台Kaggle、Analytics Vidhya平台上的Hackatons、國內天池大數據競賽、DataCastle等都是比較不錯的競賽平台。
最後來說一說需要大量實踐以及項目經驗中獲取知識。
比如特徵工程中缺失值處理、特徵構建、變換等等,取決於模型方法、數據、業務目標等。除了基於之前提到過的量化指標構造的特徵,最後對模型表現貢獻最多的特徵往往是那些構造邏輯和業務邏輯掛鉤非常緊密的特徵。
這裡舉個例子來說明。
在構建線性模型時通常會對變數間的非線性關係做線性數學變換(Log),而在實際的操作中,需不需要做變換以及如何變換是與具體的模型形式掛鉤的。
神經網路,隨機森林等模型,是不需要做線性變換的,反而會傾向於對特徵做離散化處理。
模型訓練調整參數,需要在心中有一桿bias variance的秤,揣著一把奧卡姆剃刀,方能建一手好模。
同樣,模型演算法的選擇需要考慮的不僅僅是模型表現,還需要考慮成本。
因為建模是一方面,模型能夠實施生產是另一方面。結構複雜和特徵量大的模型往往意味著背後需要大量的計算資源,人力資源和時間資源支持。模型的現有表現和未來可能的衰減速度值不值得耗費大量人力物力去生產部署,部署後模型帶來的效益是否能在長期內沖銷成本也是建模人員需要去考慮的事情。
最最重要的是,需要意識到大數據建模只是解決問題的一種方法,與其他任何一種解決問題的途徑手段在本質上並無不同。
建模前對業務目標的了解,對建模必要性的分析,對模型目標變數的刻畫以及對建模樣本的選取等問題反而比建模本身更值得引人關注。
以前端風控業務中的反欺詐識別為例,如何精確地定義欺詐行為是建模前需要解決的第一要事。如果對欺詐的定義有偏差,即使後續的演算法表現優良,模型也無法最大程度地服務需求,基於不準確的定義識別出的「欺詐行為」不再符合對業務的定義,整個建模工作在某種程度上也失去了本來的意義。
對於專業的modeler來說,真正花費在建模上時間恐怕不會超過他們日常工作的40%。
畢竟建模技術的實現容易,而讓模型最大程度地的滿足業務需求,發揮商業價值則需要花費非常多的心血。
2. 策略設計
策略在消金領域通常是指判別客戶是否通過風險審核的判別體系。
對客戶的風險審核基於一系列的判別準則,判別準則是基於歷史客戶的各行為風險指標所構建的Tree-base 模型,換句話說也就是if-else準則。如果客戶滿足某種條件組合,那麼就通過,否則就拒絕.
國內消金平台大多以量化模型輸出為主,客群的其他行為指標例如消費偏好,電商活躍度,履約指數等為輔來設計構建業務策略。
風控策略設計首要要求對產品邏輯有所了解。
比如小額現金貸和房抵貸,顯然這倆產品的策略設計方向和結構不一樣。
其次是客群特徵,如果產品本身的目標客群風險較高,理論上來說風控策略的設計要更為嚴格才能篩除大部分的高風險客群,也就是「瘸子裡面挑將軍」。
風控策略設計不是一個靠書本能學會的業務,它需要實際的業務知識來做支撐。
如果要深入該領域工作,那麼應該著重了解業務邏輯和客群特徵。
至於策略設計方法,這部分入門並不是很複雜,有基本的數學知識和邏輯分析能力即可。
3. 催收管理
催收管理目前在國內還是一個技術比較粗糙的領域。
粗糙主要表現在對催收策略的定製上。
目前國內主要是以電話催收為主,中介催收為輔,法院律師等催收手段佔比較小。
電話催收的重點在於對催收話術的設計,通過對話術的設儘可能的使逾期客戶還款,減少損失。
電話催收也是國內催收管理「粗糙化」的重災區,很多平台對催收策略的設計是只要逾期就打電話,並沒有考慮到客戶自愈的可能性和客戶還款意願的強弱,這一舉措使得大量的人力成本被浪費,同時也給了客戶非常不好的使用體驗。
中介催收主要以外包為主,平台將頑固性逾期客戶外包給中介機構,中介機構代為催收,並從回款中獲取收益,這一環節不涉及平台自身催收策略的制定。
如果從事催收相關的職能範疇,則需要了解相關的催收手段,催收話術,更進一步如果是構建催相關的量化模型,則需要如第一點提到的儲備相應的知識。這一點《數據化風控 信用評分建模教程》中有講到通過量化方式優化催收策略和流程的內容,是非常先進的理念,可以學習一下。
最後,想要對消金風控有更為深層次的認識,除了掌握必要的非業務技能之外,對業務本身的理解才是正確方向的入口。業務本身邏輯就像人的性格一樣,不同的性格給與不同的應對措施,才能使自身的非業務技能發揮最大的價值,從而反饋性地增進對風控本身的理解。
8月4日-5日會有新流財經+ZRobot聯合舉辦的《數據驅動信貸產品全流程培訓》,想要全面了解數據風控專業知識建議參加,可以掃描海報上的二維碼報名。現在報名就可以送一本《數據化風控 信用評分建模教程》。
破局,蛻變!數據驅動信貸產品全流程培訓 - 報名表推薦閱讀:
※金融壹賬通副總經理兼首席創新官邱寒:「ABCD」將重塑金融行業
※中普集團:精耕細作櫛沐風雨,踐行五載赤誠為您
※「用數據賦能你我,讓生意簡單好做」杯子金服亮相2018金融科技與量化投資發展論壇
※中國工業經濟聯合會會長李毅中為何關注工業投資下降?從金融「脫實向虛」說起
※英國伯克集團進駐亞太市場,中國科技金融迎新機遇