風控與業務相愛相殺,互撕誰又能贏?
風險把控是金融業的核心,沒有好的風控基本不可能走遠。但嚴格的風控又可能導致業績上不去,規模同樣發展不起來。風控和業務,相愛相殺,互為依存,要共生更要共贏。
——瓜姐
主題分享:大數據風控驅動新金融——中誠信CTO姚明
下面分享一下我們從徵信公司的角度如何看待互聯網金融時代下的大數據風控,以及我們如何實踐大數據風控。
一年前的時候,我們提出了「數據+規則+模型」的風控理念,並基於此理念研發了萬象風雲平台,致力於打造基於第三方徵信的大數據風控雲平台。
眾所周知,傳統的信用評估模型主要使用金融領域的歷史借貸數據來預測和判斷借款人的違約風險,所以其局限於只能對發生過借貸行為人進行有效評估。而新金融背景下,普惠金融的目標人群顯然不符合上述特徵。
因此,萬象風雲平台的大數據風控體系除了提升風控質量外,還有一個重要出發點,就是基於幫助金融機構了解更多的借款人、獲得更多的可發展業務群體。平台的風控體系分為三個基本面、四個業務版塊。
在數據層面,除了借貸交易數據和身份屬性數據外,我們的大數據風控體系更廣泛的採集通信運營商數據、電商消費數據、銀聯交易數據、網路行為數據、操作行為數據等金融次相關、甚至弱相關數據,來彌補信貸交易數據缺失的影響,進而覆蓋更多的人群。質量不足數量補,這是對於風控大數據採集的一個重要原則。
從數據行業發展來看,現在的互聯網大數據的維度已經非常豐富,並且對於風控的價值也越來越直接。例如從反欺詐角度看,我們通過對用戶消費和行為數據的跟蹤分析發現,老賴用戶會關聯到法律糾紛等關鍵詞,多頭借貸用戶往往會關聯到新口子、套現、京東白條、螞蟻花唄、蘇寧金融等關鍵詞,通過薅羊毛手法走各種新平台,拆東牆補西牆,黑產中介會關聯到周卡、貓池、小號、零配件、設備號等個關鍵詞。
從信用評估角度,通過對線上消費和線下消費的數據分析,會發現線下消費地域流動性越小、購買的商品品類越豐富、消費趨勢越穩定的人群,違約概率越低。但是如何高效採集和整合處理這些看似維度豐滿、實際零碎稀疏的數據,並作出有價值的風險解讀,是非常大的挑戰。
在萬象風雲的數據平台里,基於生物識別技術的人臉識別和活體檢測、基於NFC識別技術的身份證真實性檢測、基於SDK預埋採集點的設備指紋、基於用戶強授權的信息爬取,基於集成API介面的三方徵信數據查詢,構成了風控大數據的基本採集框架,服務於上層的規則和模型。對於數據的處理,通過應用流式計算提高處理效率,最大程度滿足實時性要求;
另外,應用知識圖譜和圖資料庫技術,將所有信息抽象為「主體」與「關係」的二維世界,通過關聯分析建立風險關聯拓撲圖,不但可以提高信息檢索速度,還能夠識別隱性風險。在應用端,通過大數據可視化技術,能夠讓不懂數據分析和建模的人員,也能直觀的從圖標上看到風險、理解風險。
在規則層面,主要圍繞反欺詐環節展開。在這個層面,既需要有業務發展初期的風控專家的經驗設定,也需要有業務發展過程中數據挖掘和模型分析後的重構迭代。萬象風雲的風控規則,包括了業務准入規則、申請資料交叉核驗規則、歷史行為檢查規則、團隊反欺詐規則、黑名單檢查規則、設備反欺詐規則、行為反欺詐規則等幾個主要規則集,通過規則引擎和前端可視化編輯技術,能夠讓風控人員自主配置規則集和策略,並通過觀測窗口進行策略與策略之間的對比,進而快速實現規則和策略的調整和優化。
對於規則的迭代,有兩類主要觸發點,一類是基於業務數據分析,即通過對審批數據和表現數據的追蹤分析,屬於驗證性調整;另一類是基於新的數據能力導入和解讀,建立並行的規則疊加體系,屬於觀測性調整。鑒於國內的信用風險,有很大一部分比例是來自於群體性欺詐,該人群的業務申請流動性和突發性很強,因此,是否有靈活配置的規則管理、是否有直觀的策略比較工具,是否能快速識別風險和拒絕風險的關鍵。
在某種意義上,規則是人工和智能,而模型是真正的人工智慧。在大數據風控體系中,規則與模型屬於相生相伴,又互相排斥。我們追求通過建立模型來簡化規則、弱化規則的必要性,但並不能完全替代規則。在實際業務中,很難形成通用模型,無論是反欺詐模型還是信用評估模型,都有非常強烈的場景屬性和特定人群特徵。
這從技術角度來說,極大的增加了建立模型的難度。如何在樣本不均衡的情況下建立有效模型?如何在片面樣本的情況下建立有效模型?如何在樣本數據維度稀疏的情況下建立有效模型?等等,我們在過去兩年中遇到了非常多的挑戰。往往是一個模型建立後,在不同的場景、不同的人群中表現出極大的差異性。這些問題,一方面依賴於理論提升和技術創新,更多的還是要依靠對垂直場景的理解和業務試錯迭代產生的數據。
從某種意義上講,模型只是數據的衍生品,所以並不存在到底數據更重要還是模型更重要的疑問。在模型的建立上,機器學習和集成學習已經成為標配,從基於直接變數的強解釋性模型,到基於多層級子模型的弱解釋性模型,本質上是對大數據價值的最大化利用。
上述的數據+規則+模型,是我們萬象風雲的大數據風控體系的三個基本面,在系統應用層面上,分為反欺詐、信用評估、風險監控和智能分析四個版塊,覆蓋貸前、貸中、貸後流程,從證明借貸人的「你是你」,到「你的資料是真實的」,再到「你的信用是好的」。其中的智能分析版塊,主要是基於信貸表現數據自動分析,對規則集的調整提供實時智能建議。整體系統的目標是將風控線上化、智能化和工具化。這也是我們對於大數據風控發展趨勢的判斷和理解。
優信邵總:風控與業務互撕,怎麼能撕贏?
與會嘉賓觀點:大部分情況下,金融機構都是風控贏,業務方怎麼能贏?
中誠信CTO姚明:風控是公司贏利的核心能力之一,在金融機構里,業務方很可能就會掰不過風控,那麼就要從管理的角度來平衡。風控是可以用模型來證明給你看的。
金融產品經理劉欣怡:用數據來說話,業務方願意來背這個風控成本,可以用AB測試證明某類被PASS掉的用戶其實是被風控誤殺。小額信貸用3000個用戶就能證明,其他的大額信貸也可以用一定量級的用戶來證明某些風險點可以適度放寬。
金融高管會:大數據徵信成本都在什麼水平?
車曉科技風控總監張文濤:消費金融通常不超過10元,更多的是5元以內。車貸等大額信貸,能接受50-200元的水平。
金融高管會:風控總監一般怎麼設計風控模型?
九鼎融資租賃風控總監王祿海:一般新的金融機構前期的風控都存在很大的問題,一般情況下是靠風控負責人的經驗,再拿第三方數據來看。會從8家徵信公司去進行比較,最終會選擇1-2家做為原子量的參考,根據經驗來做一套模型。雖然大家都不一樣,但是從各個維度來說,風控模型都會趨同。
金融高管會:風控模型會朝什麼方向發展?
九鼎融資租賃風控總監王祿海:最終同類的金融機構模型會趨同,但是大家的風險容忍度不同。
中誠信CTO姚明:現在大家都推崇原子級的風控模型,有很多很多的點。現在根據一些經驗,是可以去解釋是哪個點被風控卡住不放。但是隨著人工智慧的發展和應用,變數越來越多、越來越細,風控也沒法說明到底是哪個點不過了。
浦發銀行北京某支行肖行長:銀行跟金融公司、融資租賃、互聯網金融直面競爭,怎樣取得優勢?
金融高管會:大部分情況下,銀行和這些金融機構的用戶不是一類用戶。銀行利息低,吸引到的用戶更加優質,徵信評分都比較高;其他機構一般是吃銀行剩下的用戶,甚至很多是白戶。
優信邵總:在車貸這個領域,汽車金融公司、融資租賃公司可能也會跟廠商合作,跟銀行一樣談到一些低息或者0息政策,在這種情況下,可能大家就是同樣的競爭水平了,就看用戶怎麼選了。
中誠信CTO姚明:車貸為什麼風險值不高?
金融高管會&優信邵總:汽車貸款在全球都是風險不太高的信貸方式,正規情況下用戶違約率是很低的,無論是新車金融、還是二手車金融。
為什麼用戶不違約,因為沒必要違約。金融機構為了控制風險,會用一些演算法和風控措施來保證「用戶要還的錢永遠小於車的殘值」。想像一下,車的殘值是7萬,用戶會為了5萬元的貸款額而去違約嗎?除非一開始車價就做假的。
本文來自公眾號:瓜姐講堂,carguagua,歡迎交流。
推薦閱讀:
※找了一個電話銷售的工作,關於股票的,但是不知道怎麼介紹,打電話時也比較緊張,有什麼相關方面的話術么?
※業務員沒業績,絕對都有這些臭毛病!銷售冠軍最鄙視的就是這些!
※公司內部轉崗如何搞定自己上司?