秦蒼科技數據科學家沈贇:AI在消費金融產品優化以及風險控制中的應用(附PPT+視頻) | 硬創公開課

中國消費金融市場的用戶大致可以劃分為四種類型:1.白領和自僱人群;2.藍領;3學生;4.農民。其中,前兩者為主力消費人群,市場規模十分廣闊。白領和自僱人群往往擁有央行徵信報告,主要使用銀行信用卡,以及BAT和京東等大型企業提供的消費金融產品。而多達2.5億的藍領則主要為薄文件人群(央行徵信報告能夠採集到的數據非常少),他們具有很強的消費衝動,是互聯網金融產品的主要目標。而由於傳統銀行放款周期過長,無法滿足他們的需求;即時高效的互聯網消費金融產品也就成了他們的最佳選擇。

那麼,互聯網消費金融企業如何才能抓住這一市場機遇,從廣大薄文件人群中尋找優質客戶、提高用戶黏性,同時降低風險,將收益最大化呢?本期硬創公開課,雷鋒網(公眾號:雷鋒網)邀請到了秦蒼科技數據科學家沈贇博士,為大家分享AI在消費金融產品優化以及風險控制中的應用。

內容介紹:

本次公開課包含以下內容:

1. 根據用戶多維弱變數數據的綜合信用評分

2. 社交網路演算法應用於金融反欺詐

3.基於機器學習模型的額度策略

4 基於機器學習的金融產品設計

5.人工智慧應用的前沿探索:用戶生命周期管理

嘉賓介紹

沈贇博士,秦蒼科技數據科學家,具有9年金融領域機器學習研究開發經驗。擁有德國柏林工業大學電子信息科學與技術博士學位、上海交通大學計算機科學與技術碩士學位、德國柏林工業大學電子信息科學與技術碩士學位、上海交通大學計算機科學與技術本科學位。

曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等機器學習、神經網路以及應用數學等領域的頂級期刊和會議上發表多篇學術論文。

曾任職德國LOBSTER Data 量化分析師,分析處理高頻Nasdaq數據,輔助完成產品上線。現擔任秦蒼科技數據科學家,率領團隊構建基於機器學習的信用評分、額度策略、反欺詐以及用戶生命周期內的自動化動態調頻系統等。成功打造了基於用戶數據1秒內完成信用評分的評分機制,相比傳統模型提高了25%AUC。

AI在消費金融產品設計以及風險控制中的應用_騰訊視頻 https://v.qq.com/x/page/n0506xm1ydl.html

(本期公開課完整視頻,共51分鐘)

以下為雷鋒網對嘉賓分享內容的實錄精編。

風險控制

信用評分

風險控制是消費金融領域的一大核心問題,信用評分機制則是控制風險的有效手段。信用評分機制可以簡化為分類問題,即根據用戶歷史上的行為,來判斷他是「好人」還是「壞人」。假如一個用戶逾期幾個月,那麼我們就認定他是「壞人」,若沒有逾期行為,則為「好人」。

我們採用了機器監督學習中的經典分類演算法來進行用戶信用評分。評分過程可以分為以下幾步:

數據導入和清洗。因為數據採集過程中可能會採集到臟數據,此外,我們還需要剔除部分不可用、不可計算的數據,以及空數據。

特徵提取。採集數據時,我們通常會採集多達一萬多個數據點,然後通過特徵提取的方式提取幾百個特徵點。

模型選擇。在模型中,我們會運用到一些機器學習演算法,比如邏輯回歸、隨機森林、AdaBoost、XgBoost、神經網路等。選擇模型時,我們會採取cross validation的方式,同時運用基於ROC的AUC來決策模型的好壞。

決策。決策過後,我們可以觀察用戶表現,重新提取數據訓練模型,形成正向反饋循環。也就是說,隨著收集到更多、更新的數據,我們的模型將不斷迭代和進化。

從應用結果來看,AI決策相比傳統手工開發的演算法決策,可以把決策時間從分鐘級別縮短至0.1秒,同時降低25%的壞賬率,每年為企業節約高達上千萬的成本。

在大家熟知的,使用深度神經網路解決圖像識別和雲識別的問題中,一般而言,採集的數據越多,訓練出的模型就越好。但金融領域不同,金融數據具有非常強的時間效應,越靠近現在的數據越具備預測效力。並不是說擁有的數據越多,模型效果就越好。因此,不斷定期更新模型至關重要。

模型是基於歷史數據訓練出來的,在未來不發生異常事件的前提下,可以保持預測效力;一旦出現異常事件,模型的效力就有可能下降。為了保證系統預測的穩定性,我們會同時開發多個模型彼此競賽。

比方說,我們訓練出了三個模型,分配給他們不同的流量:模型2流量最高,模型1次之;模型3最低。一段時間後,我們可以收集到各個模型的表現,根據其準確率動態調節流量。如果某個模型表現好,就多分配一些流量,反之則減少流量。如果這個模型的效力長時間內持續下降,就將逐漸被淘汰,與此同時會有新的模型加入競爭。總而言之,多模型並行,擇優進化,對於保持系統的穩定性十分重要。

通過社交網路分析反欺詐

消費金融產品風險控制中,另一個非常重要的部分是反欺詐。我們反欺詐的主要手段是社交網路分析。用於社交網路分析的數據通常基於手機號碼,比方說手機緊急聯繫人、通聯紀錄、通訊錄等。

上面是一張社交網路關係結構示意圖,圖中每個點代表一個用戶,通過線段連接的兩個點互為手機聯繫人。其中某些用戶可以通過一個共同的節點聯繫到一起,那麼我們就將其看作一個團。以團為單位,可以提取到一些社交網路特徵:

團內其他用戶的表現,比方說逾期率、通過量等。這一特徵判斷的核心思想可以歸納為「近朱者赤,近墨者黑」。

團本身的特性,比方說節點數、團內用戶的連接緊密程度等。

團內用戶的屬性,比方說團內的女性人數、地區分布、平均借款額度等。一般而言,團內女性人數佔比越大,團內用戶是「好人」的概率就越大。

從社交網路中提取的特徵主要可應用於兩大方面:

一、將特徵數據加入信用評分模型,提升其準確度。根據以往的經驗,加入這些數據後,AUC值可以提升3-5%。

二、通過無監督的聚類方法來預防欺詐。我們將某個地區的所有用戶進行特徵分析後,投影到二維平面,通常可以發現兩到三個異常點,他們距離其他用戶非常遠。這時候就會觸發我們的調查機制,調查這個用戶是否真的存在欺詐行為。實踐檢驗,這種異常值檢測的方法可達到60%左右的準確率,證明對於預防欺詐,社交網路特徵分析確實行之有效。

產品優化

優化金融產品參數

消費金融產品主要指分期借貸,我們可以把它想像成信用卡,其主要參數有額度、利率和期數。設計這些參數時,我們主要需要考慮兩個方面:

產品的接受度。我們向用戶推薦產品時,用戶是否會接受?一般而言,產品額度越大、利率越低,用戶接受的可能性就越大。

風險控制。隨著用戶接受度提高,風險也在增加。如果我們向用戶提供的額度超出其償還能力,資金就很可能收不回來。

產品的接受度和風險彼此衝突,我們需要尋找折中方案。

下面介紹一個我們開發的基於貝葉斯演算法的框架。在消費金融場景中,簡單來說,可以把用戶劃分為「好人」和「壞人」。在給定用戶表現和金融產品參數的前提下,基本可以確定這款產品能夠帶來的受益。但同一個用戶在不同時期的表現是不一樣的。比方說,用戶這段時間經濟狀況較好,能夠及時還款;一段時間後他經濟狀況變壞了,就很有可能還不上。用戶是「好人」還是「壞人」,是個概率性問題。

上面的公式中,p代表在給定某個金融產品和用戶的前提下,這個用戶是「好人」還是「壞人」的概率。統籌考慮所有情況後,就能得出這個用戶身上的期望收益。

我們希望通過調整產品參數將收益最大化,同時也需要關注用戶逾期的風險。在給定某個產品的前提下,我們希望用戶是「好人」的概率大於某個值,比如0.6或者0.8。這樣可以間接控制用戶可能帶來的損失。

上圖展示了我們對「用戶是『好人』還是『壞人』」的概率估計情況。其中x軸代表額度,y軸代表期數,z軸代表用戶是「好人」的概率,每一個曲面對應一位用戶。從圖中可以看出,有些用戶對於額度和期數不太敏感。雖然隨著額度和期數增加,他們是「好人」的概率有所下降,但始終高於某個數值。有些用戶則對額度和期數非常敏感。通過大量提取用戶特徵,我們可以不斷對模型進行優化,為每個用戶量身打造合適的金融產品。

那麼,這個模型的效力究竟如何呢?上圖進行了展示。圖中x軸代表風險閾值,左端表示閾值非常低,我們可以冒巨大的風險;右端表示閾值非常高,放款策略趨於保守。y軸則代表我們針對某個用戶預測的放款金額,與其歷史放款金額的比例關係。若比例大於1,就說明預測的放款金額高於歷史放款金額,同理反推。從圖中可以看出:

在同一風險閾值下,「好人」(黑色)獲得的額度總是高於「壞人」(橙色)。

隨著風險閾值提高,用戶獲得的放款額度逐漸下降。

在給定風險閾值的前提下,「好人」獲得的預期額度總是高於歷史額度,「壞人」則恰恰相反。

結果和預期完全相符,這證明了我們基於貝葉斯演算法的分析框架確實行之有效。

延長用戶生命周期

企業總是希望用戶能儘可能長時間地使用自己的產品。因此新用戶借款並如期還款後,企業還會向其推薦其他金融產品。那麼,如何最大限度地留住客戶,延長其生命周期呢?

在用戶的整個還款周期中,我們可以通過用戶在每一個還款節點的表現,判斷其是「好人」還是「壞人」,並作出相應調整。如果用戶還款表現好,可適當提升額度或降低利息,鼓勵其使用我們的其他產品。若用戶表現差,則可以降低額度和提高利息,以防控風險。極端情況下,將啟動調查或催收機制。

藉助這些手段,企業可以提升用戶黏性,並將收益最大化。

馬爾科夫決策過程-增強學習

為實現這一目的,我們採用了深度學習以及運籌學中非常經典的馬爾科夫決策過程進行建模。企業關注的是用戶在整個生命周期中帶來的累積收益,因此不同於前面提到產品參數優化。產品參數優化是單步決策,而收益最大化是多步決策問題,需要在每一步決策中不斷優化我們的策略。

上圖中的公式中,r是一個reward函數,它取決於st和θt兩個變數。st和θt分別代表當前賬期下用戶的表現(逾期或提前還款等)以及企業的決策(提額或降息等)。π則代表企業在每個賬期中的單步策略累計而成的整體策略。通過這個公式,我們可以得到預期的最大收益。

昨天阿爾法go再次戰勝了中國著名棋手柯潔。阿爾法go用到的一個核心演算法叫做增強學習,增強學習的本質其實也是馬爾科夫決策過程。它用到了不斷迭代的online learning演算法來解決多步決策問題。

馬爾科夫決策應用到消費金融場景,過程大致如下:新用戶進來後,系統會抽取他的個人特徵,同時根據其當前還款狀態,以及在這個時間點上帶來的利潤或者損失,優化value function和state representation。value function和state representation是通過分析和學慣用戶歷史數據得來的,加入新的數據後,系統會不斷校正value值。如果某一步決策對我們不利,那麼其value值就會降低,反之則value值提高。如此不斷循環往複。

總結

前面提到,AI在消費金融風險控制以及產品優化方面,能夠發揮巨大重要。但需要強調的是,現在AI概念非常熱門,大家都希望學到最新的演算法;但要把AI演算法落地到實際生產和業務中,還是應該立足業務本身,不斷挖掘數據優化模型。選擇什麼模型不重要,模型好壞最終還是要看它是否能夠給業務帶來增長。最理想的狀態是,企業能夠通過模型優化業務流程,獲取更多數據,然後利用新的數據進一步優化模型,形成良性循環。

QA:

1.除了風險控制,未來AI還可以應用到消費金融的哪些環節,將給行業帶來怎樣的改變?

前面已經提到了產品結構優化。通過優化產品參數和結構,來提升用戶黏性,將收益最大化,這對於企業來說非常重要。除此之外,AI還可以用於產品推廣,比如通過現有的社交網路,向其他用戶推薦適合他們的金融產品。

2.在目前技術條件下,AI風控相比傳統風控存在哪些不足?未來如何提高?

AI技術立足於大數據。如果我們能夠獲取足夠多、足夠新的,具有表徵能力的數據, AI風控一定能夠打敗傳統風控。但很多時候,企業獲取的數據往往不夠充分。這時候,基於長期經驗積累的傳統風控往往能夠提供行之有效的風險控制手段,雖然他們的方案不一定是最優的。如果未來AI能夠進化到擁有學習和推理能力,那麼它完全能夠取代傳統風控,不過短期內還很難實現。

3.隨著人工智慧發展趨於成熟,未來消費金融行業必然會大規模引進這項技術,這是否會帶來風險評估同質化的問題?企業該如何進行產品的差異化開發?

這個問題確實存在,未來同一個行業用到的AI演算法大多類似。但每個企業採集到的數據端不同。如果企業能夠採集到足夠新、足夠可靠的數據,其風險控制能力將顯著提升。因此,問題的本質在於如何獲取儘可能多的優質數據。

4.人工智慧能否代替個人徵信的作用?

我個人認為是可以的。央行的徵信系統能夠做到多好,取決於大型機構,比如銀行和BAT等大企業,願意在多大程度上貢獻數據。如果這些機構願意將數據完全共享出來,那麼央行的徵信系統可以做到非常完善,但其中存在非常大的阻力。企業們還是更願意基於自己採集到的數據,儘可能把風控模型做到最好。如果央行無法採集到足夠多的數據,其徵信系統不見得一定比企業的風險控制系統更好。

5.入門應該如何學習AI

個人認為可以分兩個層面:首先可以上網搜索一些教程,比如說雷鋒網硬闖公開課上的教程;另外還可以通過實現現有的、開發好的AI程序,提升自己的動手能力。總之,學習和實踐相結合。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

推薦閱讀:

银行存款丢失的这件事,大家怎么看?
關於知名操盤手 保羅·都鐸·瓊斯 的書?
中國今後十年最有發展潛力的銀行有哪幾家?

TAG:人工智能 | 金融业 | 风险控制 |