標籤:

互金風控進化史:人工、實地到智能大數據走過哪些曲折?

今天大家都已經習慣了線上秒批、數字信用等基於人工智慧和大數據的風控體系。但是追溯到十幾年前,數字風控卻付出過慘重的代價。十幾年一路走來,隨著大數據以及人工智慧等技術的不斷完善,互聯網金融才真正讓大數據風控走向完美。

日前,在玖富集團開放日上,玖富首席數據科學家、首席風險官谷穎講解了人工智慧的應用要素和發展階段,揭示了智能風控的進化史。

(玖富集團開放日)

從互聯網金融祖師爺的垮掉說起

NextCard是互聯網金融行業繞不過的一個案例。這家公司堪稱互聯網金融的祖師爺。NextCard總部設在舊金山,通過互聯網發放信用卡的公司。公司提供一套VISA卡網上信用審批系統,並為使用者申請者提供互動服務。

(維基百科關於NextCard的介紹)

在這家公司的徵信體系之中,信用資料較少的申請人,只需在這裡存有一定額度的存款,就可申請到信用卡。和今天很多互聯網金融項目相似,NextCard主打短平快借貸,在當時備受美國用戶的喜愛。從1996年推出到2001年的第三季度,NextCard積累了120萬個信用卡賬戶,未償餘額達20億美元,其成本卻比傳統做法低70%。

NextCard幾乎擁有今天互聯網金融企業的所有特點,甚至今天很多中國互聯網金融項目都與之相似。不過,遺憾的是,2002年9月,NextCard遭到聯邦證券監察機構的調查並宣告破產。破產的最大原因是因為該公司的客戶主要都是一些被其他信貸機構拒絕的消費者,導致欺詐、壞賬的激增。

然而,NextCard把許多屬於客戶故意拖欠不還的普通信用壞賬歸為「欺詐」損失(「欺詐」損失被歸納於一次性損失,財務上不需要相應的儲備金),它需要大量增加儲備金來預備將來的信用損失,導致其喪失流動資金,不得不宣布破產。

回到15年前來看,NextCard錯誤很明顯,主要是這三點:

1、在徵信把關層面上就已經出現了漏洞

對於美國銀行來說,影響審批額度的主要因素包括客戶基本特徵(包括男女、年齡、教育程度等等)、客戶風險暴露情況(社會收入、債務情況、還債能力綜合評估)、現有的社會表現(房貸還款情況、其他銀行信用卡使用情況等)。但NextCard高估了人性,明顯對用戶的信用水準期待過高,忽略了信用欺詐的嚴重性,導致公司破產。

2、在風控層面上也缺乏合理的預警機制

按道理來說,在公司出現壞賬時,應該加強儲備金,以此抵禦風險,但是NextCard幾乎沒有設置壞賬紅線,甚至也沒有為壞賬準備對衝風險的儲備金,僅僅只是把壞賬歸納為一次性損失,這樣的損失過多的情況下,最終只會導致壞賬如滾雪球一般越滾越大。

3、迷信線上審批,缺乏線下人工風控把關

在那個時代,線下人工把關是風控不可缺少的一環,很多小微企業的信貸甚至需要風控人員到現場查看生產現場,結合生產工藝,了解生產組織情況,固定資產更新情況。風控不僅僅是資本和金融層面的事情,更需要真正深入到產業之中,去了解一家企業的運行狀況。顯然,NextCard缺乏對線下的把控,以至於全盤皆輸。

「人肉」風控的必不可少與邏輯悖論

NextCard的垮掉本質上是線上風控、徵信技術有限,無法戰勝人工的結果。在傳統金融機構、小貸公司中,不僅僅有一整套嚴格的審核標準,需要貸款人提供各式各樣繁瑣的資料,而且風控人員甚至還會自己的經驗判斷,在面對一些特定行為特徵、生活習慣的客戶會首先有一個自己的直觀打分判斷,這些是長期經驗累積的結果。想要拿到一筆貸款,金融機構、貸款公司會付出很高的人力、物力、時間成本。

玖富作為中國最早的互聯網金融服務公司之一,如今已經有11年的歷史,在行內頗受好評。這家金融服務公司當年為確保資產項目的真實、安全、可控,通過非常嚴格的完整審核體系的層層篩選,內部建立了獨立的線上風控模型,並引入了實地徵信風控合作。

不過,實地風控體系依然會存在各式各樣的邏輯悖論。

對於金融企業來說,風控模型和風控體系需要非常有經驗的金融從業人士來進行把控,比如說,銀行的風控模型的出發點主要是測量借款方的還款能力,一般來講,模型包含了兩部分的評判,即客觀性的和主觀性的。客觀性的主要是數據類型,能量化的。如公司的年度審計財務報告,銀行流水,繳稅金額等,這些數據放在已設定好的模型里就能給出個分數或等級,做為參考。

但光靠客觀數據還不夠,比如說這公司所在的行業是淘汰落後的行業(如鋼鐵、水泥等),那麼評級可能需要有些降級,再比如說公司的管理人在該行業的經驗年限的長短,都會影響到這家公司的風險,所以這部分就得靠人為主觀的去做些調整。

因此,人在傳統風控體系中起到了很大的作用。比如說,需要人工標記壞樣本的方式來記錄壞樣本訂單號,人工通過相關黑信息關聯找出來的標記樣本。系統設計是儘可能多的和並且儘可能精準的的收集到壞樣本。

但是人畢竟是計算能力有限,而且對複雜的徵信環境缺乏整體把控能力。在人工審核過程中,很容易出現樣品偏差的問題。比如說,你發現騙子符合某些聚集特徵,你指定策略1進行打擊後,騙子的這種欺詐手段被控制,以後的損失案例都不具備這樣的聚集特徵。如果壞樣本的收集時間在策略1上線之後,這個時候模型訓練的結果極有可能出現滿足聚集特徵的風險低,不滿足聚集特徵的交易反而風險高,也就是說聚集特徵的權重是負數。

另一個問題在於,金融行業的勞動力成本正在逐年上升。在傳統金融尤其是傳統信貸服務領域,我國傳統信貸能服務的客戶群僅佔總人口的15%左右。傳統信貸服務需要依託線下網點展開,資質審核、合同簽訂等流程都需面對面進行,服務效率低下,最終的結果是一方面風控人員不足,另一方面是單純的線下人肉風控也缺乏對風控體系的百分百把控。

智能風控三階段究竟解決了哪些問題

對此的應對方案是兩個:一是引入在金融領域對於徵信體系有能力建構一整套完整風控模型的人;第二個才是把大數據、人工智慧引入到徵信體系之中,進行智能風控。

今天BAT三巨頭上手互聯網金融的時候,幾乎都在不斷引入能夠駕馭風控模型的人,以此根據不同行業,不同數據建構起不同的風控模型。玖富也在不斷引入風控模型的把關人,比如說首席數據科學家兼首席風控官谷穎。谷穎博士在回國之前曾在華爾街投行工作達十年之久,其團隊更連續六年在全美固定收益策略、量化研究領域排名第一。而且在一批成熟金融人才的研發下,玖富也構建起了「火眼」風控系統。

玖富的「火眼」風控系統形成了線上化、機器化、模塊化的風控構架體系。充分利用大數據分析技術建立獨特的風控體系,具有處理高效、風險可控、成本低、邊際效應明顯等特點,能夠可以提早發現用戶早期逾期表現,並能有更多的時間進行調整。

根據她的說法,人工智慧應用在金融領域有三個階段。第一個階段是機器學習(ML)階段,即互聯網金融為代表的金融機構全面滲透到所有模型建設中;第二個階段是自然語言處理(NLP)階段,即國內大量互聯網貸款和徵信公司都在大量使用自然語言處理技術;第三個階段是知識圖譜(KG)階段,即大量使用知識圖譜進行反欺詐分析。「火眼」風控系統恰恰覆蓋了這三個階段的所有應用,也是目前比較完善的風控系統。

機器學習(ML)階段解決的核心問題在於,讓風控模型自動學習、自動匹配各項數據,在模型內發現異常,揪出信用黑戶。尤其是機器學習演算法能夠根據數百萬消費者案例,如:資產、履約、身份、偏好、社會關係及借貸情況等進行開發和訓練,利用演算法評估預測用戶是否會違約、是否會按時歸還貸款等。

自然語言處理(NLP)階段解決的問題則是可以在個人及企業主頁、社交媒體中發現蘊含著與違約風險深度關聯的深層含義,通過複雜的詞向量模型將文本轉化為計算機能夠識別和計算的詞向量表徵,並基於深度學習技術對其進行特徵提取,最終運用成熟的分類器網路將文本數據與違約風險實現高度的風險掛鉤,而通過傳統方式很難充分挖掘其風險價值。

知識圖譜反欺詐(KG)分析恰恰是最重要的一個環節,因為知識圖譜反欺詐需要把所有技術融合在一起,構建圖譜,從中發現欺詐行為。這也是很多互聯網金融公司目前在主攻的方向。

因為在過去,反欺詐人員需要根據借款人提供的信息,查找多方面資料,進行不同屬性的比對,從而發現不良徵信人。這種工作複雜而枯燥,為了識別團伙欺詐,往往需要收集、整理、分析各種維度的數據,工作量更是成倍增加。而知識圖譜反欺詐能夠把把每個客戶的信息、以及網路上公開的信息織成一張巨大的關係網,並通過可視化的圖形將這種關係展示出來。結合反欺詐部門的經驗,找存在欺詐的客戶。

寫在最後:

雖然如今大部分平台都在採用「大數據技術」來做風控,但審核結果嚴重趨同,現狀不容樂觀。真正大數據風控技術需要多雲數據源(平台積累、徵信機構、同業共享)來支持風控審核模型決策,這恰恰是中國互聯網金融企業最需要發展的方向,也是必然需要走過的曲折道路。

作者:深幾度,微信號:852405518,微信公眾號「深幾度」,轉載請保留版權內容。


推薦閱讀:

算話徵信CEO蔣慶軍:定位早期風險識別,行業最終只會剩下幾家公司
大數據風控「污名化」溯源
AI改變金融風控,深度學習技術可以將壞賬降低35% | 乾貨
現在的大數據風控還只是個寶寶

TAG:大数据风控 |