資產管理中的大數據風控運用

05-02

一、大數據風控的內涵、技術特點及模塊

大數據（Big Data）是一個寬泛的概念，業界沒有統一的定義，可以說大數據是指超規格的數據集」，也可以說「大數據是信息資產」。

大數據的特徵就是：數量（Volume）、速度（Velocity）、種類（Variety）、價值（Value）和真實性（Veracity）特徵。可以用5個「V」來概括。大數據風控，就是通過這5個V的數據，構建模型對金融業務進行風險監測、預警、計量和控制。

隨著對大數據研究和實踐的深入，大數據風控模型演化分4個階段：

1、基於專家知識的規則

依賴基於專家知識的規則系統，進行現有規則優化及關聯分析，規則系統常常被用於反欺詐，交易員監控等業務中，例如利用規則識別信息造假，組團欺詐，信用卡支付欺詐等等。

2、基於學習的異常行為檢測

後來隨著業務不斷發展以及規模擴大，這種補充日益頻繁，專家知識規則迅速擴大，這個時候就要求系統自動對數據進行學習，識別出異常行為。異常行為檢測的優點是對任何可能帶來風險的異常行為都很靈敏，缺點就是太敏感了，誤判率高。

3、基於圖挖掘的分析

圖挖掘演算法能夠高效分析各種關聯信息，例如通過圖挖掘找出環狀子圖可以識別信用卡開戶團體造假，貸款擔保圈、多人貸款歸集一人使用等；例如在企業逾期還款風險分析當中，若上游企業逾期還款，一般下游企業都會受到影響，通過圖挖掘的風險擴散模型可以實現風險預警從而提早採取相應風險控制措施。

4、基於歷史數據建立分類模型

這種模型要求相關業務需有一定的歷史數據，例如在反洗錢業務中要知道哪些帳號之前發生過洗錢行為，在銀行網點操作風險預測中，要知道哪些網點之前發生過風險事件。監督學習的優點是針對性強，分類模型多且結果會比規則系統及無監督方法準確，無需人工干預。

二、國內大數據風控的研究與應用現狀

目前風控已從業務發展與經營管理中的重要要素逐步脫離，形成系統甚至行業。金融風控體系層出不窮，既可以按照風控主體劃分，又可以按照風控體系的智能性與技術特點劃分，還可以按照風控作用的流程與業務環節劃分。同時又根據風控體系是否開放以及功能模塊的組合與刪減，又存在一些細分。

按風控主體，分為以下3類：

傳統金融風控技術

互聯網大數據風控技術

大數據金融風控模式

1、傳統金融機構的風控

FICO大家都比較熟悉，這裡主要想介紹一下德國IPC小貸分析技術。近幾年，德國IPC小微貸款評估技術不斷推廣，現在很多商業銀行或小額信貸公司廣泛運用。IPC小貸分析技術的核心，是評估客戶償還貸款的能力，主要包括三個部分：一是考察借款人償還貸款的能力，二是衡量借款人償還貸款的意願，三是銀行內部操作風險的控制。每個部分，IPC 都進行了針對性的設計。

IPC微貸技術概括總結為四個要點：現金流分析、線上線下交叉檢驗、能力和意願是唯一依據、勞動密集型業務。

2、互聯網機構的大數據風控

現在打開微信，不光能聊天，還能借錢，這就是微信微粒貸，通過建立6個模型找客戶：微信社交、QQ社交、財付通交易數據、銀行資產負債與還款狀況以及是否「饑渴」地需要資金。

微粒貸採取白名單制。所謂的白名單，其實就是一種優選制，而不是逆向淘汰制。如果設立了白名單，則意味著信用較好的用戶會被列入在白名單中，根據互聯網採集的信用狀況數據來進行評估，推選出最優的用戶。至少對於這款小額貸款產品而言，這一套方法是十分適用的，在有效的風控基礎上，加上與QQ和微信的連接，微粒貸在短時間內積累了近千萬的個人用戶。互聯網的風控也帶有很強的社交屬性。

3、新金融風控模式

近兩年伴隨著互聯網金融熱潮，各種大數據風控體系層出不窮，比如玖富「火眼」、麥子金服水滴、融360的天機等。其中拍拍貸的魔鏡在國內是比較領先，也是實際應用效果得到檢驗的。

拍拍貸成立8年、有600萬在線用戶、積累近40億條數據，拍拍貸的「魔鏡」風控系統就是在此基礎上而成的，主要包括：客戶來源的數據、平台來源的信貸審核數據、網路來源的網路黑名單、網上行為數據、社交關係數據等，以及第三方渠道數據。

魔鏡基於嚴格的6大環節風控流程，獲取用戶2千多個欄位信息；再經過篩選，轉化，加工，最終對每個借貸標的風險概率進行預測，給出一個風險評分，並對借款做出定價。

三、大數據風控技術在資產管理中的應用與實踐

對於資產管理行業，大數據的核心價值在於高效地實現大規模，多類型數據的擷取與處理，發掘出關於產品、客戶、市場的高價值信息，輔助資產管理者作出更加合理的決策。在產品開發上，藉助大數據技術，從海量數據中提取客戶的資金使用習慣，從而開發新型「碎片化」理財產品，更充分地滿足多元需求。在風險控制上，通過多種類型數據挖掘，進行全面分析和預測風險，並提供資產配置、投資節奏的調整策略。在市場營銷上，立足於客戶信息庫和互聯網數據，分析推算出客戶的產品偏好，實現客戶的精準分層和產品的精準推送。

1、大數據在流動性風險管理中的運用

通過大數據，進一步拓寬風險管理範圍。可以充分運用在風險限額管理、對外擔保額度統計、監測資產結構比例、資產負債流動性匹配管理上，還可以納入原本複雜的投資資產結構測算、量化金融市場環境對投資的影響，分析外部融資能力等。

通過大數據，完善風險監測指標體系。實務中，根據數據積累及可得性，可以凈現金流、綜合流動比率和流動性覆蓋率等指標基礎上，自主增加資產集中度、融資回購率、累計退保率等流動性風險監測指標。通過借鑒和運用金融保險行業較為成熟的監測指標體系可確保及時準確地管理流動性風險，做到防患於未然。

通過大數據，穿透識別底層資產風險。對市場信用風險涉及的資管產品、未上市股權投資計劃、信託計劃等金融資產進行穿透，識別這些金融產品所投資的具體、明確的基礎資產的風險暴露和風險因子，還可以評估金融產品的市場信用風險定價是否合理，以及在壓力情景下它們是否變為流動性問題，以便及時採取應急計劃，化解流動性風險。

通過大數據，評估公司資本充足狀況。可依據數據信息，採用VAR（在險價值）和ES（預期不足）等方法計算出潛在的最大損失，並基於謹慎的原則，持有一定數量的高流動性資產以應對可能發生的這些潛在損失。

通過大數據，審慎評估流動性項目。在評估流動性涉及的資產或負債項目時，為有效防範流動性風險設定安全閾和防火牆。

2、大數據風控對投資風險的控制

一是大數據+量化，輔助投資決策。量化是一種工具，它收集、歸納、總結交易數據以及回測、驗證交易設想，從而幫助作出交易決策。大數據量化投資，可以擴大投資範圍，提高投資效率，更主要的是降低風險，減少投資的不確定性，模型是獨立自主和自我學習的，最大限度地減少了人為帶來的錯誤，通過對基本面觀點系統性地執行，使交易回測更準確。近些年機器學習崛起，數據可以快速、海量地進行分析、擬合、預測，人工智慧與量化交易聯繫得更加緊密，甚至可以說人工智慧的三個領域——機器學習、自然語言處理和知識圖譜，貫穿了量化投資的始終。

二是大數據對投資全流程的把控。以國內某家大數據風控平台為例，投資全流程分為投前準備、投中運營、投後跟進3個階段。投前準備階段，通過該平台，可以了解企業詳情、歷史和當前的風險預警信息、風險評級報告。投中運營階段，該平台對企業實時監控，同時輔助機構進行審核審批決策，定期推送預警信號。投後跟進階段，平台會在觸發條件時提供早期風險提示、風險分析，並通過抵押品估值模型實施跟進押品管理、黑灰名單管理等。

3、大數據在信用風險中的運用

大數據技術也不是在所有業務環節都能產生顛覆性的反應，目前大數據風控最主要的解決方案還是在信用風險上，而更多的是針對個人的小額的消費金融業務。麥子金服對房產抵押借款引入大數據，但也有較多的限制，比如不做商住和廠房房產，只選擇像上海這樣房產價值穩定並處於上升階段的城市，而且還要結合實地考察抵押物狀況。但總體來說，利用大數據分析監測客戶信用風險，是未來信用風險管理一個不可阻擋的趨勢。

藉助大數據技術，信用風險控制方案逐步流程和標準化：

1）貸前環節

主要包括初審、一審和二審。初審主要是自動化識別欺詐，包括：准入門檻、身份驗證、基本要素驗證、資產及社會關係驗證。大數據技術使得在以上環節提高效率和批量處理成為可能，比如人臉識別、人像對比，能夠強力驗證客戶身份；在廣泛積累地址、學歷、銀行卡、手機號碼等數據的基礎上，驗證基本要素不再只是簡單地比對，而是能夠深層次帶出信息的查詢。一審通過自動化匹配政府機構、金融機構風險名單，聯網公安、法院數據核查。這種匹配是自動化，而且實時的，能夠有效遏制信用劇變風險，這點傳統的貸前方式難以做到。二審是評分卡評級。與金融機構的信用評分相比，評分卡更基於社交維度、信用歷史以及網路行為，相對數據更加全面，比如可以引用芝麻信用得分、摩拜信用分、易到或滴滴會員等級，而且這種維度是可以隨著交易、支付、社交方式的變化而更新的。形成授信額度後進行放款。

2）貸中環節

貸中監控對風險預警客戶自動打標籤，大大加強了客戶的信用風險監測。比如在客戶授權下綁定客戶的銀行卡信息，監測客戶的大額度資金收支；在還款日前幾日提前核對還款銀行卡餘額，提前監測逾期風險；甚至通過APP或者驗證方式歸集客戶所有的銀行卡信息並實時更新，在這些信息基礎上測算收入和還款之間的缺口，進行實時監控。

3）貸後環節

輔助進行失聯客戶客戶催收，藉助第三方機構失聯修復。大數據方式可以有效對失聯人進行失聯修復，還原其關聯人信息、時空信息，修復聯繫方式。同時可以藉助網路催收、熟人催收等方式（前段時間沸沸揚揚的裸貸之所以成為眾矢之的，就是因為它用了大數據的催收方式，影響力太大了）。

大數據風控系統，絕對不是一個簡單的管理系統，它上面一定會有廣告、有業務撮合模塊（比如不良資產撮合交易）、信息共享（黑灰名單）等。

4、操作風險高級計量法的應用

近兩年國內很多使用基本指標法和標準法的金融機構都在主動或被動的逐步學習運用高級計量法。高級計量法的核准要求更為嚴格，比如要求應具備至少5年觀測期的內部損失數據，數據應充分反映操作風險的實際情況等。要深化大數據在操作風險管理上的應用，主要還是積累數據。

高級計量法的實施，最大的痛點就是數據不全。內部損失數據（ILD）、外部損失數據（ELD）、情景分析（SA）、業務經營環境和內部控制要素（BEICF）四種數據，最關鍵的是內部損失數據的收集。在LDC資料庫建設上，除了做好數據收集，還要建立常規化的數據報送、核對、補充、更新機制，輔之以完善的數據輸入輸出體系。而對於自身資料庫建設緩慢，歷史積累不夠的一些金融機構，也可以採取購買的方式，例如韓國成立了一個專門的操作風險損失數據交換協會，業內也有專門的數據公司。再在數據基礎上，基於自身維度，通過蒙特卡洛模擬合併嚴重性分布和頻率分布，建模和建系統。

四、資管行業風險控制建議與展望

無論從金融行業還是從互聯網行業來看，大數據風控技術都越來越受到重視並得到廣泛的運用。由之也導致風險控制不再僅僅是一個部門的工作，不再是一項支持性的工作，而逐步衍生、獨立出來，成為一類群體，甚至一個行業，就像同盾慢慢從阿里巴巴脫離出來一樣。立足當前大數據發展趨勢，結合很多金融機構風險控制實操中的痛點，我認為在以下方面值得注意：

1.進一步完善更適應數據管理的大數據治理架構。目前大部門機構還沒有建立統一的數據治理架構，對數據的收集、管理、分析、運用還沒有歸集到一個部門去；在職能定位上，往往是被動地進行數據收集、整理，還沒有進行主動的數據管理、分析；在數據運用上，往往是較狹窄地相關性分析與使用，對非相關性數據缺少保護與開發。

2.夯實大數據風控基礎，建立一套適合自己的系統。首先相關機構要認真審慎分析自身大數據需求，切忌追風搞系統。在合理需求的基礎上，在系統建設上，有條件和物力、人力支持的應當進行自主開發，沒有條件的可以選擇購買或外包模式。

3.大數據人才觀糾偏。之前很多新金融機構招聘了大量的非金融行業的IT人士，事後往往發現技術牛得一塌糊塗，而實用性較差，這就是前期的需求分析和後期應用不到位。大數據人才歸根到底是金融人才，其次才是科技人才，傳統金融機構積累的大量的風控數據和持續的風控經驗，這些在大數據風控建設上能夠起到非常直接和至關重要的作用，尤其在風險分析、評估及決策環節。

4.不可盲目一味追求完全去人工的智能風控模式。當前一些互聯網企業也為金融機構提供了一站式的大數據風控解決方案，過分強調其智能型、完全去人工化。要知道，人工也是基於傳統的風控經驗，而這種經驗也正是歷史數據，摒棄這種數據，只會讓大數據風控高高在上，脫離實際。因此在實際操作中，很多金融機構風控模式上仍在沿用機器與人工交替式、更有分工的模式。