銀行智能風控「大腦」的設計與實施構想
銀行智能風控「大腦」的設計與實施構想
nnnn在《大數據與銀行數字化轉型》那篇文章中畫過一個框圖,大數據加持數字化轉型需要的系統框架包括後端敏捷核心、中間智能化和前端渠道三個組成部分。當時只是簡單構思,這裡從銀行風控角度進一步聊聊,嘗試深入一下加點料。
nn互聯網公司的「大腦」項目側重部分實現人類的智慧,最典型的包括提高機器對於圖像、視頻、音頻的識別能力,或者是下棋的AlphaGo和玩星際爭霸的AI機器人。金融是最喜歡擁抱高科技的傳統行業之一,在競爭激烈的環境下逐步應用AI技術顯然勢在必行,受這個過程影響的主要涉及兩種類型的工作。
nn
對於員工能短時間內做出決策的事情,在新型機器學習技術支持下的AI會做的更快更好,伴隨會有大量機械重複性的手工操作環節被機器替代。依然願意沿用增強智能(AI=Augmented Intelligence)而非人工智慧的概念,這時AI的意義在於幫助企業提高效率或節約成本。
nn對於員工無法輕易做出決策的事情,比如風控或反欺詐,這種情況下的AI就不那麼容易了。媒體和大V的觀點都很好,但對於大多數行業的參考意義不大。畢竟,直接走AlphaGo的路線不現實,成本投入已經是不可克服的困難了,更重要的還有人才缺乏的問題。如果甲方、乙方、第三方都不靠譜的條件下,能實現AI那是見鬼了。
nn基於上述背景,本文嘗試構建銀行智能風控「大腦」,給出初步的設計框架和實施構想。自然而然,從大數據視角切入,綜合機器學習、社交網路分析等技術構建智能「大腦」。提出看法源於工作中的思考,也會反饋輸出到實際項目中。子曰:學而時習之,不亦說乎。
nnnn銀行最重要的業務系統
nn
毋庸置疑,核心系統是銀行最重要的業務系統,『core』這個詞本身說明了很多問題。核心系統處理日常交易並對應更新帳戶等記錄信息,核心銀行系統通常具備存款、貸款和信貸處理能力,並提供連通總帳系統和報表工具的介面。交易範圍覆蓋各類業務,所以稱之為「核心」,或者說是銀行業務處理的「心臟」。當然,心臟用久了就可能出現問題,比如出現「三高」的情況,那就得考慮更新換代成「新核心」系統,這是目前銀行在競爭壓力下必須要做的工作。
nn聊到銀行的「心臟」,就自然會想到另外一個問題,銀行的「大腦」是什麼呢?傳統經營過程中,銀行主要靠利差吃飯,這時候只需要保證「心臟」正常運轉就可以穩穩的生存。若干年前當銀行不關心客戶體驗,不關心同業競爭的情況下,需要的只是墨守陳規和穩穩的經營,壓根也不需要聰明的「大腦」。現在的形勢發生了變化,「心臟」都需要向敏捷方向進化了,自然也需要構建「大腦」來保持內心的平衡。放到企業戰略里,這或許對應著輕型化和智能化的含義
nnnn前幾天數據產品項目過部門的架構評審,有同事問這個數據產品是什麼,與銀行產品是否有聯繫。時間所限,我當時簡單的回答是如果核心系統是心臟,那這個數據產品系統就是大腦了。當然是有點誇張了,但至少已經有了「大腦「的影子和雛形。領導的觀點謙虛一些,說這個叫數字化轉型過程中的「燈塔「。
nnnn務實的AI系統
nn一個務實的增強智能系統包括客戶畫像、數據挖掘模型和決策引擎三個組成部分。數據挖掘模型是智能化的核心,客戶畫像為建模過程持續提供特徵輸入,決策引擎將模型輸出成果轉換為實際業務行動。增強智能系統的一個重要目標是提升傳統業務流程的自動化水平,過程中的大數據能力主要體現在三個方面,也就是下圖中的三個組成部分:更好的客戶認知、更智能化的演算法、更快速的決策支持。
數據挖掘模型發揮動力引擎作用,吸收學術界和產業界先進機器學習知識成果並應用於銀行實踐。客戶畫像重點體現大數據背景下的客戶多維度刻畫,在靜態信息和交易行為信息之外可以補充社交網路維度特徵信息。伴隨大數據的持續採集、生產和交換,客戶畫像能夠進一步補充情緒屬性、價值觀屬性乃至道德屬性等信息,為數據挖掘建模提供源源不斷的能源輸入。決策引擎能夠面對業務場景進行快速響應,通過可視化等手段提供自助式業務分析能力,促進數據價值轉化為業務行動。
nnnn智能風控「大腦」框架設計
nn在上一版的框架圖上做了修改,圍繞大數據的應用層次進行設計。底層換成了數據源,包括數據倉庫、數據集市以及外部數據;數據包括結構化、非結構化兩種類型,都是中間智能化「大腦「的信息輸入。在數據源與智能化大腦之間,可以有類似數據湖的東東出現,支持上層應用做簡單的整合。
nn中間是增強型智能系統,也就是所謂的風控「大腦」。畫像標籤位於中心位置,對客戶的多維度、多層次刻畫直接影響到上層的風控應用。另外傳統的專家規則,均可進行轉化補充到畫像標籤體系中。通過數據挖掘過程,生成機器學習模型和社交網路模型,再通過數據產品打包後對外進行數據輸出。機器學習模型包括了對傳統風控信用評分模型的補充和優化,社交網路模型是最符合大數據思維和背景的實踐產物,二者均可以與畫像標籤進行轉換和交互。
nn
數據產品發揮決策引擎的作用,這裡輸出的不是業務規則,而是知識和智慧。知識的輸出有三種形式,實時數據介面和批量數據介面,以及嵌入式套餐型介面,從而滿足不同的前端業務系統需要。
nn社交網路分析是融合多學科理論和方法,為理解各種社交關係的形成、行為特點分析以及信息傳播的規律提供的一種可計算的分析方法。社交網路分析方法旨在建立一個網路與真實世界的實體與關係映射,在銀行應用中的典型實體包括客戶、賬戶、員工等。社交網路分析通常關注靜態和動態兩個層面的網路特徵,靜態特徵包括提取網路指標、對網路特徵刻畫、識別網路群組等;動態特徵主要包括描述網路如何隨時間推移進行擴散、如何影響其他節點等。社交網路在基礎屬性、行為屬性之上對客戶進行了深層次刻畫,並且能夠伴隨數據類型和應用手段的豐富而持續完善。
nn插播一條廣告,關於客戶畫像和數據產品的更多信息,可以分別參考《銀行客戶融合與數據資產變現》和《敏捷商業智能與數據驅動機制》兩篇文章。關注本公眾號,翻閱歷史文章進行查看。再插播一條預告,關於社交網路分析在反欺詐領域的應用,後續會有一篇更詳細的文章發出,該文實操性略強。
nnnn
實施規劃與特種小隊
nn對於已經具備一定基礎的企業,對標大數據分析成熟度2.0以上的狀態,可以分別在不同項目組實施智能風控「大腦」的組成部分。時機成熟,再進行體系化整合,起碼得先有新核心然後才能考慮這個嘛。
nn對於在大數據領域嘎嘎新的企業(建了hadoop不等於具備了大數據能力,有了數據分析挖掘應用才是標誌),需要做的也很簡單。Findna problem and solve it. 重點在於有靠譜的人員配置,也就是數據科學領域的特種小隊。先把隊伍拉起來,沒有困難就去發現和製造困難。
為了構造戰鬥力小組,涉及人員主要分為三類:第一類是業務建模人員,能力覆蓋傳統評分建模以及業務網路模型設計;第二類是數據科學人員,包括數據管理、網路計算、數據產品實現和新型演算法研究的能力;第三類是具備數據領域全棧綜合能力的隊長,兼具諮詢和研發的橫向縱向能力,發揮導演的作用,能夠在客觀基礎條件下把控交付進度和質量。
nn還是老的觀點,頂尖的數據科學家在大多數企業里是不需要的,隨便掛個title不等於真的是科學家了。銀行大數據應用需要的是有合理的人員搭配,每個隊員做自己擅長的工作,綜合起來實現數據科學家的能力。換個角度看,數據科學家其實並不存在,團隊的每個人又都是數據科學家。
nnnnPs:寫完了,雖然有點累,但發現還不用擔心靈感枯竭的問題。更多文章,請關注公眾號,歡迎交流。
推薦閱讀:
※【專知薈萃24】視頻描述生成(Video Captioning)知識資料全集(入門/進階/論文/綜述/代碼/專家,附查看)
※最強AlphaGo Zero出世, 自學成才無師自通, 柯潔: 人類太多餘了
※中國團隊再次稱雄AI大賽,微軟谷歌FB都甩在身後
※進擊的DuerOS,開發者的「新黃金時代」
※中國人工智慧技術蓬勃發展 | 張薩拉