大數據在銀行傳統信貸全流程中,有哪些關鍵作用?

本問題主要想了解在傳統信貸全流程中,大數據的價值和作用。

本題已經收錄知乎圓桌商業銀行職業進階之路,更多相關話題歡迎關注討論


大數據在銀行風控和其他業務中的應用這個話題比較好答,但我想多說一點兒。

我們都知道,傳統銀行業務有一套自己慣用的、相對行之有效的風控規則,簡言之就是通過收益和風險的分析來判斷是否有抵押物和利率水平之間的關係。在判斷風險水平時,需要一系列的數據,包括但不限於財務數據、經營數據、上下游數據、以及日常開銷、老闆個人的一系列數據,這些數據可能不夠大,但全都是圍繞相關企業的核心數據,都是有用的。

現在銀行能用得到的所謂大數據大都是用來營銷的,在貸款風控環節中能幫到的忙併不多,銀行特別是大行由於自身議價能力強,資質比較差的客戶都會要求強擔保,變相放鬆了資質審核。而資質比較好的客戶大都來源於銀行自身積累客戶的二次營銷,數據就從外部轉向內部了。在個人客戶領域,比較有用的是電信信息,也就是跟通話相關的信息(具體不多說了,不給騙貸者幫忙),這塊信息銀行可能會批量外包,但也很難談得上是大數據。

對銀行營銷有幫助的數據,也就是現在一些大數據公司搞的東西,簡單來說就是給客戶打標籤進行分類。為了打這個標籤,就需要有用戶的上網行為,比如你平時都開哪些App、瀏覽哪些網站、在*博都關注了哪些人,發了哪些內容,將這些行為與標籤進行關聯。大數據公司拿著這些帶標籤的用戶數據,去跟銀行的用戶數據進行匹配,對能打上標籤的人進行二次營銷。所以,你在網路上的一舉一動都為你的用戶畫像填上一筆,區別是,有節操的公司只把用戶畫像內部使用,沒節操的公司還會把用戶畫像賣到外面供其他人營銷。

所有這些網路標籤和用戶畫像,只有跟你這個真實的個人聯繫上才有用,不然只是互聯網億萬初始頭像中的一個,毫無價值。跟個人聯繫上的途徑無外兩個,一是實名認證,一是手機號碼,在使用相關網站時綁定這兩者的信息一定要謹慎。據我所知,目前用戶量較大的知名網站中,只有*博在大規模的賣用戶數據。如果說網站和App還可以防範一下的話,那通過通信運營商流出來的數據就真的無能為力了。通信運營商會記錄你所有的瀏覽記錄,包括打開了哪些網頁、哪些App、使用了多少時間等用戶習慣數據,歸類打標籤,賣到外面。大數據公司買了通信運營商數據之後,會把這些標籤和用戶匹配起來,進行精準營銷。如果你經常在手機上查一些男科醫院,然後莫名收到男科醫院的營銷簡訊,請不要奇怪。萬幸的是,某兩家通信運營商並沒有在總部層面加入販賣數據的行列中,原因是嫌麻煩看不上這點利潤,部分分公司自行開展,所以一些省份的用戶數據暫時是安全的。但僅僅一家就賣出了20%左右用戶的數據,想想也是難過。

技術無罪,但採用技術的人是不是有罪呢。我們談到大數據的時候,都知道把海量的數據科學應用是人類進步的一個重要台階。但在數據應用這個產業鏈上,從數據收集階段開始就存在的一些非法的、擦邊球的、沒有對用戶進行充分告知的收集手段,輔以以營銷為目的的大數據公司(營銷最容易變現),加上為這些大數據付錢的產業,形成了一個互相鼓勵、狼狽為奸的閉環,最終導致我們在不知情的情況下泄露大量的敏感信息。


這個問題問得有意思,但是問得又太模糊,要拆成兩方面來回答。

你問的信貸全流程,是對公還是零售?這兩者差異很大,要是想回答清楚了可以寫一本書了。我就基於我的工作經歷,簡單嘮叨幾句,給這個問題補充一些實際項目的感受和經驗供參考。

#先說零售業務(這裡只談大數據和信貸流程,不談銀行如何利用大數據做精準營銷):

其實我之前在這篇回答中已經解釋過銀行在零售方面遇到的挑戰了:傳統金融行業如何應對互聯網金融帶來的挑戰? - 錢糧衚衕的回答 - 知乎

由於零售信貸一般同質性比較高(我們通常稱之為homogeneous portfolio),所以銀行都是以組合的角度(portfolio)來制定信貸決策方法並管理的。換句話的意思就是,零售業務天生適合基於大數據做分析和決策。這方面國內我不清楚(歡迎補充),國外很多銀行是基於大數據做的決策系統,比如我們行,給這個模型起的名字叫"決策引擎" (decision engine)。引用年報里的一段話來描述這個引擎:

大意就是零售業務普遍採用"決策引擎"來自動化判斷個人或小微企業的信用分數並做出信貸決策,考慮的方面主要包括:

  1. 客戶可以量化的數據:財務情況等
  2. 客戶行為數據:比如客戶什麼時候登陸的網上銀行,客戶的反饋與投訴,交易頻率等
  3. 個人徵信數據:德國這邊用的SCHUFA
  4. 一般客戶數據:最開始從客戶那兒收集到的個人信息

說句題外話,大數據的重點我覺得不是誰擁有一堆大數據,這並不是當下火熱的互聯網金融的專利,很多傳統行業多少年來每天都是靠大數據吃飯,比如石油行業(鑽井平台的地球物理類測量數據或天氣數據)以及金融行業(每秒幾百萬條交易數據)。同時,就像我之前那個答案里說到的,很多時候不是銀行不知道怎麼使用這些數據,關鍵問題在於,比如歐洲,銀行對於客戶數據的收集與使用是有著高度監管的,而這方面互聯網公司目前享受著相當輕鬆的環境其他幾個阻礙因素可以參見原答案

#對公業務方面:

與零售對比,對公業務是銀行相對不好利用大數據來優化革新信貸流程的,目前大部分的項目還處於實驗階段。當然,具體問題也要具體分析。有些對公業務天生不屬於數據敏感型,所以目前還不知道如何比較有效的利用;然而有些對公業務是適合大數據的,比如交易類銀行業務(transaction banking),包括集團現金管理(cash management)結合貿易融資等 - 都屬於高量低額度的業務。除此之外,信貸流程里關鍵的一環:企業信用評級 - 目前我所知道的這類項目還都處於實驗性階段,比如我之前另一個回答里提供的我親身參與的項目:大數據技術在金融行業有哪些應用前景? - 錢糧衚衕的回答 - 知乎。主要方法就是基於企業的財務與非財務數據,通過機器學習培訓模型,最終給與信用評分。基本流程和方法如下圖所示(具體模型和演算法可以參見之前的答案):

就我所知,已經有一些大行以及學者在研究類似項目,但多少都處於實驗階段。如之前的答案所展示的,我們通過這個方法得到的結果與人工結果相對比,還不錯,但是遠沒達到完全可以依賴機器的程度(如下圖,其中base深藍色是實際應該得到的結果,即企業評級分布,淺藍色是不同模型得到的預測結果)。

!!最最重要的放在最後說,正如之前提到的,這方面的創新,如果真的要應用到銀行實際業務中,需要監管的批複 - 所以說,這麼一看,這條路還很長很遠。


銀行信貸業務中所有的崗位、流程和制度設計都是圍繞著一個主題:如何把貸款安全的收回來。展開來說,就是銀行通過這套流程來判斷這個客戶在可預見的將來有沒有還款的能力。

如何來判斷某個人或者某個機構有還款的能力,這個問題並不只是在銀行業出現之後才有的,自人類社會出現分工併產生剩餘價值以來,借貸行為就出現了。「借貸」行為並不是簡單的貨幣行為的借貸,借錢還錢只是最普遍的現象;借錢還糧食、借糧食還糧食等都屬於借貸行為,在一段「借貸關係」中債務人只要能夠最終拿出讓債權人滿意的「條件」就可以結清債務,這個「條件」可以是錢、可以是物甚至可以是人本身。比如「白毛女」的故事中,楊白勞就是欠了黃世仁的錢,最終拿喜兒抵了債。借貸行為並不只是存在個人和企業之中,國家也需要「借錢」。建國伊始蘇聯曾給中國大量經濟和技術上的援助,中蘇關係惡化以後,蘇聯把這種援助變成的「有償」的借貸關係並要求中國「還債」,在外匯非常緊缺的背景下,我們只能用農產品、輕工業品抵債。

如何準確判斷一個「人」未來有能力「還債」是一個始終困擾人類的問題,隨著社會組織形式的日漸複雜,尤其是在「公司」這個概念出現之後,判斷還款能力的問題就變得更加複雜。根據福布斯的統計,世界500強的平均壽命是35年,世界1000強的平均壽命是40年。大企業的壽命尚且如此,小企業則更短。在中國,超過99%的小企業會在3年內死掉,在中國創新最活躍的中關村,一家企業的壽命平均只有0,97年。假設中關村的一家企業問銀行借款,一般銀行的貸款都是一年期,在貸款還沒有到期的時候這家企業已經死掉了。大家要知道現在的公司是「有限責任」的,一家公司破產清算時只以其最後剩餘的財產對債權人負責,在沒有其他還款來源的情況下,銀行只能認賠。

因此,為了儘可能去了解某個企業的還款能力,銀行需要耗費大量的資源去「了解這個企業」(搜集報表、實地考察、層層審批、貸後檢查);此外還需要儘可能去尋找第二或者第三還款來源來預防風險(抵押物、擔保方、企業實際控制人簽署無限連帶責任擔保)哪怕在5年以前,大部分商業銀行對小額貸款的門檻是500萬元,其原因是如果低於這個數字,使用銀行這套複雜、繁瑣的風控手段,這筆貸款是要賠錢的。

近幾年,銀行開始借力「大數據」來作為風險控制的依據,其本質還是一種「了解你的客戶是否有還款能力」的手段,銀行希望通過「大數據」降低「了解你的客戶」這個過程所需要的成本同時提升判斷的準確度。以企業的納稅數據、銀行賬戶結算量等數據為基礎的貸款產品也確實降低了銀行貸款的准入「門檻」,幾十萬元甚至幾萬元的貸款也成為了可能,解決了一部分小企業的「融資難」問題。

目前,銀行對「大數據」的應用情況還停留在非常初級的階段,只解決了「數據真實性」的問題。一直以來,銀行對風險的定價依賴於財務報表,但是因為大部分企業的報表,尤其是中小企業的報表「真實性」很低,所以我們只能依託真實程度更高的納稅信息和銀行賬戶流水作為主要的風險定價依據。舉個極端的例子,如果所有的企業都「不做假賬」,其實現階段銀行的大數據產品是沒有存在的必要性的。

真正有能體現「大數據」價值的銀行服務應該是目前以阿里的網商銀行和騰訊的微眾銀行為代表的互聯網銀行正在實踐的信貸模式,利用實時、動態、多維度、不斷積累和更新的數據去對風險進行定價。以阿里為代表的互聯網巨頭掌握了個人或者企業大量的交易數據(電商買賣、信用卡還款、話費充值),同時鼓勵客戶不斷的導入外部數據(比如芝麻信用就鼓勵客戶添加擁有的車輛信息),利用這些數據來判斷客戶的還款能力,並且因為數據是不斷實時更新的,風控模型也在不斷進行自我升級和修正來提升判斷的準確度。基於實時動態的「大數據」的風控模型能夠為每個客戶完成風險定價(傳統銀行的方式是將客戶進行分類,然後對每一類客戶進行定價),未來你下一分鐘能拿到的利率和上一分鐘就可能會不一樣(比如你剛好被發現闖了一個紅燈導致借款利率上升)。互聯網巨頭們這種「獲取數據」的能力也是銀行所垂涎的,這點從各大銀行紛紛推出自己的電商平台(工行融e購、建行善融商務)的支付產品(建行龍支付、招商一網通)就可以看出。

說一句更遠的話,現在的大數據模型還是一種「中心化」的定價方式,大家願意把數據交給阿里基於對阿里這個「中心」的信任,這種信任的成本還是很高的,比如一個美國的客戶就沒法通過阿里借到錢,因為阿里沒有這個客戶的數據。構建一個全球的區塊鏈或許是一種解決思路,尤其當「區塊鏈+物聯網」就可以解決「信任」的問題。

設想一個場景,一名中國人將自己家的房子註冊到這個全球的區塊鏈上並且這個房子安裝的是使用了物聯網技術的智能門鎖。隨後,這名中國人來到美國創業,需要一筆錢,他可以把中國的房子抵押給美國的銀行(區塊鏈證明了房子的權屬清晰),區塊鏈對這筆交易進行登記併產生一個智能合約。一旦他還不出錢,智能合約會將房子的所有權劃給美國的這家銀行同時修改門鎖中的密鑰信息,哪怕他逃回中國也進不了家門了。

這一幕可能並不遠了。


大數據在銀行傳統信貸流程中的發力點主要是信貸風險防控。

銀監會今年1月公布的數據顯示,截至2016年12月末,商業銀行不良貸款率為1.81%,創下近7年最高水平。此前的官方數據顯示,截止2016年第三季度末,商業銀行不良貸款餘額為14939億元。這一數據是5年前的3.5倍。14939億元是什麼概念,大概等於6.5個萬達集團的市值。

可見,信貸風險防控之路任重道遠。如何加強對信貸業務,尤其是企業信貸業務的徵信評估和風險預警成為商業銀行面臨的重要挑戰。

從實踐來看,銀行信貸全流程風險管理包括五個核心環節——貸款准入管理、抵質押品管理、授信執行管理、貸款資金管理、到期收回管理。這些環節覆蓋貸前、貸中、貸後,構成信貸風險管理流程的完整鏈條。其中任何一個環節管理不到位,都可能導致整個信貸風險控制鏈的失效。

如果有一種系統,能夠幫助做好銀行貸前信息管理,基於客戶的基本息進行授信評分,形成客戶貸前認定,作為貸款的依據;貸中進行有效監控,構建客戶關聯關係全景視圖;完善貸後管控,形成客戶貸後綜合風險評估模型,從而打造涵蓋整個貸款流程的閉環,信貸風險將大大降低。而上述系統就可以通過大數據實現。

大數據風控與傳統風控的主要不同之處是對數據的採集方式以及基礎數據的類型。

這裡,我們可以把基於大數據建立的信貸風險評估體系比作一個福爾摩斯般的「神探」,通過大數據進行「獨家偵查」,創建新型信用風險全景描述的體系框架,深度梳理分析與客戶相關的各種內部數據和外部數據。

在此基礎上,銀行就可以從多個維度了解授信客戶的信用狀況和經營情況,同時建立基於大數據的信貸風險預警應用,通過多維度內外部信息耦合與行內預警觸發規則的精確匹配,及時推送風險預警信號,在貸前准入和審批階段提供客戶風險提示,解決經營單位在風險識別能力上的問題。

根據大數據建立的信貸系統還能不斷積累和更新的數據,實時地對風險進行評分,更好地識別客戶關聯關係,建立風險傳導預警,降低信貸風險。基於目前國內還處於大數據發展的早期階段,所以現階段利用大數據做風控更多展現的是輔助作用。

下面以東方國信的風險管控體系產品為例簡單講解大數據在信貸流程中將如何發揮價值。

1、客戶網路關係與風險預警分析

大數據構建的客戶網路關係示意圖

  • 深度分析、梳理與客戶相關的各種內部數據和外部數據(銀監會、人行徵信、工商、稅務、海關、公檢法、環保、衛生等信息)特徵,構建全面準確的客戶關聯關係。
  • 有效整合不同來源客戶數據和關聯維度分類體系,構建客戶不同網路關聯關係全景視圖。
  • 通過數據挖掘技術構建風險評分模型,對客戶進行全面風險評估。
  • 通過風險評分和風險因子及時識別、分析、衡量客戶和資產的信用風險狀況或潛在風險,及時採取適當的措施,對信用風險進行彙報、防範、控制和化解。

2、大數據審計平台

現場審計示意圖

非現場審計示意圖

  • 著眼於總體數據開展審計,審計項目更具綜合性、時效性、系統性。
  • 以智能化的技術從混雜數據中發掘潛在相關關係,查找問題線索,使審計項目更具延展性、縱深性。
  • 藉助大數據的技術優勢,可以實現動態的全過程審計,真正實現以風險為導向、以控制為主線、以增值為目的、以治理為目標的現代審計模式。

隨著移動互聯網、雲計算、物聯網和社交網路的廣泛應用,人類社會已經邁入一個全新的「大數據」信息化時代。而銀行信貸的未來,也離不開大數據。大數據海量化、多樣化、傳輸快速化和價值化等特徵,將給商業銀行市場競爭帶來全新的挑戰和機遇。


長篇大論寫政治論文的內容就略過了。

重點關注與信貸審核方面的影響。

按照大數據理論,如果將其作為傳統信貸審核方法的補充,那麼對於大數據方法本身來說,無疑是大材小用了。大數據的作用在於打破常規的審批思維,重新解構風險審核的衡量體系。

如前回復所述,以芝麻信用為例,當發生電商交易,信用卡還款;亦或是導入領英賬號信息,錄入車輛信息,導入住房公積金信息。以上種種行為體現在信用分上,都會以提高芝麻信用分的形式體現出來。也即,在芝麻信用的體系中,將以上行為定義為好的,正面的行為。那麼問題就在於,此類行為的好與壞,是由何種標準定義的,是否能經過檢驗。

當然,以人們常規的認識,上述行為必然是好的行為。但,是否不符合以上行為的人群,其違約風險一定會高?按照以上的標準將人群進行區分,違約率是否會有顯著差異?其差異是否達到了統計學顯著的標準,從而可以作為結論使用?

大數據提供了檢驗的方法,在其背後的所涵蓋的統計學,計量經濟學,以至於神經網路中,有大量的知識和技能用於驗證上述定義是否有其科學依據。

如果——不幸的——上述行為只是基於一般認識所得出來的結論,不加驗證的將其納入到大數據的信用評分體系中,那麼最終得到的結果,對於大數據來說是可悲的。因為在這一方法論下,大數據只是作為約定俗稱的慣常思維的眼神,只是相當于海量的信貸專家坐在一起進行討論。

我所希望的大數據,應該要像AlphaGo學習圍棋一樣,不管定式,不管手筋。從勝率的角度去評價每一個點位落子的價值,最終找出能夠走向勝利的最優下法。應用在信貸審核中,就是拋掉所有約定俗成的見解,去重新尋找經過大數據驗證的信用風險影響因素,並以此為基礎,重新建立信用風險審核的新體系。


你是要寫報告么?問這種沒實際意義的問題。目前來講,所謂的大數據對傳統銀行來說只有一點輔助作用,而為了獲得這些數據(放低要求,都不說真實數據)銀行要花費大量的成本和時間(建立平台),還99%最後失敗。我想說的是在現有體制下,沒有哪個領導會去做這種沒政績的事,目前推出的平台只是來忽悠外人,做樣子、搞亮點給上面看擺了。或者那個做辦公室出身的領導一拍腦袋做大數據,與時代接規,然並卵。別看一個個說得頭頭是道,眼花繚亂,往往不具實際意義,撥開煙霧,實用的東西往往很簡單。麻煩去基層好好煅練。


得,演講了無數次的東西的結果就是真的多寫一遍自己都提不起興趣敲鍵盤,但是想了想在b乎從來沒發過一篇真正專業相關的回答,大部分都是抖機靈感覺也挺不好意思的,所以還是強答一波吧。

從作用角度來說層次非常多,問題問的非常寬泛。如果從步驟來說大的範疇包含了三個部分:貸前、貸中、貸後。如果從板塊來說包含了客戶營銷、客戶管理、賬戶監控、貸款餘額及利息的計算系統、風控模型等等等等。由於數據源的差異性,所以每個數據源在整個信貸流程中發揮的作用其實有很大不同,再結合數據來源的合法性,每個步驟對應的授權和數據挖掘以及對客戶畫像的精確度也會有極大的差異。就目前商業銀行導入的數據源,市面上比較寬泛的劃分成如下幾類:司法、水電、pos流水、銀聯信息、運營商信息、海關信息、稅務信息、社保、公積金、其他借貸債務關係、人行徵信、飛行信息、網站的cookie等等等不計其數,調用方式也五花八門,有的是可以API直接調用的、有的是直接買一個數據包回來慢慢玩的。

首先按流程我們先從貸前,也就是所謂的客戶篩選及客戶營銷來說,一般在這個環節,銀行會通過原有的行內數據進行第一波的客戶轉化,通過對行內自有的數據分析進行新的貸款產品的准入篩選然後通過各種途徑去將信息送達至篩選後的客戶,其次會利用各種網羅來的非授權數據(有些不靠譜的銀行也會私下使用黑產數據)來對還未成為本行客戶的企業進行廣泛的篩選,通過向全量客戶的數據進行分析從中挑選出符合自己標準的客戶群體及具體名單,然後再進行營銷。

營銷回來以後自然就是貸中審核了,到這個環節就會讓客戶進行一些強授權了,用於合法的收集更多的數據,本人公司已經幫30多家銀行的總行搭建了類似的系統並且提供數據源支持,目前中國第一款純線上無需擔保抵押的機器自動化審批企業貸款--江蘇銀行的稅e融就是我們和江蘇銀行共同開發的,通過多維度的數據來源和種類,來對客戶進行還款意願及經營能力的雙重分析。在還款意願層面主要是通過的通訊信息及人行信息來進行反欺詐,再通過司法數據來看相關訴訟,最後在通過稅務信息及pos等經營相關信息來鑒別企業的經營能力等,在這個環節數據不光要求維度和來源多(可以相互對比校驗)還需要跨度長,一般來說都需要最少兩年的連續數據進行分析,來觀察企業的穩定性。當然這一系列的數據授權都需要在線上進行完成,那麼通過大數據來進行非面簽線上授權用於核定借款客戶本人身份也成為了必不可少的應用範圍之一,這個通過biotech(最具代表性的就是指紋和人臉識別)等就ok。通過這樣的方式應該說可以很大程度替代原有的IPC貸款模式,通過數據化的方式大大降低人工審批成本,基本上銀行搭建的系統放數據貸款平均時間都不會超過15秒,從審批到核額到發放。

在貸款發放以後,如何動態監控企業的持續性經營風險也成為了現在尤其是小微類貸款的難點。由於人行要求銀行對企業發放的貸款必須以不低於半年一次的最低貸後檢查頻率,所以以往銀行不得不採用人工的方式進行上門核查,這樣未來如果一旦出現了風險,合規動作有做就可以減少自身的責任,但是這樣就造成了一個問題,目前中國銀行在貸企業數量是550萬戶,如果讓客戶經理一家家自己人力做貸後監控將成為極大的成本(深圳某國有銀行一戶成本是一次上門160元,這還是兩年前的價格),有些銀行會採取外包的模式,但是外包的公司人員也極不靠譜,有的甚至會自己和企業勾結,所以上述原因也會阻礙新業務的發展,都把時間拿去檢查老客戶了新客戶咋辦?所以這也造成了中國的銀行「嫌貧愛富」的情況,不是不想為,而是客觀難為,通過數據監控的最大好處就是只要設好風險預警的閾值,一旦客戶的數據發生異動,系統則會自動預警,屆時再由人工介入,但是這樣會對銀行的系統穩定性及數據源的質量還有連續性有極高的要求,所以現在還是大銀行可以通過業務多來降低邊際成本。目前就我們監控的2000多億的存量貸款餘額來說,壞賬對比起以前有了顯著的下降。東西很多,寫這麼多,看贊詳細補充吧。


謝邀,

先來看你的問題:大數據在銀行傳統信貸全流程中,有哪些關鍵作用?

看到那麼多深入淺出的答案,我只想問,你們真的知道銀行傳統信貸的流程嗎?

我不是科班出身,僅以我所知的一點銀行傳統信貸知識和大數據的了解來看,一點用的沒有,更別說關鍵作用了。

為什麼?

傳統銀行信貸很直接明了,貸款對象以企業為主,放貸之前都會進行多次實地考察,說直白點,都是靠人力來做,而非計算機,那與大數據何干?

而就我了解的大數據企業來看,能夠為銀行提供風控的很少很少。而僅有的幾個公司為銀行提供風控支持的,大多也都不是傳統的信貸業務,而是銀行的toC信貸業務,而且據我所知,不管是貸後還是貸前風控,目前效果並不顯著。


1. 國內的銀行業務不是很了解。

2. 大數據是個很模糊的定義,在這就理解為除傳統信貸業務收集的客戶數據外的數據來源。

3. 信貸業務也有個人信貸和企業信貸,兩個差別很大。

簡單說一下我所了解大數據(數據科學)在美國銀行企業信貸業務的情況。

利益相關:紐約一家做網上信貸的fintech的數據狗

美國有一套非常成熟完善的個人信用體系,對銀行來說,他們最先獲得的信息就是社會安全號 + 個人信用分數,從一個人的財務狀況,報稅記錄,貸款到犯罪記錄都可以通過這兩個信息一鍵獲得。所以如果申請個人貸款,尤其是在你有一定存款或工資綁定的銀行申請,是非常方便的。

但企業信貸就是另外一回事, 個人信用分數高不代表企業信用分數高,個人報稅記錄也不等同於企業報稅記錄,所以銀行在審核申請時,還會要求很多額外的證明,甚至會派專員實地考察加預約面試。 這樣數次來回,加上資本主義的工作效率,十天半個月能批下來已經算是很快的了。另外一個弊端是銀行提供的通常是大額長期低息產品,對風險控制非常嚴格,這就要求申請人不僅要有抵押資產,擔保人,還要有證明這個企業是非常穩定且運營良好的,一般就是五年以上,年盈利百萬以上。這其實是一個非常高的門檻,尤其對很多家庭經營一個小餐館或者修車店的申請人,很有可能折騰了一個月後申請還被拒了。

所以就出現了這麼一個市場,小額企業貸款,費人工,利潤小,風險大,大的商業銀行不稀罕去做。我所在的公司就是通過和大銀行合作和自己的網上申請平台獲得這些客戶群體。

公司宣傳口號是,「厭倦了繁冗的紙面工作和漫長的等待了? 三分鐘完成一份申請,48小時資金到賬!」

這個高效率的背後其實是各種模型的支持。鋪墊了這麼多背景,想表達的一個觀點是,數據科學在信貸行業並不只是個噱頭。

我理解的數據科學應用在信貸行業以下的幾個環節:

1. 信用評級

建立企業信用分數模型,類似於個人信用分,再加入企業年份,行業類型,運營模式,營業額,所在地區經濟指標等等。

2. 自動決策

公司一部分申請沒有人工干預,是直接被通過或拒掉。

3. 定價

這裡的定價有三個方面,一是利率 (factor rate), 二是時長(term),三是還款頻率 (repayment frequency )。

高風險可以靠短期高利息抵消,老客戶會要求給個折扣。 一個貸款申請從通過到客戶接受offer還要經過一番討價還價,這是不小的人工成本。完善的定價模型對規範underwritting的流程和公司的統一管理是很重要的。

4. 壞賬預測

這部分比較有意思了,大數據是騙投資的噱頭的惡名很大程度上是從這部分來的。

我自己就做了一些這方面的工作,公司在這上投入不少,深度學習都搞出來了,有一部分原因是在和銀行,投資人開會時講起來顯得比較高洋上,(這就是噱頭啊呵呵)。但它本身還是很有價值的。我們做的壞賬預測有兩部分,

第一部分: 申請階段預測,現在的模型表現嘛,可以說是非常差。原因大概是數據量有限,樣本太分散,數據以外很多信息捕捉不到,天災人禍不可預測。但是模型預測出來有很高概率會壞賬的申請,尤其是和underwriter(專業名稱應該是??)意見相左時,還是很有深入討論的價值的。模型已經上線,還在測試階段,看看未來效果會不會慢慢變好吧。

第二部分: 還款階段預測,我們量化了一些指標,方便及時進行人工干預。

我們公司用的「大數據」有自己網站的用戶行為數據,谷歌街景,企業內部外部照片等等。

我也看了一些回答,總結一下:

1. 除了銀行本身政策,現在美國的商業銀行有縮減企業信貸業務的趨勢,這時候更沒有什麼道理花錢搞什麼技術革新,應該會更傾向於直接外包給我們這種小公司。

2. 用戶畫像是大數據在互聯網行業很火的應用,我們會用這些數據做運營分析和市場分析。信貸部分更追求數據來源權威可靠。

3. 大數據不能完全取代underwriter的地位,但讓一個人做以前十個人的工作是沒問題的。

4. 信息真實透明還是要靠政策,大數據不是萬能的。


相比以往的數據應用環境,大數據提供了更多的數據源、更寬泛的數據範圍和更大的數據量,有助於識別和緩釋狹義信貸業務流程中可能發生的信用風險。本文從傳統信貸流程著手,分析大數據輔助和優化流程的發力點。

下圖顯示了一個常規的信貸流程。

與過去相比,使用大數據後,確實有些信貸流程相關領域是之前無法做到的。大數據並沒有對信貸業務產生本質上的飛躍,只有有了一定程度的提升。這些提升可能包括:

1.經濟數據可以提高信貸政策的及時性和準確性

信貸政策是銀行根據國家宏觀經濟政策、產業政策、區域經濟發展政策和投資政策,並銜接財政政策、利用外資政策等制定的指導我行及所屬機構貸款投向的政策。它會從資本總量、產品投向、業務投向、行業投向、風險管理指導等多個方面,對本行新財年信貸工作提出完整的指導意見。

制定信貸政策的主要數據依據中包括宏觀經濟政策、國家產業政策、區域經濟發展現狀等大量的外部宏觀經濟數據,尤其是「區域經濟發展現狀」這一數據,對制定區域信貸政策有著很大的幫助作用,也直接影響著信貸政策是否能夠落實。

這些數據都存放在銀行之外的政府部門中,不在銀行範圍內,因此它們屬於大數據範圍。更快地獲取這些經濟數據,不但可以幫助銀行更及時地調整信貸政策,還能更精確地計量風險資本和本地化信貸產品。

2.行為數據有助於建立全景客戶視圖和客戶標籤,強化貸前客戶評價

即使不涉及與行為數據密切相關的消費信貸類產品,客戶的行為數據也有助於建立全景信貸客戶視圖及其客戶標籤。從既往經驗上看,很多企業主尤其是中小企業主的家庭成員,也是債務實際承擔者和抵質押品的實際所有者。

實踐中,債務人的還款意願和還款能力都需要結合家庭成員的消費習慣、資產狀況才能完整的描述全景客戶視圖和客戶標籤。這時,大數據的價值就很明顯了。客戶全景視圖和客戶標籤及其貸前客戶評價的文章數量之多,可謂汗牛充棟,這裡暫不累述。

下圖顯示了一種客戶標籤觀點。

3.明晰抵押品權利,保障貸款有效擔保價值

以房地產抵押品為例。房地產抵押是不轉移佔有的特定交易方式,它是一種將來時的可能轉讓行為,房地產的權利是以登記為前提,通過讓渡來實現的。事實上,房地產並不是所有的權利都能登記的,比如集體土地的抵押狀態等,而抵押品價值評估沒有理由把這些尚不能登記的、客觀的權利價格不評估進去。也就是說在抵押房地產中,由於其形態各異、權利交錯,信息存在著嚴重的不對稱。

無論估價行業還是銀行業,加強抵押房地產的合法性審核,這是有效保障貸款抵押品有效擔保重要途徑。估價技術規範規定,估價對象的權益狀況必須有合法的憑證,才能出具估價報告。但實際估價執業中,遇到估價對象權利上的瑕疵還是比較多的。如:集體土地上房地產抵押;在建工程抵押中對產權人改變、用途改變等在審核時往往不注意與法律政策規定的一致性問題;有的變著法子鑽空子,出具「諮詢報告」來抵押;有的無房地產估價資質的機構或未經註冊或註冊逾期的估價師做房地產抵押報告,或未經土地執業註冊的機構或未經執業登記註冊的土地估價師做土地使用權抵押估價報告等。

房地產登記信息的公開性和登記內容的可信賴性,為交易當事人提供了方便,減少了交易成本,保證了交易能夠較快完成。而公開的房地產登記信息及其發生的各種變化,正是大數據的收集範圍,而證明房地產等級內容的真實性,評估人資質是否過期等也正是大數據的特長所在。

4.智能化檔案影像處理技術有助於更快地應對風險管理的要求

信貸檔案是指銀行在辦理信貸業務過程中(包括貸前、貸時和貸後各流程),收集、整理、填寫的具有法律意義或查考價值的資料,包括各種合同、文件、賬表、函電、記錄、圖表、聲像、磁碟等。它是銀行在對各類企業或個人客戶授信活動中形成的,反映信貸業務工作情況並具有保存價值的文件資料的總稱,是銀行與企業(個人)雙(多)方債權、債務關係的原始憑證及銀行依法催收的重要法律依據。

在信貸工廠模式下,信貸檔案均以影像資料的方式進行存儲,顯然,信貸檔案天然是非結構化數據。對影像形態存儲的信貸檔案,其檢索、存儲、管理、審核、監管等都可借鑒大數據中非結構化數據的相關技術。

5.幫助銀行在不良處置過程中發現更多的失聯債務人

不良貸款處置時,追索不良貸款最困難的事情是債務人失聯。債務人通過更換聯繫方式、搬離住所、前往外地等多種方式與銀行失聯,以逃避債務。按百融的數據統計,據百融統計,70%-80%的不良資產是因為債務人失聯導致,失聯找回是整個行業近20年都無法解決的大難題。

但是在大數據環境下,這個問題有了更好的解決途徑。由於身份證、護照等身份ID具有強唯一性,與之相關的手機號、戶口地址、居住歷史、出行記錄等都可能成為查找債務人的線索,影像記錄等更加大了發現債務人的可能性。因此,大數據在追蹤和獲取失聯債務人聯繫方式領域,有著重要的幫助作用。

6.更快地發現貸後風險預警信息

基於過去的經驗,銀行積累了大量的貸後風險預警指標。比如借款人對下屬、附屬、關聯公司有(其他)應收賬款;銷售額下降;銷售量上升,利潤率下降;銷售增長過快,令人生疑;毛利與凈利潤之間的差距加大;成本提高,收益減少;相對於銷售而言,財務費用、管理費用增長過快;相對於銷售額及銷售利潤而言,總資產增長過快;經營虧損,呆賬增加等。

在實際工作中,獲取這些風險指標主要靠銀行業務人員的主動觀察和人為判斷,其指標指導作用無法完全發揮出來。比如「主要管理人或其親屬有移民傾向」這個指標,借款人即使發生此類行為,銀行業務人員很難發現,這個指標根本無法發揮警示作用。顯然,在大數據環境下獲取這個指標值就容易得多。

除了以上提到的六種提升,大數據在傳統信貸領域的應用還包括:貸後處置方式更加多樣化、五級分類更科學、更有優勢的貸款定價、更個性化的貸款組合等多種提升領域,受篇幅限制,本文就不一一闡述了。


曾經有幸參加過整體的信貸流程大數據建設工作,不是主力,而是每個環節都幫過忙,另說明,不是銀行業從業人員,屬於數據分析從業人員。

首先對個人信貸這一塊,分幾個環節,雖然行業內的流程大致一樣,但是數據流向的跳轉節點還是有一點區別的,所以只能說大環節,簡單說。

1.貸前反欺詐

這是基於大量數據下的純黑名單匹配,拼的主要是數據量的記錄和數據寬度的挖掘。實現第一步的降低欺詐風險。這裡的欺詐可能有區別與銀行認為的欺詐,通過建設過程中業務學習,個人感覺銀行認定的欺詐可能更多依靠客戶發生逾期時間來認定的,即假設客戶本身不是黑名單,沒有劣跡,但是發生天災人禍了,導致過早的發生逾期,也算欺詐。而貸前反欺詐認定的是由劣跡的人,哪怕這個人沒有劣跡,這一次貸款是用的虛假材料,也是檢測不出來的。主要的手段並非技術手段,而是通過談生意來促成的。因為數據服務類公司不產生數據,不談生意就是什麼也拿不到。通過不斷地合作或者購買數據(包括官方或者市場數據)來達到數據量的積累。數據寬度的挖掘,說白了就是把這個人的畫像做的更加清楚。現在漫天招聘炒的很火,最終的發展目的是在貸前就能夠把一個人定義出基礎分來,當然目前遠遠達不到。

2.信用評分

這是主流的數據審批手段,叫法多樣。可能外行人人為目的是實現精準審批,降低失誤和錯誤的發生,但是實際現階段只能達到削減人力成本的作用(這還是得落地情況好)。國內大多數互聯網金融企業內部牽頭高信用評分的人一般都把項目當做政績工程,而不是促進業務項目,因為作為他們眼中的行外人,數據服務類公司的決策規則建議是垃圾,但是自己本身卻連個具體應用規則的大概都不知道。一般來說數據服務類公司都是依照其自身的規則來建設一套模型,所以本身爛的話一點辦法也沒有。我們不會根據實際數據表現來刻畫理論的標準,因為「外行人」嘛。

另外因為本身上數據分析就是利用歷史的數據對未來進行預測,但是對於個體客戶而言,每個客戶都是不一樣的,所以本身的偏差一定存在。當前,至少我們的偏差不小,完全起不到上述其他人回答的決策引擎的作用。在我這個『』外行人『』看來,具體原因在於粗暴的審批產生不了足夠有價值的信息,不對客戶進行中後期的追蹤產生不了足夠能夠刻畫行為的數據類型,

還有先留著晚上寫


信用卡業務是銀行利用大數據最成熟的部門之一。比如前端的交叉營銷,精準營銷,這些都會用大數據的關聯分析,邏輯回歸,決策樹等模型。貸前的自動調查,自動審批,反欺詐這些環節也有大數據的模型。貸後的套現監控,交易反欺詐會有一些神經網路模型。


傳統銀行信貸一般是分為貸前,貸後兩個部分。大數據對傳統信貸的影響,應分成這兩部分來說。

一是貸前,貸前分為貸前調查,貸中審批,發放審核三個環節。

對於銀行來說,有了大數據支持,在篩選客戶,營銷客戶時(貸前環節),可快速找到目標客戶群體,降低時間和人力花費,同時,對收集的客戶資料,均可從大數據中導出,整理收集歸納客戶信息變得非常容易。

前台發起授信申請後,業務轉到貸中審批環節,風險經理可依據大數據提供的信息,快速對客戶信息進行印證(目前的情況較困難),匯總客戶信息,指出風險點,或者說快速提取出風險信息,對授信決策作出判斷。

發放審核過程中,如果有大數據支持,可以馬上從數據信息中確定是否已落實授信條件,而減少人為驗證,或者說,這一步,完全可能實現電子化操作。

二是貸後,如果有大數據支持,銀行可以及時掌握客戶的資信變化情況,比如流水變化,水電費繳納變化,稅費繳納變化,或者更高級的,進出貨物變化,用於幫助對客戶的貸後意見形成決策,可以讓目前大多數貸款沒有執行或者打折執行的貸後管理變得可按要求執行,讓風險儘早暴露,儘早化解,風險越是晚暴露,就越是難化解,做過風險經理,資產保全的朋友都理解。

總的來說,銀行需要大數據來為信貸決策提供支持,這種大數據是需要官方的,多方的,可靠的,可印證的,可關聯的,可歸納的信息的集合。這種大數據包括銀行本身的,如賬戶信息,流水信息,結售匯信息;政府機關的,如稅務信息,工商信息,水電信息,進出口信息,徵信信息,訴訟信息;民間機構的,如媒體信息,民間交流信息,交易往來信息等等……

這些信息目前都需要客戶經理自己收集,自己歸納,自己判斷,風險經理一般也僅憑可驗證信息加上推斷情形做決策,是絕對無法全面準確真實評估客戶資信的。所以,我們都在等待真.大數據那一天的到來,那時肯定會對銀行的信貸業務產生難以估量的影響,可是,真的到來,又完全是好事嗎?


大數據可以應用在銀行授信客戶全流程風險管理中的每個環節,包括貸前審查,貸中審批,貸後管理和不良的處置;貸前准入中,通過查詢企業徵信,被執行及失信信息等,能提供企業是否存在欠息,關注,不良,與同業合作情況,這都能與企業提供的相關的材料相互印證,涉訴較多,金額較大,甚至查封了資產,是否說明企業誠信較差?失信信息較多,企業能對別人耍無賴,自然也能對銀行耍無賴;通過XX查,XX寶能夠查詢企業的對外投資,實際控制人其他投資信息,可以觀察企業是否過度投資,是否轉移資產;貸後管理中,在授信期間內通過對用電,納稅或海關數據的對比,就能發現製造類或貿易類企業是否存在經營上的變動,主要是起到預警的作用,有了這個提示,就能第一時間內開展排查,更早的發現風險隱患;大數據運用的好,很多企業的問題都能在授信准入的時候暴露出來,即使准入時沒問題,後面經營數據出現變動時也能夠及時提示,從而為風險處置爭取了時間,授信客戶的管戶人精力是有限的,銀行行業內外激烈競爭使得客戶經理往往無法像以前老客戶經理那樣跟著客戶成長或者對客戶了解的十分透徹,大數據工具的出現,能夠很好的幫助客戶經理和審查審批人員更深入的了解和管理客戶。


我行的信貸業務流程主要分那麼三個大的部分

客戶開發 風險判斷 審批

大數據的應用在三個層面都會有十分直接的影響

但因為樓主問的是傳統信貸

那麼其實傳統信貸模式上勉強說得上用到大數據的 只有風險判斷 應用的具體方式是交叉驗證 實際上的就是利用多維度的數據判斷客戶提供的數據是否真實 真實的話 他所提供的數據能否歸還他的借款

其他方面對於大數據的應用 其實還是十分少

原因其實有2個

從信貸的客戶來看 主力還是60 70後 他們對於互聯網的應用很淺顯 也不信任 並不是80 90後一代是互聯網的原居民 這導致了他們在網路上留下了生活痕迹很少 就好像年輕的大學生網上購物 打車 的消費金額可能是他們父母的數倍之多 但他們真的有數倍於他們父母的還款能力嗎? 這是虛擬數據與真實世界的脫節 這個不是說今天技術爆炸 明天就會用上大數據 人的習慣是很難更改的 更別說數據還需要積累

從銀行來看 銀行不是完全的技術推動型公司 它的確需要風險控制的技術 但它往裡面砸錢的邊際效益並不高 而且往往不能形成互聯網那種贏者通吃的局面 其他銀行可以快速跟進 而且銀行在嚴密的監管下 一舉一動都需要顧及方方面面的影響 很難成為這個領域的突破者


各位的回答都泛泛而談,很理論,可見都不是實打實在銀行信貸流程混的。

作為一名客戶經理,也做過和正在做小企業大數據貸款,我從執行的微觀層面來回答下此問題。

問題是,大數據在小微企業全流程信貸的應用,那我就蔥貸貸前、貸中、貸後三方面簡單回答下。

貸前:大數據能給銀行提供各行業所處的歷史階段和國家政策導向,從而分出優先支持行業、選擇支持行業各壓縮推出行業;

貸中:根據客戶在此銀行的交易歷史或納稅情況,通過演算法給出一定信用額度,從而解決部分小企業無抵押的貸款問題。

貸後:當然是通過各種數據分析企業的持續經營能力,給此信貸資產分類,即所謂的正常、次級、違約。

首次回答,不知道能不能提供一點幫助。


大數據在徵信的比較多的,主要有個人身份信息(個人基本信息、教育學歷信息、駕駛證信息)、個人消費相關數據(資產信息、興趣愛好、電商註冊)、銀行持卡人數據(POS交易停息、線上線下支付數據),互聯網用戶及行為信息,借貸黑名單高風險客戶名單(傳統金融、互聯網金融)等。

獲取了這些數據,可以對你的消費能力,個人信用,獲得參考依據,大數據徵信,作用還是非常明顯的,從事大數據徵信行業起源,這些我們必須知道! - 大數據 多智時代


一、應用於精準營銷 二、應用於風險管控

鄙人粗淺談一談大數據應用於信用風險管理的價值。

貸前:大數據助力客戶經理高效盡職調查,在信貸第一步攔截風險客戶,減少整個業務流程中人力、精力、資源的消耗。

帶中:建立審批模型,進行風險篩查,高效精準評級授信審批。

貸後:自動實時推送風險信息監控預警,使得貸後檢查有工作重點,提高貸後管理水平。

資產保全:分析找出資產線索,減少損失。

大數據應用於信用風險全流程管理,解決信息不對稱、不及時問題,加強風控,提高效率,提高信用風險管控能力。


對於對公信貸估計還較難應用,但對於個人信貸,數據的價值非常大。通過把數據導入信貸評分卡模型,能把資質差的人直接拒絕掉,把資質非常好的人直接通過,從而提升審批的效率。不然每一筆都人工審核的話,那成本就很高了。目前某行個人信貸約有20%的業務是機器直接審批,剩下80%才須經人工審核。而對於某些純信用的個人信貸品種,如果能獲取到用戶公積金、社保以及工資等數據,加上徵信數據,開發評分模型,可以實現全線上審批。當然,個人還是要臨櫃開卡和申領key,同時也是一個驗身反欺詐的過程。也就是各家行都有的公積金信用貸款、代發工資信用貸款等,從目前數據來看,這部分業務的壞賬率要低於平均水平,證明數據及模型還是有效的。

另外,數據還可以用於貸後管理,比如發現某人的公積金本月斷交後,進行貸後預警,讓客戶經理第一時間進行核查等。

隨著未來數據範圍的越來越廣,更多的零售信貸業務可以實現純線上審批。我個人認為,所謂的互聯網下半場,就是爭奪數據的比賽。誰掌握著數據,就能建立起壁壘,數據在營銷、信貸等各個領域都有著重要的作用。


大數據可以提高精度,描述市場真實面貌的精度。在這種精度下。剔除其他因素,傳統的信息獲取結果可以認為是錯誤的。


我不同意有答主所說的大數據主要用於營銷,因為我們說的是信貸業務。

銀行的大數據,不是為了給某個客戶畫像,而是為某一類客戶畫像。因為無論你對某個個體刻畫的再全面真實,你也無法預測他下一刻的情況,只能通過對大量樣本的統計來描述他這樣一類人未來活動的可能性。(比如你掌握了一個客戶的所有可以獲得的信息,但你還是沒辦法知道他在下一秒會不會突然遭遇一起車禍,可是在統計學上,一萬個人中有多少人可能會發生交通意外是可以通過歷史數據計算出來的。)

銀行的數據緯度是有限的,銀行要做的不是去更全面的收集信息,而是在已有的信息里挖掘這些信息與貸款可償還性之間的關係,特別是違約客戶的特徵。

回到問題上來,大數據在銀行傳統信貸全流程中,主要發揮作用的地方是信用評級,經濟資本測算,利率定價等方面。


推薦閱讀:

Excel下的堆積型南丁格爾玫瑰圖怎麼畫(zuo)?
大數據在金融領域是如何應用的?
互聯網廣告公司受資本市場歡迎么?
關於大數據時代的職業規劃?
利用大數據進行決策,是否有效可行?

TAG:商業銀行 | 大數據 |