銀行大數據與互金大數據,究竟有何不同?
昨天的文章《大數據在金融業中的應用》發布之後,便有朋友留言問,「銀行的大數據和互金的大數據應用有沒有什麼不同?」的確,說到金融大數據,我們會發現有兩類機構都在提,當互聯網金融企業都把大數據掛在嘴邊、當大數據風控成為新金融的代表性模式時,被稱作「傳統金融機構」的銀行業也坐不住了,站出來講,銀行業才是典型的大數據企業,銀行內部有大量的數據,既有結構性數據,也有非結構性數據,只是沒有把這個數據富礦更好地利用罷了。
所以,問題就來了。銀行與互金,所講的大數據是一回事嗎?二者究竟有何區別呢?下面分享我的觀點,未盡事宜,歡迎大家留言(訂閱號:洪言微語)討論。
差異始於自有數據的不同
對於任何一類機構而言,其數據的構成都是自有數據+外部數據,外部數據則包括既公開數據,也包括第三方購買數據和其他渠道獲得的數據,如下圖所示。照理來講,外部數據的獲取是可以做到大致相似的,自有數據便構成了金融機構數據差異化的基礎。
先來看看銀行業
本質上,整個銀行業的一切活動和產品都是與數據有關的,甚至說銀行的所有產品都是數據也不為過,比如說你的存款、你的貸款、你的理財產品等,實際上就是在銀行系統內記錄的一組數據而已。正是由於銀行產品和業務的天然數據屬性,所以銀行業在產生數據和應用數據方面一直走在各行各業的前列。據悉,計算機由軍用轉為民用時,率先利用計算機技術來提升行業管理能力和發展能力的就是銀行業。
銀行的自有數據主要是各種業務數據,是對全行客戶業務活動過程和結果的記錄。同時,為了更好地開展業務,還會要求用戶提供諸如電話、職業、教育、住址等信息,如果有過貸款申請行為,還會包括收入、房產等強信用屬性數據。此外,所有人的工資都是銀行代發,公積金流水也在銀行,房貸和車貸也都在銀行,銀行在業務過程中還產生了大量的文檔、資訊、圖片、音像等非結構化數據。
換個角度來看,銀行賬戶是經濟社會所有活動的起點和重點,所有人的財富狀況和變動情況都會在銀行留有痕迹,所以,要判斷一個人有錢沒錢,找銀行就對了。為何保險產品、基金產品都喜歡交給銀行來銷售,一方面是銀行有著龐大的線下渠道,更重要的在於,銀行知道哪些用戶有錢,從而進行更好的產品匹配銷售。
本質上講,若能精準地判斷一個人有錢沒錢、有多少錢,無論是進行精準營銷還是風險防控,基本也不太需要太多的其他數據了。但問題在於,銀行業的數據是割裂的,除了信貸類的關鍵信息會以徵信的形式報送央行徵信中心,實現一定程度上的共享外,其他的各類財富相關數據,都分別沉澱在各家銀行。比如張三,在中國銀行有1000塊存款,在建設銀行有20萬塊存款,在工商銀行沒有存款,那麼,在建行看來,這是個有錢人;在中行看來,這是個再普通不過的用戶,在工行看來,這個人的財富狀況無法判斷。
再來看看互金平台
如果是創業型互金平台,其自有數據也主要是各類業務數據,這點與銀行相似,不過數據量要少得多,受單一的業務模式制約,數據維度也很單一,單靠其自有數據,是幾乎談不上什麼大數據應用的。而幾大互金巨頭就不同了,比如BAT,其本身就是互聯網時代的數據黑洞,沉澱了巨量的用戶數據,當其轉型做金融時,之前積累的電商數據、社交數據、行為數據等便成為其可用的自有數據。當然,互金巨頭對用戶財富數據的掌握程度遠遠比不上銀行,不過 好在銀行最有價值的金融數據——信貸數據已經在徵信中心實現了共享。
金融數據的日月星辰之光
數據的多少或優劣,只能通過其對業務的促進作用來進行比較,我們以信貸業務為例進行分析。不考慮房產抵押、存款質押、理財質押等抵質押類貸款產品,從純信用類的消費貸款產品來看,排除欺詐風險的因素,大數據風控要解決的是核心問題是:一個人的還款意願、還款能力、還款穩定性等因素。判斷這些因素,這個人的信貸行為數據、歷史借款數據、歷史違約信息等徵信類信息是最有效的數據,我們可以從FICO分的構成進行驗證。
FICO(Fair Isaac Company)信用分是由美國個人消費信用評估公司開發出的一種個人信用評級法,其分值在300-850之間,已經得到社會廣泛接受。據一項統計顯示,信用分低於600分,借款人違約的比例是1/8,信用分介於700~800分,違約率為1/123,信用分高於800分,違約率為1/1292。一般認為,FICO分高於680分,就屬於信用卓著的用戶了;而若低於620分,則很可能被拒貸,或被要求增加擔保或抵質押。
而FICO評分模型主要就是圍繞個人的歷史借貸行為等徵信類信息展開的,包括付款歷史(佔比35%左右,包括各類信用/貸款賬戶的還款記錄,公開記錄即支票存款記錄,逾期償還情況等)、未嘗債務(佔比約30%,包括仍需償還的信用賬戶總數,信用賬戶餘額,總額度使用率等)、信貸時長(佔比約15%,信貸賬戶的賬齡)、新開立信用賬戶(佔比10%,包括新開立信用賬戶數,新開里賬戶賬齡,正在申請的信用賬戶數量,查詢查詢記錄等),正在使用的信貸組合(佔比10%左右,包括信用卡賬戶、零售賬戶、分期付款賬戶、抵押貸款賬戶等混合使用情況)。
從效用等級來看,記錄歷史借款數據的徵信數據有效性最強,可看作是太陽之光;消費、社交等數據的有效性次之,可看作月亮之光;興趣愛好及其他行為數據的有效性再次之,可看作星辰之光。在評價一個人的信用時,如果這個人有徵信數據,那麼基本可以不用再看消費、社交、興趣等等其他數據就可以進行判斷,就像太陽一出,月亮和星辰之光便黯淡無色了。
問題在於,大多數的人都缺乏有效的徵信數據,中國13億人口中,有信貸徵信記錄的僅有3.5億。對於沒有徵信記錄的人,只能用月亮星辰之光進行信用判斷,雖然效用差一些,但很多情況下也勉強可用,這是互聯網大數據風控模型崛起的內在邏輯。
銀行與互金大數據風控的差別所在
最後再來看二者的差別,我們從客群的角度來對比。
對於具有徵信記錄的優質客群,這部分客戶的信貸記錄多來自於銀行體系,意味著銀行不僅掌握其更細維度的借款歷史數據,還掌握了其存款、理財等財富數據,在這部分用戶的大數據信用評判上,銀行是佔據先機的,有其獨到的優勢。
對於徵信記錄較少或沒有徵信記錄的客群,沒有了日光照射,對銀行而言,可能意味著徹底的黑暗,難以判斷用戶的信用情況;而掌握了用戶消費數據、社交數據的互聯網巨頭,掌握了月亮星辰之光,反倒可以大致看清用戶的輪廓,具備了差異化的優勢。
問題來了,銀行為何不去掌握這些月亮星辰之光呢,因為有價值的行為數據多數都掌握在互聯網巨頭手中,這些巨頭像數據黑洞一樣,數據進得去、出不來,誰也拿不走,而正是這些數據,構成了其在次級用戶信用評級上的核心優勢。
反過來再問,怎麼去對抗這些數據黑洞呢?唯一的出路就是增加太陽光的照射範圍,即推動可以全社會共享的徵信體系的發展,屆時,月亮星辰之光的影響也就越來越小了。
最後簡單總結下結論吧。
如果從大數據信用風控的角度看,銀行與互金的主要差別就是因數據源的不同導致的客群有效性的差異,整體上,銀行的大數據風控模型針對有徵信記錄的用戶更為準確;互金巨頭的大數據風控針對缺乏徵信記錄的用戶更為有效,當然,因為徵信記錄是開放的,所以對於有徵信記錄的用戶而言,互金巨頭的模型也可覆蓋,只是與銀行相比缺乏優勢罷了。
如果從大數據欺詐風控的角度看,銀行與互金則各有千秋,因為欺詐風險更多地與業務模式和流程有關,業務模式的不同決定了銀行和互金面臨的欺詐風險很多情況下是不同的,所以缺乏可比性,應該是各有各的特長。
如果從大數據在智能營銷上的應用看,互金巨頭掌握了用戶的消費、社交等行為數據,可以更好地了解用戶的行為偏好,從而可以更好地將金融產品融入場景打包推薦給用戶。相比之下,銀行掌握的更多是用戶有錢沒錢,在智能營銷上其應用範圍就窄得多,在銷售基金和理財產品上精準度比較高,但在場景化金融上就要遜色很多。
如果從大數據在內部管理上的應用看,銀行業已經進行了長達十幾年的探索,在很多方面是要領先的,而絕大多數的互聯網金融企業,在這方面還需要補課。
——————————————————————————————————————
PS:歡迎去我的LIVE分享頁,系統了解 互聯網金融/金融科技 相關知識
推薦閱讀:
※該死的不是通道 而是銀行
※欠債不還錢-債務豁免是個什麼鬼
※給你講個笑話,我號稱「職業理財師」
※從郭台銘買豆漿看富豪是怎樣煉成的
※銀行的飯碗還能捧多久?五年銀行人談切身體會