金融業的數據治理(一)數據流入
隨著科技的發展,當今社會已經進入到了信息時代的下一階段,「數據時代」,大數據成為了眾多行業的風口,數據自然而然便成為了最重要的基礎設施。魯迅說(可能沒說):數據決定一切。
金融行業站在歷史的分叉口中,內有指數型增長的數據量,外有互聯網公司的跨界打擊,不得不擁抱大數據時代的到來。其實,金融業從來都沒有離開過數據,客戶信息,是數據,消費記錄,是數據,風控模型等等,都是數據,大數據時代的到來,給金融業帶來的不僅僅是數據量的大,也帶來數據來源廣,數據形式多,應用場景豐富等利好,大數據給金融業帶來的升級,使得互聯網金融業引得無數英雄競投身。
但恰恰處於風口,其側翼則更有被忽視的危險,大量數據的流入流出,對金融業的數據治理和數據安全提出了挑戰。良好的數據治理,最需要獲得也是第一件應該做的事,就是高層的重視,首先要建立數據管理的相關制度,梳理公司的數據框架,建立數據管理職責體系,落到實務上,就是對數據全生命周期進行充分治理,研究數據的保存和使用場景,防範數據泄露,數據濫用,數據丟失等風險。
數據的生命周期,是指數據從創建(流入)、初始存儲,到數據使用和處理,最後到它被刪除和回收這一系列過程,上圖可以比較形象地體現其流轉過程。這個環節中的每一步,都決定了我們使用的數據的質量,最終對業務造成實質性影響。
數據治理的第一步,也是最需要把關的,就是數據的流入。千里之行,始於足下,數據的創建和獲取質量決定了數據使用的質量。數據的來源多種多樣,有業務產生的客戶數據和交易數據,有第三方機構提供的信息數據,還有自己主動收集的分析數據;數據從各處流進來,不能在源頭就被污染,被泄露,所以對於數據源頭的監管就非常重要。
由業務獲得和產生的數據,包含了客戶個人信息,消費信息,交易數據等大量的敏感信息,對於這些繁多的數據信息,許多金融機構為其設立了一個中心保管地帶,就是俗稱的數據倉庫或者數據湖,流入的數據被保存在這裡,供部門調用。對於流入的數據,我們第一步要做的便是對其進行分類設計,實踐上也就是根據訪問許可權對數據進行分類,按照合規要求對分類標準進行檢查。所以在這裡就必須著重確保用戶隱私,對什麼數據是可以被訪問和修改的,數據的哪些欄位是涉及到隱私需要被保護的須有清晰定義,並根據監管部門出台的個人隱私,網路安全保護等法案進行自查自糾,將數據風險納入全面風險管理體系,在內部稽查審計中著重監督,建立審查體系。所以我們說,數據治理是一項全公司的任務,從它生命周期的開始便可見一斑。
由第三方機構提供的數據,在如今的金融業可以說越來越常見了,無論是各路央企民企的徵信數據,還是金融市場的交易數據,還是用戶的消費場景,用戶畫像等,都是當今金融企業不可或缺的數據。例如普惠金融、普惠保險,其核心是風控,最需要的就是用徵信數據,如今的徵信市場,如鵬元徵信,芝麻信用等徵信機構正如火如荼地發展著。那麼第三方機構的數據質量和業務穩定性就成為了數據流入管理的關鍵。建立對第三方機構的數據質量監控,動態測評機制,全行業商情監測和預警機制,才能有效保障公司的第三方數據源的高質量和穩定性。其實關於第三方機構管理還有很深的可研究性,就不詳細鋪開了。
第三種數據源就是由各部門基於各種目的而主動收集的大數據,主要用於市場分析,業務發展等。對於這種數據,除了要考慮到監管合規和隱私保護,還要考慮到商業授權等業務安全因素;其次,這種數據包含有大量文本,多媒體等非結構化數據,對於其合理的整合和存儲需要提前考慮IT基礎設施的最優化建設,儘可能提取和保留數據中有價值的部分,提供數據使用的效率。
金融業的數據治理是一門非常深的學問,是一門結構化和體系化的科學;數據流入作為數據治理成功的第一步,唯具有高度重視,謹慎治理的態度,才能讓數據大廈,萬丈高樓平地起。
推薦閱讀:
※黑馬形態之倒撥垂楊柳,行情這麼走
※該類股票存在何種風險,是否具有投資價值!?
※股權眾籌具體怎麼退出?
※謠言之下,外匯儲備再創新低
※一頁倫敦 · 我23歲那年夏天