大數據進階-—— 時光和努力的意義

大數據進階-—— 時光和努力的意義

年底總結與雞湯

「如果你問我時光和努力到底有什麼意義,那麼變成更好的獨一無二的自己,便是時光和努力的全部意義。」n——盧思浩

這次年終總結寫的很順暢,大數據領域的進階實踐是工作中最大收穫。所謂更好的自己,其實就是不斷超越自己。年終總結究竟是一份套路性的模板,只需換換數字就可以搞定;還是要費點心思,找出適合的故事線來表達?

此時的「AI」

一個比較務實的AI(Augumented Intelligence,增強智能)系統,可以由客戶畫像+挖掘模型+決策引擎組成,其中數據挖掘模型是智能化的核心。之所以不提Artificial Intelligence,是因為此時此地,在傳統銀行還沒有合適的應用場景。另外,除了互聯網的典型應用外,在金融領域深度學習的應用例子似乎都還是研究大於實踐,寫寫論文當然沒有問題。

銀行數字化轉型,通過科技力量促進效率提升和成本降低,這個過程中科技的作用是更好的輔助業務開展,而非過分的喧賓奪主。所以,增強智能系統的目標是提升傳統業務流程的智能化水平,大數據的能力主要體現在三個方面,也就是圖中的三個組成部分:更好的客戶認知、更智能的演算法、更快速的決策支持。數據是強產品化的,數據應用必須與實際產品關聯,做用戶畫像必須和具體應用(精準營銷、產品推薦)結合;決策引擎是結合的渠道,數據挖掘是競爭力的體現。

幸運的是,今年我司在這三個方面都有大數據應用項目開展,這對於個人全方面的提升大數據能力是很有幫助的。我主要是負責數據挖掘領域,打造服務企業級大數據挖掘平台,另外研發智能化的風控模型。從底層組件到機器學習演算法是基礎知識,從數據挖掘建模到數據產品研發是工作交付。以時間點劃分,前半年集中在技術,後半年集中在建模,壓力貫穿始終。

「會思考「的風控模型

與增強智能類似,這個命名參考了「IBM會思考的裙子「。並非裙子會思考,而是裙子在創造和使用的過程中靈活運用了科技的力量,帶動傳統研發流程的優化,以及新型的應用產品。對於業界熱炒的概念,我的態度是積極學習,謹慎應用;盲目吹捧或貶低,都是不妥的行為。

比如大數據都已經在Gartner新興技術成熟度曲線上消失,但很多人還在聊著五年前的話題,甚至會因為這個而下很多結論。如果是文化公司,現在聊大數據的幾個V,聊Walmart或Target的案例,那還可以理解,因為人家重在理念、知識的傳播,這叫仁者見仁。如果是專業技術人員,現在還停留在這水平,那就不說什麼了,或許需要加大努力了。

關鍵不在於名稱,而在於從中學到了什麼,然後做了什麼,然後在時光和努力中得到些許收穫。今年,研發了一套「會思考的風控模型」,結合傳統風控技術和複雜網路分析,基於基礎維度和社交維度構造特徵指標,使用分散式機器學習演算法建立風險預測模型。模型每天都會進行思考,更新網路關係並重新訓練以確定最新的思維模式。

從上一節的增強智能系統層面來看,這個模型能夠貫穿其中。模型通過補充數據源進行持續豐富和強化,也就是結合客戶畫像從更廣泛層次思考風險影響因素。從落地層面,模型直接應用到風險決策引擎,進而支持業務流程的改進。

持續的「大數據「

用一句話概括,2016年帶著兩個項目,做了六個模型。那麼2017年呢,我會持續進行大數據領域的研究與應用,對於區塊鏈、Docker等熱門技術也保持足夠的興趣去關注。做總結時候,同樣規划了明年的工作;除了常規內容,主要的挑戰在於以下幾個方面吧。

首先是如何落實數據科學實踐的規範性,用數據科學的好處在於不用糾結於數據分析、數據挖掘、數據產品的異同,統一在一個概念層進行管理層面的設計,外在表現的不同可以類比於工作或手段的區別。梳理幾項工作的細節,關注外部干係人和事的範圍,以數據價值實現為目標制定相應的管理辦法、細則。這個目標重在治理,並無太多的同業經驗可以參考,所以需要不斷的閱讀和思考。

其次是不同思維模式切換的平衡把控,治理與應用的創新思路區別很大,同步進行多項模型研發過程中如何保證穩定的聚焦;持續研究新的技術,比如最近在看微服務,看Docker和Devops,如何與實際工作(不同模式)相結合也是很傷腦力的內容。

最後是技術領域的小目標,今年有流數據相關的大數據應用項目,明年爭取做一個對應的數據挖掘模型,至少在技術上探索或達到實時預測的能力。

「自主可控」的數據挖掘

持續的大數據研究與實踐,是個人的目標;一旦啟動,似乎也不是短期內就能停止探索的事情。數據挖掘建模是大數據成為企業核心競爭力的關鍵,銀行數據挖掘工程師必須有能力掌握模型的研究孵化;相對於軟體開發,這個角度的自主可控更值得重視,也更容易落實。

獨一無二的自己,並非追求與眾不同,而是要形成自己的方法論,體現在自己的觀點和看法中,這個過程會持續很久很久。

-----------------------------------------

更多文章,歡迎關注公眾號


推薦閱讀:

自主創新,打造一站式地理雲平台
大數據是什麼
AI技術講座精選:機器學習梯度下降演算法(包括其變式演算法)簡介
【巡洋艦首發】有趣的機器學習 第一章:最簡明入門指南
TensorFlow極簡教程:創建、保存和恢復機器學習模型

TAG:大数据 | 人工智能 | 银行 |