請問如何將數據挖掘技術應用與互聯網金融?

請問如何將數據挖掘技術應用與互聯網金融?即也就是說如何對互聯網金融數據進行數據挖掘?

具體問題:應用哪些數據挖掘演算法怎麼樣實現對互聯網金融的挖掘?

很多時候我們都會看到好多人說,大數據挖掘 在互聯網金融有很大的優勢,

但是沒有人說具體怎麼個挖掘辦法。比如說會用到聚類,分類,logistic回歸,決策樹嗎?如果用,見得說怎麼個用法呢?求指點。


首先,不要被「大數據」這三個字迷惑到,數據挖掘就是數據挖掘,弄再好聽的詞也是從大量數據中發掘隱含規律。

其次,數據挖掘最重要的是知道要分析挖掘什麼,只有知道了目的,才能夠根據目的選擇合適的演算法。至於是不是互聯網金融數據,這個都不是要點,因為互聯網金融數據也是數據,最後都會依據數據本身的特徵選擇相應演算法。

下面,是時候祭出這張經典的圖了。

從另一個方面說,只有知道了上面各種方法的特性,才能夠將合適的演算法與合適的數據對應上。

所以,回答你的問題「請問如何將數據挖掘技術應用與互聯網金融?」,一共有三步:

  1. 弄清楚行業數據的特徵,在你的預設下,也就是互聯網金融;
  2. 搞清楚常用數據挖掘演算法的適用範圍;
  3. 將兩者配對。

當然了,上面也就是說個大概,你還會花很多時間清洗數據,根據行業知識選擇合適的特徵,然後分析出結果之後要進行可視化,做 slides 將你的結果呈現給你的老闆,以及中間無數次的推倒重來。這些花的時間大概占整個流程的 80% 吧,反倒是中間分析的過程只會佔 20% 甚至更少的時間。

有人如果把上面的步驟都做全了,那麼這個人肯定不會再費盡心思把整個流程告訴你,因為一來數據清洗啊什麼的是很「藍領」的活,跟「大數據」這麼高大上的概念配不上,自然也就選擇不說;二來金融數據或多或少都會涉及商業機密吧;三來,既然都分析出來了,那麼得到的要麼是價值連城的別人都沒發現的規律,那麼自然馬上會用來賺錢,哪有時間跟你分享,要麼得到的是垃圾,那也就灰頭土臉的去接著回去改演算法了。


ETHINK數據挖掘在金融中的場景應用(信用卡風險評估)


推薦閱讀:

中國離金融危機有多遠?
股市大漲,沒什麼存款的屌絲,我該怎麼理財,銀行餘額寶利息有 不給力?難道去P2P理財么
什麼是fintech?金融科技?
陸金所的人民公社是什麼性質?
互聯網金融的理財和智能理財有什麼不同?

TAG:數據挖掘 | 互聯網金融 |