如何用大數據軟體分析金融數據,目前哪個領域最有分析價值,以及發展方向?
親自用過的大牛解答
宜信大數據實時授信平台技術、架構、模型解析
宜信大數據實時授信平台包含姨搜、知識圖譜、授信和反欺詐引擎等模塊。平台結合了用戶授權數據、第三方數據、互聯網海量數據等不同數據源,最大限度地獲取 用戶信息。授信和反欺詐引擎結合了專家知識和機器學習演算法,分析客戶的信用狀況和欺詐風險,實時估計授信額度、檢測欺詐風險。
這個平台到底是做什麼事情的?通過對各種各樣不同的數據員的接入,包括自己的數據。通過對它的接入分析,梳理,挖掘,關聯和理解。
做了一堆的事情,但是三樣最重要的事情是說,
第一個分析客戶的信用狀況。
二我們會檢查欺詐的風險,我們這個行業欺詐是非常非常重要核心的東西要去做。第三個所有做完這些東西,我還是想做什麼?我是想做希望實時能夠估計信用額度。這不是我今天站在這個地方紙上談兵的一個事情,我們上面已經有垂直的,已經在市場上在做。大家都知道宜信有一個非常棒的一個互聯網產品叫宜人貸,有不同的模式,其中有一個是極速模式,我們這個平台做的第一件事情,我們支持宜人貸。你要上去去投標。如果非常幸運,可能10分鐘就能買標。我能不能做到通過數據讓宜人貸一分鐘之內可以授信呢我們當時做了這樣一件事情,我請來申請貸款的這些人給我一些數據。
什麼樣的數據比如你信用卡的流失數據,比如你在淘寶,天貓京東的購買數據,或者你在運營商的通話記錄,加上其他我們已經爬下來的,我們做了搜索引擎,大量的網上的數據,加上宜信自己的數據,還有我們很多生態夥伴第三方的數據。所有的數據加起來,我能夠做出來,在實時一分鐘其實是幾毫秒之內,能夠做到給你授信,你給我這些數據,我能說不能貸給你,還是能貸給你兩三萬,我眼看著向10億在邁進,我們這是我們做的第一個產品。
當然我們也有很多的合作夥伴,不同的方式在做這件事情,後面的原理是類似的,同一個平台在驅動。我們在9月份跟易貝做了戰略合作,中國有一大堆在華南華東的外貿電商,不在天貓,不在淘寶賣東西,在易貝賣到外國,到我的網站,這個網站上去,把它的易貝帳戶提交給我,綁給我,把分鐘之內,你這個帳號值多少錢,還是對不起,你這個帳號沒有足夠的數據,是不值錢的,請你以後再來。這個產品,是我們做的第一個嘗試,拿商家的流水拿來做這個依據。加上我們其他的各種各樣不同的數據源來的數據,所有的數據做一個理解,做到現在做了大概幾千萬的級別。
可能很多人會問我說,因為時間關係,沒有辦法我只能說做一個非常非常簡單的展示,傳統的金融機構,大家也做模型,做演算法很多諸如此類的數據挖掘,傳統的數據模型,比如說,他可能會放幾十個變數,或者撐死了放幾百個變數,我們的方法不一樣,我的有幾十萬個或者更多的變數,傳統的模型裡頭,非常強調說所有的這些特徵,要是可以解釋的。所以他需要非常非常強的特徵。在我的這個模型裡頭,在我們這個平台的模型裡頭,對於我來講,所有的數據,都是信用數據。當中交易數據,流水數據這些數據大家可以想像到,其他很多的數據,比如你的搜搜數據,網上的很多其他點擊數據也是特徵。如果這些特徵被吸收的話,可能非常弱的特徵沒有關係,最後我能做出不管是信用,還是反欺詐,我後面有一堆模型在這邊,我做的手段跟傳統機構不一樣的。
今天我其實是想說的是,今天在座很多人,你們做O2O,你們也會積累數據,大量的各種各樣的數據。我站在這個地方是希望跟你說有另外一種新的變現手段,數據變現的手段,你提供金融服務,可以是C端的流量,也可以是B端的流量,我們作為第三方,我的這個平台可以跟你合作,提供一個金融變現這樣一個能力。
附:宜信大數據金融實踐分享
純乾貨,先贊再下載 宜信大數據金融實踐分享談不上專業人士,我來回答下你的問題。
第一,你所說的大數據軟體,不太讓人明白。至少在行業里少提到大數據軟體這個說法,可以說大數據技術架構,也可能說數據挖掘軟體。不過我理解,你提的大數據軟體應該是圍繞大數據分析與應用的一系列工作與系統吧?第二,你提到的金融數據,這個涉及面很廣,就我有限的接觸來看就有很多,比如基金公司的銷售數據,客戶持有份額與交易數據,客戶接觸數據,客戶網站瀏覽數據等;比如銀行涉及到進出帳戶的數據,客戶基本信息的數據;比如保險公司有客戶購買保險的數據等。概括而言,可以分成以下幾大類:客戶基本屬性數據、客戶產品購買數據、客戶交易行為數據、客戶偏好數據……能做什麼分析需要看能獲取什麼數據,如果你能夠把行業第三方的數據整合進來,可做的挖掘就多了。例如,如果做為基金公司能夠獲得用戶在網路上的瀏覽行為數據,你就可以判斷用戶最近有沒有關注相關產品,有沒有關注競爭對手的產品。
第三,談談大數據具體在金融行業的應用領域,據我有限的接觸來看,以下領域需要大數據發揮更大更多的作用。
1、用戶授信:這其實是數據挖掘最早應用的領域之一,國內的數據挖掘最早基本上也是基於授信所需要的分類挖掘演算法而發展的。基於大數據對用戶信用風險進行判斷,是一個重要的方向。特別是目前很多信用評估體系是依賴於國外的評估機構,如果能夠基於大數據(看你能獲得何種數據)來構建起信用評估機制來,這個會有市場。2、交易風險控制:這個跟用戶授信不同。原來的數據挖掘能夠實現對用戶靜態的信用評估,基於大數據的流式處理能力可以實現對用戶的動態評估,即交易風險的判斷。例如,當你發現同一個帳戶在近乎相同的時間在不同的地區進行信用卡交易的時候,這個時候交易風險就產生了。客戶的信用卡可能被盜,也可能存在欺詐交易行為。
3、提現預測:目前互聯網金融的一個很大的特定就是打破了原來流動性和收益率不能兼得的特徵。而現在的很多「寶寶」能夠兩者兼得,除了跟創新有關外,在技術層面如果能夠實現大數據對產品的支撐,會做得更高效。具體來說,「寶寶」們需要滿足每天用戶提現的需求,這就需要儲備流動性強的資金,儲備少了,會出現擠兌;儲備多了,而資金不能得到充分利用,無法產生更多的收益。所以需要構建預測模型,實現對資金需求的有效預算與管理。4、營銷監控與評估:這個是容易被忽視的領域,因為是涉及到具體戰術的工作。以後大多數人都關注營銷效果的最終效果,比如搞了個客戶營銷產品,看最終轉化了多少,但其實有很多環節可能會影響到用戶的轉化。比如接觸情況,比如吸引性,比如消費滯後性等等。這些需要依賴於大數據基於更客戶更準確的解答。5、流失預警:如果你能獲取的數據可以洞察用戶在整個相關產品里的使用行為,你就可以洞察用戶潛在的流失風險與去向。例如,你會發現原來較優質的客戶最近在一段時間裡突然不太活躍了,這可能就會有風險,但是到底是最近比較忙沒有交易?還是另有他愛了?這個需要依賴於大數據進行洞察。用戶可能這段時間正在關注或已經購買競爭對手的產品,這可以提供更大的營銷管理價值。……其實還有很多,就不多說了,沒有哪個領域更有分析價值,取決於你所關心的核心問題。第四、關於發展方向:我想一個趨勢其實已經行成就是金融行業和第三方行業資源的整合,比如金融和互聯網企業 ,金融和大數據擁有者的資源整合等。不論是哪些行業的資源整合,一個不可規避的事實就是對傳統金融工具的創新,所以想想現在的金融產品有哪些問題,可能就能找到創新方向。比如寶寶們的收益與流失性兼得其實就是在挑戰傳統金融兩者不可得的不足。至少對普通投資者是這樣。另外,創新還會體現在具體的營銷層面,比如依賴於各種有效的觸點實現的營銷,依賴於社交媒體實現的營銷創新等。不知道大家最近關注到沒有,已經有一些創新在實踐了。比如,泰康人壽基於微信實現的求關愛的傳播與營銷方式,即用戶發起求關愛的活動,發到朋友圈,朋友可以送1元關愛,這1元錢實際上是幫發起用戶購買的保險產品。具體你到微信里看看吧。
先說這麼多吧,不足之處還請大家指正並補充。大數據授信是非常實用的領域。尤其是在未來線下生活服務全面互聯網化的趨勢下,線下零售與服務的具體交易數據很可能可以被交易平台獲得。即知道消費者具體買了什麼,也知道商家都賣了什麼。
從而可以像阿里小貸和線上信用支付一樣對現在的線下行為授信。
來說個比較小眾的量化投資領域,跟傳統定性投資相比強調的是數據的維度跟廣度,剛好契合的題主說的金融大數據方向。
舉個簡單的例子,做定性投資可能可以把一隻票的方方面面講的很全,但一周盡調一家公司一個月也才4家,一年也就48家而且沒法重複跑。
而量化可以通過分析股票漲跌中的共性,通過這類共性的特徵從海量的股票中去挑選不用刻意管這個股票處於哪個行業,佔比多少,是下游還是上游。更加科學、可解釋,個人認為是未來資管行業的大趨勢,在國外量化投資佔比早就超過60%,現在在國內還不到5%,而且因為從事的人少,相對現在競爭還不會太激烈。
所以我覺得在金融大數據領域,量化投資一定會是一個很有前景的方向。具體舉金融大數據在量化投資應用的例子。
歷史高送轉分析在這個例子里就可以看到過去6年,哪些行業送轉數最多,哪些公司股息率最高容易送轉。擴展到所有事件驅動類型的模型-事件驅動模型拿到這些金融數據就可以分析諸如業績預告,定增公告,高轉送等事件預告前多久股價開始反映,多久後股價開始衰減,可以用歷史的回測來指導將來的投資,因為從行為金融的角度來講,大多歷史事件都會重演。
還有些更高端的玩法,在講座里聽過實踐中沒用過。例如:通過市場情緒來判斷市場漲跌、通過衛星遙感數據觀察港口郵輪來提前預知行業情況等等,總之覺得這一塊還有很多可以探索的地方。1.首先是大數據軟體,不存在這樣的軟體,能直接給你一個大數據的結果。
2.分析價值嘛,只有分析了才知道, 3.發展方向的話,我認為其實大數據是個概念,這個概念的提出帶來了大家的理念變化,具體在金融領域如何運用以及如何發展,業界也在一步步地探索的過程當中。現在發展的還可以的,包括大數據徵信、投資者情緒分析、客戶營銷產品推薦等等。ps:大家可以關注我個人的公眾號「量化小尖」,我會分享一系列的金融數據量化分析為主題的文章和技巧。個人認為:風險控制、精準營銷、投資~ 希望更多討論!!!
根據客戶行為數據事件流作風險控制結合地理位置做精準營銷歷史對賬數據查詢等~
個人覺得,大數據在證券行業這個領域裡的應用前景很廣闊。大數據在金融行業里有
很多應用的案例,但主要是在銀行和保險,像是風險定價、風險控制、保險設置、授權等等,但是在證券業里的應用才剛剛起步,且投入處於逐年上升的階段。
大數據在證券行業里的應用,有兩個方面有較大的價值:一是行情分析,二是用戶分析。行情分析很多智能投顧的創業公司已經在做,服務的對象更多是高資產用戶,集中投資于海外資產,有些由C端轉向了B端,將量化分析策略提供給券商去用。但是用戶畫像這塊,還有很大的開發價值。
部分券商,但效果不大,還是陷入了系統笨重這個圈套里。收集了大量的用戶數據,構造出所謂「360用戶畫像」,但用戶畫像太過於全面多維度,跟業務的關聯性卻不大,相當於造了一堆用不起來的東西。而且系統很笨重,用的是傳統的CRM模式,對計算機存儲占量大,每次調用有時會影響到其他系統的正常運行,營銷人員用起來也沒有用。
這些都是前不久幫一個券商進行用戶分析時得出的個人感受(鑒於保密協議,不便透露)。大數據、機器學習在券商用戶畫像這塊,還是有很多價值的。券商本身有很多用戶交易的行為數據,將同業務強相關的信息欄位摘取出來,即使在不引入外部數據的情況下,也能分析得出用戶的持股時長、數量、偏好等,分析出投資的不良習慣、真實的投資偏好,甚至前期活躍突然不活躍甚至長期虧損等這種潛在流失跡象,在針對每個用戶的情況提供建議或服務,才能起到提升業務的作用。
當晚,這對雲計算的要求也很高,在短時間能進行大量數據運算,才能起到提高效率的作用,改變人工傳統投顧效率低下,大量終中高價值用戶無法挖掘以及難以從數據中了解用戶需求的痛點。
好了,更詳細的案例分享我會在我的專欄更新,歡迎關注飛蟬智投--知乎專欄。
ethink大數據平台 可免費申請試用
推薦wind
目前營銷上的風險控制基本沒有
感覺金融數據還是要和互聯網營銷一起考慮、這勢必是今後的發展趨勢
2014年12月20幾日,企業徵信牌照 才正式放出。 大數據方向很多都在嘗試,互聯網徵信也在做,根據互聯網數據建模也在嘗試中。但是,還很初級,比如宜信 信和 在這方面技術人員的薪資似乎只是大幾千塊,可能管理崗位能有十幾k的樣子。 所以在這方面的嘗試,在實際上還是初級階段。
現實情況似乎是,徵信、審核、風控主要還是靠人肉一般是設定一個分析主題,通過數據分析如SAS等建立初步的數據模型,通過數據鍛煉和實際使用的反饋不斷調整模型。但是模型大都有一個適用周期,完了又要重新建立模型。另外風險控制最近在銀行上的比較多,營銷不大清楚。
推薦閱讀:
※有了這些數據指標,讓活動「運營」起來!
※Mysql——將CSV文件導入表中
※現在的區塊鏈技術,正如 1993 年的互聯網