金融行業有哪些領域需要大量運用數據分析?具體有哪些職位?

各位好,我是廈門大學經濟類專業在讀研究生。我對數據分析很感興趣,一個月前開始學習數據分析方面的知識。目前正在cousera上學習data science系列課程,學習的軟體是R語言(之前沒有編程基礎)。我希望以後能夠在金融行業從事數據分析工作,在知乎一直關注數據分析、金融、R語言相關話題,但是沒發現下面問題的答案。

下面是我的問題:

1.金融行業有哪些領域需要運用數據分析?具體有哪些職位?發展前景是怎樣的?

2.這樣的工作需要具備哪些知識?

如果認為問題覆蓋面太大,希望各位前輩可以著重其中一點進行具體的回答。

還請各位前輩多多指點,提出具體的建議,多謝!

希望各位可以邀請更多行業精英來回答這個問題。


精英不敢當,權作拋磚引玉。

======09/04更新Data Science相關在最後部分=======

==================================

就我所在的信用卡領域來說,大量用到數據分析的主要可以分為risk和marketing兩大部門。

==========1.Risk=========

1.a Modeling

risk score,預測客戶default/charge off的風險。

fraud modeling,預測刷卡fraud的可能性等等

1.b Business Strategy

諸如給客戶確定credit line, APR等都需要用到數據分析,這裡面可能會用到modeling提供的各種score。

1.c Corporation Risk

諸如loss forecasting, capital planning等

1.d Model Validation

隨著Fed等regulator看得越來越緊,model validation的活也越來越多,由此也造就了很多工作機會

1.e 各種ad-hoc

比如看一下這個月的late payment rate,看一下某個類別的消費走勢等,都需要用到數據分析。

2. Marketing

這部分不是很了解,大致包括如何target用戶提高response rate,各種AB test等

另外還有別的部門諸如recovery, collection, cross sell等都會用到數據分析.

=========職位上來說主要分以下幾類========

modeler/statistician

以做modeling為主,當然可能還會涉及到處理data, model implementation, model documentation等,真正的modeling反倒只是很小一塊

做loss forecasting/model validation也可以算在這一塊

Business analyst

主要側重於開發business strategy,相對來說偏重於business sense,需要一定數據分析的基礎,但一般來說不太需要過於複雜的model

Data Analyst

主要側重於prepare data.在有些公司會單獨分列出來,有些公司可能就跟modeler/statistician在一起了,沒有人專門給你pull data.

Manager

顧名思義。。。

另外還有大家都在做(說)的Big data,一般就叫data scientist了

但是金融至少信用卡領域還在跟上,不能跟IT相關的公司比。

=============發展前景===========

就我所了解的,通常越是偏技術的,升職會越難一點。一方面可能是因為有同樣skill set的人比較多,不好往上爬,而偏Business的做久了就很熟悉了,別人不容易插進來。

別一方面也有可能是技術做多了,比較忽視一些soft skills,影響升職。

=============需要用到的知識=======

這個總體來說就是三塊了

1. 統計/數據分析的理論知識

2. 行業相關知識

3. coding,主要是SAS or R, SQL, Excel.

============Data Science/Big Data/Computer Science==========

別外題主提到

「目前正在cousera上學習data science系列課程,學習的軟體是R語言(之前沒有編程基礎)。我希望以後能夠在金融行業從事數據分析工作,在知乎一直關注數據分析、金融、R語言相關話題「

評論里也有人說」怎麼看這都是計算機和數學統計專業內的事情。。。不知道cs專業的做這些前景如何「

一點淺見,信用卡招數據分析相關的職位,要求的專業基本是statistic, econ, math, physics, finance。CS的做這些有點不太對頭,更合適做Data science的工作。

因為銀行的數據大多是structure data,而且數據量也沒有大到big data的地步,SAS還可以搞定。

但是big data對大數銀行來說還是在起步階段,個人覺得的確是以後的一個方面。

比如Fraud相關,涉及到transaction level data,數據量大增,傳統的方法已經非常吃力,Big data是一個很好的切入點。具體怎麼做,我也不知道,還在摸索,望大牛指點。

現階段CS專業更適合去IT相關的公司,即使不做軟體開發,做Data scientist也很有優勢,只需要補習一點統計相關的知識,對CS專業的人來說不難。諸如google, facebook, amazon等都很需要相關人才。金融領域不知道trading之類的有沒有這方便的需要,或者反洗錢之類。

另有一條相關回答,歡迎指正。

銀行怎麼通過信用卡賺錢?


我在美國的銀行做business analytics的。

在回答這個問題時,首先,要做一個分類,當你說金融,你指的什麼,二級投資交易市場(最典型的股市、投資銀行)還是消費金融(最典型的商業銀行、P2P),這兩塊都很大,但又截然不同,特別是從業者都算是金融行業的數據分析,但確是完全不同的兩撥人。我是做消費金融的,消費金融又分為 Spending、 Lending、investing 和 saving四大塊,我來談一下消費金融中lending業務中數據分析的運用。

1. Credit Risk: 這裡面有一整個周期,放款的時候預測還款概率以確定是否放款,到了賬上不僅要繼續預測還款的概率,還要預測提前還款的概率,因為提前還款就沒有利息賺了。如果是信用卡這樣的revolving loan,還要預測增加信用額度他會不會用,不用就別增加了,資金是要錢的。如果出現壞賬,要預測如果追賬或者如果不追賬,還款的概率是多少,以確定哪些賬戶應該採取什麼樣程度的追賬。另外如果是有抵押物的貸款,比如車貸、房貸,還要預測一旦壞賬了抵押物的市場價值。

2. Marketing:同樣按照生命周期分為acquisition和retention兩部分,acquisition主要就是response model,因為信用產品的特徵導致很多時候是在做direct marketing,那麼什麼樣的客戶收到廣告後轉換率最高,這個就需要用數據分析建模來預測,轉化率低的別給他發了 浪費錢。Retention是客戶到了賬上之後預測哪個客戶不高興,有可能會流失(refinance with other lender),趕快慰問一下或者降低下利率。

3. Fraud: 分為First Party Fraud和Third Party Fraud。First Pary包括惡意開戶借款早就想好了不還錢,也包括信息,比如收入造價。Third Party Fraud就主要是身份冒充或者是信用卡被盜這些。Fraud Prevention運用數據主要是利用以前的數據建立classification的模型,對新的transaction進行scoring,對於被認為fraud的概率很高的transaction進行處理,比如信用卡的暫時停用或者打電話給取款人進行確認。Fraud的預防和customer experience之間需要找好平衡,利用scoring model 判斷高危交易就是找到這個平衡的利器。

4.Operation: 畢竟是service行業,operation裡面也有不少數據分析,比如call center要做forecast,預測每天甚至是每半個小時的電話量,可以合理安排人員。周一電話量一般是最高的。

如果想做金融行業的business analytics,可以考慮去美國讀一個Business Analytics(MSBA)的碩士,建模那些東西,自己學還是挺麻煩的,有興趣的話可以看下這個網站: http://www.analyticsguides.com 。專門介紹business analytics專業的。


除了樓上幾位大牛列舉的商業銀行外,資管行業的投研崗和風控崗也會對數據分析能力有較高的要求。其實如果統計學和金融都不差的話,不來資管是有些可惜的。

投研崗這面比較常見的就是需要進行多因子回歸和時間序列分析

  • 線性回歸比較常見的就是用來進行多因子分析,主要目的是分析收益到底從哪裡來。畢竟最簡單的Beta,也是要用2~5年的歷史數據線性回歸求得。在此基礎上如果能對廣義線性回歸、非線性回歸等等,會非常有幫助。基本上大多數宏觀面、基本面的分析都集中在這裡。
  • 時間序列方面則是會稍微偏向技術一點,簡單的時間序列處理,GARCH(1,1)模型要有基本的了解。
  • 此外就是大量的組合優化,績效分析,無外乎還是對數據進一步的結構分析。

投研方面最主要是要對數字背後的經濟學意義加深理解,不能只發現數學上的巧合,還需要通過經濟學原理去驗證這些假設。當然你也可以從經濟學原理出發,通過統計方法來驗證猜想,都是沒有問題的。

另一方向自然就是風控方向了,但所需要的技能還是差不多:

  • 風險因子模型基本上還是上面說的回歸。當然你到了後期會發現其實大家都會算,但維護數據才是核心,於是乖乖去給人家Barra交錢……
  • 時間序列啊,蒙特卡洛啊可以作為一些風控指標的手段。比如模擬一下組合未來一個月表現10萬次,然後根據結果數一下VaR和CVaR。當然你自己積分積出來也不是不可以……

初步的話還是推薦你能在因子模型上有所建樹,你看大部分被動基金的基金經理,其實絕大多數都是學統計出來的,原因就是他們有能力把標的指數的風險已經解構的很細,然後根據數據結果尋找出相同因子的組合持倉。做的好的,可能只買幾十隻股票,就能做到跟滬深300、標普500這種上百隻成分股指數走勢完全相同。

補充一下,金融學的數學分析一定要建立在嚴謹的經濟理論和財務理論上才站的住腳,否則任何數據上的結果都是在耍流氓。舉個例子的話,金融專業相對於經濟專業,就好比機械工程專業相對於物理專業,重點都是在某一特殊領域應用某些知識理論的學科。並不是說,你數學好就一定能有所斬獲云云。

技能樹的話,還是建議在金融和統計上繼續往前走,順便熟練一些工具。(你已經開始了R,但很有可能還沒接觸過使用資料庫,建議混合著熟練使用。)

啊,打字好累啊。


我討厭目前吹得玄乎其玄的「雲計算」、「大數據」、「互聯網思維」等概念。跟著這些概念走,運氣好則是個跟班,不好則是墊背。「空談誤國,實幹興邦」,下面以銀行業的小部分內容講述我個人對金融數據分析的理解,僅為數據分析的冰山一角。保險、證券以及金融的其他領域、銀行業其他內容的不是我的領域,不在下文討論範圍。

一、數據分析為決策服務,脫離管理和業務的數據分析都是耍流氓

數據分析與業務需求或管理需求緊密結合。數據在管理方面的應用,指處理數據得出,對人力、資源、業務進行合理客觀的評價指標,促使行為其合乎管理要求,涉及考核、審計。業務則指使用數據進行市場分析、盈虧預測、風險評估,是進行決策的重要依據。

舉兩個管理方面的例子。其一,群體分析。「人盡其才,物盡其用」,銀行希望ATM設備(下文簡稱設備)盈利能力更強,除去電費以外,通常其對外服務時間越長盈利便越多。因此會從設備定時報送的狀態中抽取各類的設備模塊狀態進行處理,計算單台設備、各地區、各設備品牌的有關開機、故障、使用情況等多方面的指標。使用指標對管理進行評價考核,可一定程度上促進銀行ATM管理水平、服務水平的提高;可促進設備廠商優化設備硬體和維保水平。

其二,單體分析的例子,ATM報廢預測。需綜合考慮設備價格、使用年限、使用量、交易量、交易額、盈利、維保價格、故障數、故障率等指標綜合分析。然而分析的結果不是決策,而是作為決策依據的部分提供給上級審定。

再舉些業務的例子。根據某地區某行業往年企業數、企業大小、貿易量、貿易額、客戶數、流動率等數據計算並預測今後該行業的走向,輔助決定是否需關注該行業。又如,根據片區的ATM的所有狀況,自動計算制定加鈔計劃,包括計算最佳加鈔頻率、金額和路線。

假若去分析「哪個地區刷卡多」、「男人還是女人更捨得買理財產品」等數據,除了能博君一笑以外,於企業的管理乃至業務拓展沒有實質性的幫助。但我們轉換一下,去分析「這個地區往年的刷卡量與變化趨勢」、「理財產品的主力人群」等,便有所裨益了。

二、數據分析沒有特定的崗位,它是輔助決策的一門工具

技術部門、業務部門共同實現數據分析。通常而言,業務接到上級部門管理上的需求,或有業務發展需要時,便向技術部門提出具體數據分析需求。而後業務技術共同探討乃至實現。如反恐、反洗錢等需求。在此過程中,業務人員充當管理者、業務員,也參與數據分析模型的構建;技術人員充當數據管理員、編碼者的角色,也參與數據分析模型的實現。

當數據分析用程序實現後,通過定時批量或報表化的手段呈現時,稱之為自動化、常態化,俗稱跑批、出報表。此時技術業務都應持續對數據的分析的結果進行觀測驗證,逐步完善修正數據分析模型。數據分析模型的好壞,如概括性、容錯性,影響著評價指標的客觀性和公平性,乃至影響決策。

三、注重企業聲譽,著重系統安全,尊重客戶隱私

銀行系統不同其他系統,系統安全穩定是的第一位的,關乎社會民生。無論數據分析是否處理大量數據,都應把系統安全放在首位。如考慮業務拓展帶來的數據量增長、異常情況的例外處理等。尊重客戶隱私指謹慎接觸謹慎處理謹慎呈現有關客戶的數據。在我們這邊有明顯許可權限制,接觸使用數據都應走流程走審批。看起來雖繁瑣卻是保護企業保護系統保護數據分析者自身的安全。

四、有關數據分析應具備的能力:

先講一個經歷,應聘現在這份工作時,我和老總發生過有趣的對話:

——你會編程嗎

——會的,以前學過C語言,做過機械控制(就是單片機嘛,= = ||)

——那你會JAVA嗎

——不太會,僅僅是在課堂上學過,交過作業而已

——哦,那你會資料庫吧

——(心慌地)呃,不會哎,也沒有學過(完蛋了,肯定拿不到OFFER)

——英語怎麼樣,四級還是六級

——剛過六級,嗯,分數有點,呃三個四(上心下心)

——哈哈哈哈……

做數據分析,不懂編程沒有關係,編程可以交由技術人員實現。遇到過反覆質疑我數據準確性的同事,後來通過向其解釋業務規則、討論規則消除其質疑;身邊也有因統計口徑、計算公式變化等需求不斷更改而反覆更改代碼的無怨無悔的隊友。因此我覺得做數據分析,一定要精通業務規則,有能力建立具體到公式的明確的數據加工模型。懂得數理統計是最好的,具有快速處理能力更佳。金融數據具有私密性,對數據的處理也需要通過規定的流程進行。能夠快速建模、精準建模的要求一定搶手。非要學習編程,首推JAVA,其次是C、Shell腳本。我無意評價R語言的優劣,但由於歷史的積累和穩定安全性的要求,銀行目前使用的語言主要為JAVACCOBOL。


和銀行打交道比較多,數據分析在銀行的話分幾個部分。第一個部分是傳統數據倉庫,主要是績效考核,風險管理,1104報表等,這個在目前還是分析的主要內容。第二個階段主要是大數據的分析,包括用數據挖掘實現精準營銷,客戶細分,輿論監控等。第三部分是實時的分析,例如基於lbs的業務推薦,實時反欺詐等。


客戶細分;客戶流失;交叉銷售;營銷響應;客戶滿意度分析;信用卡欺詐管理;貸款信用風險管理;


稽核,非現場數據分析。


礦工...http://www.zhihu.com/topic/19557481


推薦閱讀:

數據分析和財務分析之間有哪些可以相互借鑒的地方?
數學建模可以用來做哪些有趣的事?
如何看待yandex開源clickhouse這個列式文檔資料庫?
分析數據應用圖表進行可視化時,如何判斷使用哪些圖表能最有效地展現數據?
數據分析,除了Excel數據透視表,還有什麼工具?

TAG:數據分析 | 期貨 | 證券 | 金融 | 金融市場 |