數據分析師的主要工作有哪些?發展前景如何?需要掌握哪些相關知識?

大家好像都只回答了第一三個問題,跳過了第二個問題。個人很想知道第二個問題的答案,謝謝大家。


很多剛入門的知友問如何學習數據分析,我錄了個視頻,用案例講了怎樣做數據分析,數據分析方法論,以及涉及哪些知識領域,請點擊http://dwz.cn/data-go訪問。

如果您看完下圖了解到數據分析該如何入門,請隨手點贊,謝謝~~

數據分析知識結構簡明圖

正確的邏輯是:「方法論」(右圖)指導「數據分析方法」的使用,分析工具(Python、R等)支撐「數據分析方法」,在學習工具的同時,千萬不要忘記方法論的指導。

=以下寫於2010年左右=

BI從業好幾年,本文原本是寫給自己看的,希望通過對BI的淺析,理清思路,找准方向,繼續前行。現在覺得分享一下心得,讓大家拍拍磚、挑挑刺兒也不錯

什麼是商業智能?

商業智能=商業+智能

商業和智能的關係,如圖1:智能技術根據商業知識,出報表和建立分析模型,並且運用商業知識檢驗和解釋報表和模型準確與否,而根據出來的報表和分析/挖掘模型結果,又能對商業運作提供數據與決策參考。

圖1 商業智能=商業+智能

首先是商業檢驗智能技術。商業目標以及商務流程,限定了你能選用的分析方法,比如客戶分類問題,就不能用聚類演算法解決;商務流程上無法給樣本本身打上標籤,就很難用分類演算法訓練模型。忘掉啤酒和尿布吧,那只是個號稱刊登在《哈佛商業評論》上的傳說,這種業務上很難解釋的事件被傳得神乎其神,如果是真的,早被廣泛應用了。所以模型一定要在商業上解釋得通,通常一兩個小概率小範圍事件對整體是不會有很大影響的。好比看起來不錯的創新點子,不可能將其實現就產生賺錢的產業鏈,而是要考慮方方面面的因素以及有效的執行。

其次是智能技術指導商業行為。比如埃森哲利用數據挖掘對市場/客戶進行細分,針對不同行為特徵的客戶,推薦/制定產品,以期更貼近客戶的需求,利用技術指導商業。這是一個考驗執行力的過程。目前許多案例往往是不成功的,其中一個原因在於市場部處於一線經營,主導地位,其話語權通常大於技術部。假設你是一線經營人員,有自己的立場、觀點、人脈、營銷模式,甚至諱莫如深的自身利益。讓業務人員從工作習慣上去改變,尚且不易,更不用說觸碰到他們的利益線了。所以國內很多大型國有企業做出來的BI系統,很多是做表面文章,耗資百萬的系統做好了卻閑置。

拋開立場、自身利益因素不談,國內BI就做得很好了么?答案當然是否定的,這是因為,業務人員不懂技術,技術人員不懂業務。筆者曾經見過一個在移動內部,做了七八年的技術人員,因為有較長的從業經驗,跟業務人員溝通比較多,只要業務人員提需求,他就能在極短時間內給出數據,甚至能引導迷糊的業務員理清思路。但他的經驗,很難複製,畢竟出了學校,培養一名商業智能從業者應該只有少於1年的時間。

那麼讓我們從商業和智能的角度,來看看知識分解吧,可以供初學者參考,也可以供高手拍磚,如圖2

圖2

數據和數據倉庫

數據是數據分析的基礎,資料庫是數據的承載,數據倉庫是有主題的資料庫。

效率高的數據倉庫不那麼容易設計出來的,多大數據量使用範式設計,多大使用反範式設計,為什麼使用反範式設計(空間換時間),哪些表在業務上使用頻繁需要分割,哪些欄位需要合併成一張常用表等等。

涉及到數據分析的一個問題是數據質量。數據質量又可以分成兩大塊,「臟」數據的處理和數據來源口徑的追溯。前面舉的啤酒尿布例子,得到不符合常理的結果後,應該首先檢查數據質量是否有問題。若數據質量有問題,那麼後面的分析必然不準確,所謂garbage in garbage out!

報表

報表這種原始的BI方式有時候是簡單有效,但要做一張優秀的報表似乎又要考慮很多問題。首先是確定報表的目的,這樣才能定下報表是清單級還是匯總級;其次選擇欄位,個人認為應該符合MECE(Mutually Exclusive Collectively Exhaustive),信息不全或者信息冗餘,對分析都會形成干擾;再次是對欄位做維度聚類,並做重要性排序,重要的,能做分析思路索引的,要排在前面。當然一張優秀的報表絕不應拘泥於以上,需要在工作中多思考和體會了。

數據挖掘

數據挖掘講了很多了。如果往簡單來說,可以有BI=圖表+數據挖掘的理解,雖然不甚全面。數據挖掘作為報表這種非智能性BI的一種補充,理論上應該屬於機器學習的一種,存在著那麼一點兒讓計算機自學的能力。按演算法來分類也就預測、分類、聚類、關聯那麼幾種,大多都封裝好的,使用起來很方便,普通應用只需要知道怎麼讀數據挖掘軟體給出的報告即可,關鍵點是緊扣商業理解,難點和被忽視的地方會在接下來的演算法知識塊提到。至於SAS, SPSS,Modeler, R, MATLAB這些挖掘工具之爭,那就見仁見智了。但有一點我很肯定,如果你初學數據挖掘,那麼推薦Modeler,簡單的操作界面和輕鬆的DEMO,大大降低了數據挖掘的入門難度。

演算法

隨著面向對象(Orient Object)編程方法興起,「程序=數據結構+演算法」【1】的光榮時代似乎已經一去不復返。如今許多分析人員也不曾聽過Knuth【2】和他的The Art of Computer Programming。有一種觀點是,在各工具將演算法封裝得很好的情況下,深入了解演算法似乎是沒必要的——Just run it。的確,如果你只想做到中級分析師,可以不去理會。但是要成為一名高級分析師,那肯定得有一定深度的研究。一是為了知道針對特定的數據集,選用什麼樣的演算法,如何抽取樣本,抽取多大量的樣本(樣本出問題,整個項目都完蛋),演算法適用條件是什麼,比如線性回歸的:獨立性、常方差、正態性,怎麼理解,哪些必須滿足。這些使用如果不熟悉的話,很容易導致分析出問題。一些做這方面工作的BIer,不求甚解,做出來的東西是錯的,做分析最可怕的是錯了還沒意識!二是客戶問到一些問題,知道如何去解釋,比如用決策樹計算出來的得分,為什麼很多樣本得分是一樣的?客戶細分中,有沒有演算法可以使得同一個客戶細分至兩個不同的客戶群?沒有的話,如何用現有演算法解決該客戶既有A群屬性又有B群屬性的問題?三是你能寫出針對特定問題的演算法,現實中許多問題擁有其他問題一樣的共性,也有它自己的個性,某些時候針對個性的東西越強,分析效果越好,這就需要你手寫演算法解決。獲得Netflix 100萬推薦演算法大獎的絕不可能是封裝好的現成演算法不是么。另外還有一類商業智能問題,是封裝演算法解決不了的,這類問題大多見於與地理結合的GIS決策系統,這類系統就要求分析人員有圖形演算法功底。可見如果你想成為頂級的數據分析師,演算法與數據結構的知識必不可少。搜索,排序,樹,圖之所以經典,是因為它們簡單有效而且通用。如果你能把這些演算法在資料庫里實現,那麼你分析技術這方面,確實達到很高的境界了。

統計學與其中的分析邏輯問題

商業分析中應用統計學的好處在於,你可以不知道兩者的因果而只分析兩者的聯繫,並且在環境沒有太多改變的情況下,分析結果都是適用的(更複雜的需要使用微分方程或其他,但提升度未必高)。關於邏輯,我們來看一個例子:據科學家研究,肥胖的人在社交關係上會聚集在一起。如圖3,如果你的朋友肥胖,則你肥胖的概率比別人高45%(紫柱),如果你朋友的朋友肥胖,則比平均高出25%(紅柱),如果你朋友的朋友的朋友肥胖,則比平均高出10%(橙柱)。事實上,這些都是數據和統計,只能說明肥胖的人可能會聚集到一塊兒,因為從數據上你無法分辨出你們是因為肥胖而成為朋友(比如因肥胖到健身房認識)還是因為成為朋友而肥胖(吃貨朋友一起去吃東西),或者互為因果。實際分析中,我們經常發現兩樣事物是互為因果互相加強的,「事物有普遍聯繫」和「作用與反作用」的哲學原理在此體現得淋漓盡致。業務經驗在此時顯得尤為重要!它能告訴我們哪件因素更重要,一般對於業務人員來說更好實現的過程,更好掌控的因素,就是原因,是我們後續操作的引線和突破口。

圖3

關於商業,筆者是技術出身,也處於摸爬階段。但可以推薦兩本書,這兩本書是都是國外的,較厚易懂:菲利普科特勒《市場營銷》,斯蒂芬魯賓斯的《管理學》【3】。商業與技術是存在聯繫的。其實細心的讀者會發現,光是有上面的知識還是不夠的,紙上得來終覺淺,絕知要做項目呀:)

增值知識

作為分析師寬廣的知識面必不可少,沒事看看心理學、歷史、地理、人口統計學(demography),瀏覽一下知乎,FT中文網什麼的,也是不錯的。

很多優秀的數據信息圖、資料、報告只有英文的,例如:

數據信息圖information aesthetics、FlowingData | Visualization and Statistics、Visually | Infographic Design Presentation and Video Creation

資料OReilly Radar、Business Insider

報告2030年的中國-世行分析報告完整版.pdf

國外在數據規劃使用展現比我們前行更遠,這點是確認無疑的。所以英文閱讀流暢的能力對於一個想當優秀分析師的人來說非常重要。我也曾經想過把一些比較不錯的文檔翻譯過來,但因為相當耗時耗力,只能作罷。與其等待別人翻譯,不如自己看。

總結一下:商業智能,是利用計算機對數據大量快速處理的特點,對眾多商業數據做圖與表的展現分析,並通過統計學的方法對數據進行智能學習和挖掘,輔助商業決策。商業智能的優勢就在於它對海量數據的處理,以及可規則化邏輯化(這點部分繼承了數學的DNA),這些雜亂的數據讓人去處理和挖掘有用信息,基本是不可能的。

商業智能目前處於初始階段,數據倉庫準備、跨行業經驗整合、商業及技術知識儲備、人才培養模式都還剛剛起步。國內BI也還處於積累階段,都是一些有錢的企業在做試驗案例,成敗不一。BI從業人員有混生計的,也有認真積累的;有先行者,也有後起之秀。

總之,BI離爆發還有一段路要走,沒有量的積累,就沒有質的飛躍!要想飛躍,你必須完成爬行、站立、走、跑等一系列動作,辛苦甚至痛苦,但這些,在飛躍的那一刻,都會化為喜悅。

上文幾年前寫的了,環境和經歷已經有了一些變化,有空再更新。

備註:

【1】語出尼克勞斯·沃思(Niklaus Wirth),圖靈獎獲得者,Pascal發明人。

【2】斯坦福大學計算機程序設計藝術的榮譽退休教授,演算法和程序設計技術的先驅者。1974年獲美國計算機協會圖靈獎,1979年美國前總統卡特授予的科學金獎以及1996年11月由於發明先進技術榮獲的極受尊重的京都獎。

【3】兩本經典,購買鏈接:

《市場營銷》http://www.amazon.cn/%E8%90%A5%E9%94%80%E7%AE%A1%E7%90%86-%E8%8F%B2%E5%88%A9%E6%99%AE%C2%B7%E7%A7%91%E7%89%B9%E5%8B%92/dp/B002V1HN38/ref=sr_1_3?ie=UTF8qid=1337241642sr=8-3

《管理學》http://www.amazon.cn/%E7%AE%A1%E7%90%86%E5%AD%A6-%E6%96%AF%E8%92%82%E8%8A%AC%C2%B7P-%E7%BD%97%E5%AE%BE%E6%96%AF/dp/B001ORFTWW/ref=sr_1_1?s=booksie=UTF8qid=1337241679sr=1-1

--------------------------------分割線---------------------

很多人問怎麼學習數據分析,首先你得花2周時間把上面的知識結構過一遍,其次再找人帶,做項目是最好的辦法。


樓主美國應用數學優化專業碩士,現在海德堡大學交叉學科計算中心和圖像處理中心博士在讀,專攻數據科學的應用。下面逐個回答。

1, 數據分析看成技術諮詢,目標是為客戶分析數據,這些數據可以是行業數據,用戶行為數據,科學實驗數據等,主要工作: 拿到數據,數學建模,設計演算法,編程實現演算法,代入數據看結果如何,如果不行,從數學建模那一步開始反覆。最後給客戶做report報告,並且由大數據中得到的想要的數據做相關推斷(比如根據用戶行為來制定產品下一步策略,但這一步通常由客戶做)。
關於此處更具體的回答,參見:
Data Science/Analytics 出身,可以在諮詢行業做些什麼? - Ruobing Shen 的回答

2,前景非常非常好,市場長期處於緊缺狀態。
不知道大家有沒有聽說過,美國CS TOP4(CMU,MIT,Stanford,Berkeley)畢業的機器學習/深度計算的PhD,都是被Google/微軟/FB/蘋果年薪100w美刀瘋搶的,可謂炙手可熱。另外提供身邊德國同學的例子,德國TU9系列計算機視覺碩士畢業,號稱年薪5w歐元起,主要是進一些車企,研究自動駕駛方面的圖像處理問題。要知道在德國,碩士畢業平均年薪是絕對不到3w5歐元的。也就是比行業平均高出43%。
最後國內,百度/阿里/騰訊都有自己的深度學習實驗室,各個新興創業公司也在爭相進入分一杯羹,重點介紹倆個為與創始人都有所接觸的本專業的大數據公司:
(1)航空領域的大數據諮詢 上海悠樺林信息科技
GIT的PhD回國創立的,眾所周知GIT是美國運籌排TOP 3的,此公司班底基本清一色GIT的校友,貌似也和GIT的幾個教授合作讓他們做顧問。不過估計教授很忙不care這些小生意,有的是美聯航等大公司的單子。已和國內某航空公司合作。此公司主營業務就是航空里的優化問題,還有物流優化。當然優化能做的東西太多太多,啥諮詢都能接。
(2) 杉樹科技(內點科技)
斯坦福畢業的PhD、現在上海財大教授葛冬冬是主要創始人,裡面幾個科學家基本都是斯坦福班底,包括華人運籌界頂級科學家葉yingyu教授,聘請了職業的CEO掌舵,科學家負責研發和建模,已完成天使融資。勢頭和班底都非常不錯,應該各領域優化都會做,包括航空。已和包括京東在內的大公司合作。
另外一些大家耳熟能詳的,如地平線機器人(百度深度學習研究院( IDL )創始人),大疆(你可知道無人機技術中很重要一點就是圖像處理),今日頭條(沒錯,最近看到頭條舉辦的深度學習大賽了么?),圖森科技(又一家計算機視覺),滴滴打車(前段時間收到HR的演算法工程師的推介,沒錯,滴滴軟體核心技術是駕駛員和乘客的匹配問題還有最短路徑問題),順豐工業工程部門(研究倉庫選址問題,送貨問題,還有經典的TSP問題),菜鳥網路(阿里巴巴旗下的物流科研中心),自然語言處理方向的公司,貌似為只知道百度,歡迎補充。還有大數據與精準醫療,智慧城市,物聯網,可以說大數據已無所不在。
舉不勝舉,朝氣蓬勃。

3,簡單得說,需要掌握一定數學基礎(微積分+線性代數)+統計學+優化+計算機編程(+點數據結構)+機器學習(神經網路深度學習是plus)+數學建模能力。
關於這一條,可直接移步:
想學數據分析需要學哪些課程? - Ruobing Shen 的回答

最後歡迎關注@Robin Shen的專欄及關於DIY留學申請的知乎Live:

[運籌帷幄]大數據和人工智慧時代下的運籌學 - 知乎專欄

最後按照慣例廣告一波:

歐洲、北美、全球留學及數據科學深度私人定製諮詢,從此DIY - Ruobing Shen的文章 - 知乎專欄


數據分析師的發展前景

不管是國內還是國外,大數據相關的人才都是供不應求的局面。根據麥肯錫報告,僅僅在美國市場,2018年大數據人才和高級分析專家的人才缺口將高達19萬。此外美國企業還需要150萬位能夠提出正確問題、運用大數據分析結果的大數據相關管理人才。

根據根據Linkedin《2016年中國互聯網最熱職位人才庫報告》,數據分析人才被列為Top6的熱門職位。

可以看出,這些職位都是當下任何互聯網公司要建立發展必不可少的崗位,尤其是數據分析人才,伴隨著大數據在互聯網行業更多的應用而愈加重要。

在這份報告中,數據分析人才的供給指數最低,僅為0.05,相當於20個職位同時在競爭一個求職者。這在一定程度上反映了行業現狀,很多互聯網公司 都逐漸意識到了數據的重要性,但卻缺乏相關的專業人才來分析和管理數據。

數據來源:LinkedIn:2016年中國互聯網最熱職位人才庫報告

很多學習數據分析的同學也都有這樣一種困惑「為什麼學了那麼多工具,還是不會數據分析?」,原因無外乎兩個,一是只學到了碎片的知識,沒有建立知識之間的連接,無法形式自己的知識體系,二是缺乏實踐,導致無法形成「知行合一」的工作技能。

如何系統學習數據分析?

在學習數據分析之前應該明白幾點

  • 數據初期的準備通常占整個數據挖掘項目工作量的70%左右。
  • 數據分析師本身融合了業務知識、統計學和計算機等學科,並不是新的技術。
  • 數據分析更適合業務人員學習(相比技術人員學習業務來的更高效)
  • 數據分析項目通常需要重複一些毫無技術含量的工作。

職業規劃

以數據分析師為例,先看一下國內知名互聯網數據分析師的招聘要求:

  • 計算機、統計學、數學等相關專業本科及以上學歷;
  • 具有深厚的統計學、數據挖掘知識,熟悉數據倉庫和數據挖掘的相關技術,能夠熟練地使用SQL;
  • 三年以上具有海量數據挖掘、分析相關項目實施的工作經驗,參與過較完整的數據採集、整理、分析和建模工作;
  • 對商業和業務邏輯敏感,熟悉傳統行業數據挖掘背景、了解市場特點及用戶需求,有互聯網相關行業背景,有網站用戶行為研究和文本挖掘經驗尤佳;
  • 具備良好的邏輯分析能力、組織溝通能力和團隊精神;
  • 富有創新精神,充滿激情,樂於接受挑戰

前三個屬於硬體要求,一般而言,有專業基礎(計算機、統計學、數學等相關專業)入行需要3個月以上的學習。對於非專業背景的同學,入行的時間可能需要的更長,建議給自己預留6-12月的時間。而要成為一個熟手(企業用工需求最多)則需要2-3年以上的行業經驗。

Anyway,作為一門對數學和計算機都有較高要求的一門交叉學科,從事大數據是有一定門檻的,但相對於10年以上的職業生涯(國外頂尖數據科學家50-60歲仍然十分活躍),預備半年的時間來學習這個最炙手可熱的技能還是很划算的。

從業務開始

學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。技術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合行業之後就能夠獨當一面了,一方面有利於抓住用戶痛點和剛性需求,另一方面能夠累計行業經驗,使用互聯網思維跨界讓你更容易取得成功。不要在學習技術時想要面面俱到,這樣會失去你的核心競爭力。

大數據是技術工具,最終的應用需要深入理解業務企業的業務場景和商業模式,甚至有人說不懂業務就不要談大數據,可見領域知識的重要性。值得一提的是,近幾年在頂尖科學雜誌《Nature》與《Science》上發表的大數據文章都是來自行業專家,而並非計算機專家,這從另外一個方面反映了業務知識的重要性。

get技能

數學知識

數學知識是數據分析師的基礎知識。對於初級數據分析師,了解一些描述統計相關的基礎內容,有一定的公式計算能力即可,了解常用統計模型演算法則是加分。對於高級數據分析師,統計模型相關知識是必備能力,線性代數(主要是矩陣計算相關知識)最好也有一定的了解。

分析工具

對於初級數據分析師,玩轉Excel是必須的,數據透視表和公式使用必須熟練,VBA是加分。另外,還要學會一個統計分析工具,SPSS作為入門是比較好的。對於高級數據分析師,使用分析工具是核心能力, SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。

編程語言

對於初級數據分析師,會寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。對於高級數據分析師,除了SQL以外,學習Python是很有必要的,用來獲取和處理數據都是事半功倍。當然其他編程語言也是可以的。

勤於學習

大數據時代的知識,沒有像印刷時代對知識結構視為必須具備的「基礎」知識,知識是非線性的,可以自由組合、切割,處於一種分散和遊離的狀態。未來,你必須具備快速自學和捕捉知識的能力,學習將從一個「知識儲備,學以致用」的過程,向「知識構建,用時再學」的過程轉變,學習將是一個持續的,乃至終身學習的過程。為此你需要具備一種快速而靈活的學習方式。

參與一次系統培訓:

系統培訓能夠幫你規劃並實施一個系統的學習方案,會在你起步的時候構建一個比較紮實的基礎知識框架,這個過程和蓋樓時先打地基的道理是一樣的,地基打的越深,樓房才能蓋的越高。具備項目經驗的講師會講授很多實際工作中的項目經驗,可以帶領大家快速進入正確的學習通道,少走彎路。當然,培訓取代不了工作實踐,如前所述,多在工作中積累業務經驗,技能水平才能提升的更快。

在社區快速學習:

在國外,除了大學,社區形式的學習平台(如http://PPV課-專註大數據培訓-國內領先的大數據學習社區、KNIME)由於知識更新快,學習時間更加靈活,形成了獨特的社區學習(community learning)現象。社區里不但有初學者(freshman),也是不少頂尖技術專家(Veteran)光顧的地方。社區是一個自由、無中心的交流學習平台,沒有權威,一切都可以質疑和挑戰。當然,如果要和這些高手過招,你必須先打好英語基礎。未來,社區將成為從業者技能get、快速充電的重要渠道,社區或將成為繼高等學校、職業學校以外的一個「無圍牆」的校園。

《大數據-機器學習脫產就業班》第3期 ,深圳6月13號,僅20席名額!


作為一個曾經工作過九個月的數據分析師來答一發,並且只回答題主說沒人答的第二個問題。

今年我剛畢業找工作時也以為數據分析師就是大多數回答寫的那樣,比如@Robin Shen老師說的(沒有冒犯的意思):數學基礎(微積分+線性代數)+統計學+優化+計算機編程(+點數據結構)+機器學習(神經網路深度學習是plus)+數學建模能力。

聽起來炫酷極了,估計也吸引了不少像我一樣,身懷技術熱情的在校懵懂少年。然而國內大多數互聯網公司對數據分析師職位的預期要求可不是我們想的這樣。

先推薦我的前同事,一位資深的數據產品經理寫的一篇文章,來感受一下數據分析師的痛處:數據分析師之痛

以下這張圖是比較真實的反映出我這九個月,或者我組同事的工作內容的:

數據分析師在很多公司都會負責給運營,產品人員提數,做報表,基本上快成為一個提數機器或者報表小王子(以前的我。

特別是對於新手數據分析師,很多自認專業,有資歷的運營經理並不會聽取你從數據上給他們的建議,他們只會儘可能要更多的數據,更多的報表(也許他們自己也不知道想要什麼數據),而大多數時候由於KPI的原因你還沒什麼反抗之力。

這在給數據分析師加大了工作壓力的同時也摧毀了他們對於數據的熱情(別問我為什麼知道。所以我認為數據分析師的發展前景基本上可以分為:

  1. 去專業的大公司(也分部門,老大),他們有嚴格的項目迭代過程,並且很多運營人員會簡單的取數,數據分析師不僅可以從繁雜的取數工作中脫離出來,還可以親自參與到整個分析過程,對業務邏輯,數據分析方法論的提升有很大的好處。職業發展大概是:高級數據分析師---數據分析主管---數據經理等(也可轉數據產品經理)。
  2. 轉行做數據挖掘,機器學習。我曾經和一個朋友聊天,說做數據分析師簡直沒有人權,產品運營都在壓榨你。他說,所以我現在去做演算法了,他們都要聽我的。

最後講幾個真實趣事,可以感受數據分析師之痛:

  1. 曾經我的一個運營同事扔了一個70多欄位的BI報表需求給我們,並且未事先溝通。
  2. 某運營新人剛入職,其老大命令他來我們工位催一個活動的分析數據,他幾乎跪在地上說:老大說我拿不到數據今晚就別下去了。當時已經下班了,活動需求還是臨時提的。

以上


目前在法國一個數據諮詢公司工作,剛剛起步,幾乎每天都有感觸。一開始也很注重技術,畢竟剛剛從學術的氛圍中做出來,對數學模型的準確性很痴心。後來也漸漸領悟智能只是一部分,最終要和商業結合在一起才體現價值。數據分析定位維度的精準是第一步,以及能將模型語言轉化成可執行戰略。對數據的敏銳性需要磨練,商業視野更是需要日積月累的項目經驗。共勉之。


1、態度嚴謹負責

嚴謹負責是數據分析師的必備素質之一,只有本著嚴謹負責的態度,才能保證數據的客觀、準確。在企業里,數據分析師可以說是企業的醫生,他們通過對企業運營數據的分析,為企業尋找癥結及問題。一名合格的數據分析師,應具有嚴謹、負責的態度,保持中立立場,客觀評價企業發展過程中存在的問題,為決策層提供有效的參考依據;不應受其他因素影響而更改數據,隱瞞企業存在的問題,這樣做對企業發展是非常不利的,甚至會造成嚴重的後果。而且,對數據分析師自身來說,也是前途盡毀,從此以後所做的數據分析結果都將受到質疑,因為你已經不再是可信賴的人,在同事、領導、客戶面前已經失去了信任。所以,作為一名數據分析師就必須持有嚴謹負責的態度,這也是最基本的職業道德。

2、好奇心強烈

好奇心人皆有之,但是作為數據分析師,這份好奇心就應該更強烈,要積極主動地發現和挖掘隱藏在數據內部的真相。在數據分析師的腦子裡,應該充滿著無數個「為什麼」,為什麼是這樣的結果,為什麼不是那樣的結果,導致這個結果的原因是什麼,為什麼結果不是預期的那樣等等。這一系列問題都要在進行數據分析時提出來,並且通過數據分析,給自己一個滿意的答案。越是優秀的數據分析師,好奇心也越不容易滿足,回答了一個問題,又會拋出一個新的問題,繼續研究下去。只有擁有了這樣一種刨根問底的精神,才會對數據和結論保持敏感,繼而順藤摸瓜,找出數據背後的真相。

3、邏輯思維清晰

除了一顆探索真相的好奇心,數據分析師還需要具備縝密的思維和清晰的邏輯推理能力。我記得有位大師說過:結構為王。何謂結構,結構就是我們常說的邏輯,不論說話還是寫文章,都要有條理,有目的,不可眉毛鬍子一把抓,不分主次。

通常從事數據分析時所面對的商業問題都是較為複雜的,我們要考慮錯綜複雜的成因,分析所面對的各種複雜的環境因素,並在若干發展可能性中選擇一個最優的方向。這就需要我們對事實有足夠的了解,同時也需要我們能真正理清問題的整體以及局部的結構,在深度思考後,理清結構中相互的邏輯關係,只有這樣才能真正客觀地、科學地找到商業問題的答案。

4、擅長模仿

在做數據分析時,有自己的想法固然重要,但是「前車之鑒」也是非常有必要學習的,它能幫助數據分析師迅速地成長,因此,模仿是快速提高學習成果的有效方法。這裡說的模仿主要是參考他人優秀的分析思路和方法,而並不是說直接「照搬」。成功的模仿需要領會他人方法精髓,理解其分析原理,透過表面達到實質。萬變不離其宗,要善於將這些精華轉化為自己的知識,否則,只能是「一直在模仿,從未超越過」。

5、勇於創新

通過模仿可以借鑒他人的成功經驗,但模仿的時間不宜太長,並且建議每次模仿後都要進行總結,提出可以改進的地方,甚至要有所創新。創新是一個優秀數據分析師應具備的精神,只有不斷的創新,才能提高自己的分析水平,使自己站在更高的角度來分析問題,為整個研究領域乃至社會帶來更多的價值。現在的分析方法和研究課題千變萬化,墨守成規是無法很好地解決所面臨的新問題的。 http://www.datatea.com


發展前景當然沒得說,未來數據分析崗位空缺達到數百萬。數據分析,大數據,互聯網是相通的,前沿的技術能有效解決傳統問題,並能創造出更具體驗的產品。比如百度遷徙,足球預測,軍事預測,股票等,待開發的領域很多。掌握技能可以看這篇文章:CDA學習規劃-CDA數據分析師官網


自己也算是新人,說說自己的感受吧

工作方向很多,數據分布在各行各業,只不過這幾年像電商這樣的比較火。在title為數據分析師下,具體還是有很多不同,可能就是做報表的,有做些偏ETL的,也有做行業研究的,也有做偏向數據挖掘的,具體做哪個跟崗位的要求有關,也跟自己的特點,能力有關。

至於前進,我舉得也不像外面傳的什麼大數據時代這樣,但是所謂行行出狀元么。

需要的知識:統計學相關知識,必要的計算機能力,相關的分析軟體使用,更重要的是你所在分析行業,業務的熟知度,千萬不要成為理論家。


對數據分析師的職能素質要求在實際工作中,每個企業都會對數據分析師定崗定職,對不同職能和崗位的分析師要求不同。

工作方向劃分

數據分析師按照工作方向可分為技術型分析師和業務型分析師。

1.技術型分析師

技術型分析師的角色包括數據工程師、挖掘工程師、數據科學家、建模工程師、數據架構師、ETL工程師等,這些稱謂都或多或少代表了其工作性質。

技術型分析師的崗位目標側重於底層數據收集與存儲、數據整合與清洗、數據平台搭建、數據智能產品開發和維護等工作。

技術型分析師要求其在所從事的領域具有相應的專業技術技能,能通過技術途徑解決與數據相關的問題;同時,更重要也更容易被各企業忽視的是,技術型分析師如果與業務有直接的對接關係,同樣需要具備基本業務常識和理解能力。技術型分析師能從事的崗位有數據工程師、挖掘工程師、建模工程師等。

2.業務型分析師

業務型分析師的角色包括市場分析師、數據分析師,網站分析師也因通常被認為是業務型分析師而被歸入業務體系中。業務型分析師的崗位目標側重於通過數據直接服務於業務方的日常工作,如日常業務數據輸出、專項業務問題研究、市場研究輸出等。業務型分析師要求具備服務對象的基本常識,同時需要結合技術技能為業務提供數據支持服務,因此需要相對複合型的知識體系。區別於技術型分析師對業務的理解,業務型數據分析師不僅要了解業務需求,更要具備將數據知識轉化為業務價值的能力,通過數據落地推動數據價值實現。

工作職位劃分不同

職位的數據分析師的職能及要求不同,大多數中小型企業會將數據分析師分為高、中、低三個層次,某些大型或特大型企業會做更細的層次劃分,比如會設置不同的分析師級別,會有首席分析師、領隊分析師等。這裡僅以低、中、高級三個層次來說明不同層次數據分析師的基本素質要求。

1.初級分析師

初級分析師是數據人員架構的基礎組成部分,承擔了數據工作中大多數最基礎的工作,通常初級分析師的人員比例不應超過20%。

初級分析師的定位是數據整理、數據統計和基本數據輸出工作,服務的對象包括中、高級分析師和業務方等,對其素質的要求側重於基本數據技能和業務常識。

?數據工具要求。基本的Excel操作能力和SQL取數能力、與工作相關工具的使用技能,順利完成數據抽取和整理等工作;基本數據輸出能力,包括PPT、郵件、Word等使用能力。

?數據知識要求。理解日常數據體系內涉及的維度、指標、模型,輔助中、高級分析師進行專項工作並承擔其中的部分工作。

?業務知識要求。理解基本業務知識,能把業務場景和業務需求分別用數據轉換和表達出來。

2.中級分析師

中級分析師是數據人員架構中的主幹。中級分析師承擔著公司的專項數據分析工作,如各業務節點的項目類分析、專題報告等。通常中級分析師的人員比例在40%~60%之間。中級分析師的定位是數據價值挖掘、提煉和數據溝通落地,服務的對象主要是業務方,除此之外還可能參與高級分析師的大型項目並獨立承擔其中的某個環節。因此要求中級分析師對專項數據技能、業務理解及推動能力的要求較高。

?數據工具要求。熟練使用數據挖掘工具、網站分析工具。

?數據知識要求。了解不同演算法和模型的差異點及最佳實踐場景,根據工作需求應用最佳的實踐方案。

?業務知識要求。深度理解業務知識,具有較強的數據解讀和應用推動能力。

3.高級分析師

高級分析師職位通常是數據職能架構中的火車頭,承擔了企業數據方向的領導職能。高級分析師的人員比例在20%~40%之間。高級分析師的定位是企業數據工作方向規則體系建設、流程建設、制度建設等,服務對象通常是業務及企業領導層。因此要求其除了要具備中級分析師的基本能力外,還需要具備宏觀規劃、時間把控、風險管理、效果管理、成本管理等項目管理能力。

?高級分析師需要能搭建企業數據體系,並根據企業發展階段提出適合當前需求的數據職能和技術架構方案。

?高級分析師需要規划出所負責領域內數據工作方向、內容、排期、投入、產出等,並根據實際工作進行投入與產出分析,同時做好數據風險管理。

?高級分析師需要實時跟進項目的進度,監督數據項目落地執行,並通過會議、彙報、總結、階段性目標、KPI等形式做好過程式控制制和結果控制。低、中、高級不同職位層次數據分析師的能力要求

如圖所示。注意,圖像越向外代表對其相應能力的要求越高,反之則要求越低。

非相關從業人員,最近在看數據分析的書,這一篇是轉載的,轉自:網站數據挖掘與分析:系統方法與商業實踐


業務知識很重要,數據分析只是工具


工作內容:

a.臨時取數分析,比如雙11大促活動分析;產品的流量轉化情況、產品流程優化分析,等等;

b.報表需求分析--比如企業常見的日報、周報、月報、季報、年報、產品報表、流量轉化報表、經營分析報表、KPI報表等等;

c.業務專題分析:

精準營銷分析(用戶畫像分析、營銷對象分析、營銷策略分析、營銷效果分析);

風控分析(策略分析,反欺詐分析,信用狀況分析);

市場研究分析(行業分析、競品分析、市場分析、價格分析、渠道分析、決策分析等等);下面我們探討一下,根數據分析師工作有交叉、技能要求有重疊的另兩個數據崗位數據產品經理、數據挖掘工程師,以及三個崗位之間的聯繫和區別。

數據產品經理要求具備普通產品經理的能力(比如產品設計、產業運營、用戶體驗方面的技能)外,還需要具備數據分析師的技能,掌握簡單的數據分析方法,能夠通過數據需求分析提煉出產品原型,從而將數據產品化,一個公司的數據價值變現成功與否,跟數據產品經理的職業素養有極大的關係。牛逼的數據產品經理,自己也是一個數據分析師,不需要數據分析師的配合工作。

數據分析師,要求不僅要懂得資料庫SQL查詢統計、excel透視分析等技能,牛一點的分析師還需要了解掌握數據挖掘演算法,比如常見的四類模型,分類、聚類、關聯、預測,每一類模型至少掌握一兩種演算法原理,能夠用R/SAS/SPSS等把模型結果跑出來,能夠看出和評判模型結果的好壞,能夠在實際中應用模型的結果。他們跟數據挖掘工程師的差別在數據分析師對演算法的掌握要求不那麼高,只需要會用工具哪怕是可視化可拖拽的工具調用演算法包跑出結果來,會評判會應用結果就可以了。當然啦,牛逼的數據分析師,同時也是一個數據挖掘工程師。數據分析師除了對分析方法的掌握外,還需要非常熟悉業務和產品,能夠透過數據看到業務和產品的本質,他們是最具備商業敏感性的一群人,他們能預測公司和業務的未來,他們是公司數據價值的發現者,他們是產品經理、運營經理的最佳助手。

數據挖掘工程師,不僅需要精通各種模型演算法原理、還要求能用代碼來實現演算法,能對演算法進行優化改進,能對模型進行部署、監控,能對模型進行不斷的迭代優化。同時,還需要掌握大數據研發工程師的部分技能,比如大數據分散式計算方法等。數據挖掘工程師是最稀缺最貴的一類人才,其薪資在各大數據崗位中,平均水平是最高的,漲幅是最大的也是最快的。入門後的數據分析師往數據挖掘工程師轉不失為一條絕佳路徑。當然啦,數據挖掘工程師如果對業務對產品感興趣,往數據分析師、數據產品經理轉,那是非常輕而易舉的事情。

從上面的分析可以看出,數據分析師在職業選擇上,可進可退,可淺可深;在工作的強度上,不像程序員和演算法工程師,一個項目就是一個工程,需要埋頭苦幹,冥思苦想,絞盡腦汁,數據分析師的工作由於比較碎片化,也經常和業務打成一遍,不純屬技術,更有業務的樂趣,所以說數據分析師是最適合女孩子和新入行者作為入門大數據的職業。後期,如果對產品感興趣可以轉數據產品經理,對運營感興趣,可以轉數據化運營經理,對數據挖掘演算法感興趣,可以深入學習演算法,轉數據挖掘工程師。數據分析師也是目前大數據眾多崗位中,企業需求量最大的崗位,所以說是最適合大家作為入門的崗位的。

歡迎大家拍磚指正,歡迎大家關注我的知乎專欄「大數據實踐與職業生涯」並留言,專欄會陸續的推出過往十多年的大數據工作經驗總結和我的一些研究實踐成果。如果你是大數據新人,或者想轉行進入大數據領域,或者職業生涯上存在一些疑惑,都歡迎關注我的知乎live分享「大數據人的職業生涯規劃」 和 「數據分析師-從零入門到精通」。


如果想要做一個合格的數據分析師,阿里巴巴的車品覺在他的《決戰大數據》中提到的,阿里數據化運營的內三板斧——混、通、曬是作為數據分析師需要理解的方法論。

「作為數據分析師,如果不和業務部混在一起,商業敏感就不會憑空出現在你的面前。堅持帶著業務問題來觀察數據或者帶著數據來觀察業務,兼備二者的敏感,就做到「通」,更深層次的通是存在於公司組織中的數據。數據能不能做到在獲取、使用、分享、協同、鏈接、組合之上讓自己變得超級簡單和便捷,這時數據化運營裡面非常重要的一點,正是曬的內容。」


下圖是數據分析師每天的工作時間構成:

發展前景:

關於數據分析師的學習可以到:專註學習互聯網營銷知識系統的學習。


我想知道數據分析師的前景如何 在未來幾年會不被淘汰


像我這樣不聰明,邏輯不好,粗心的人。是不是與這個工作絕緣啦 想要精進自己的工作咋這麼難?


數據分析服務於企業業務發展,可以肯定的說,當前的數據分析還處於嬰兒階段,整個行業還在不斷變革中。從道、法、術的角度看,數據分析重點發力在道和法,可以作為公司業務發展的支撐。數據分析師的未來不應該僅僅局限於工具性人才,更應該注重公司業務,從而實現職業瓶頸的突破。


聽著不錯,如今充斥眼球的」互聯網+、大數據、雲計算「中,我覺得對大數據的整理分析是基礎的工作,不然電商如何跑得贏傳統行業,靠得就是定位精準、營銷手段多元化


做過幾個銀行數據倉庫的項目,掌握了些基本的數據分析工具和財務業務知識,這種情況轉做專職數據分析師優勢如何?


項目數據分析,項目價值挖掘、項目風險控制、項目投資收益、投資決策把握。貴州雲博大數據負責貴州省數據分析師工作,官網:http://www.gzcpda.cn


推薦閱讀:

準備數據分析師秋招,應當如何充實簡歷項目經驗?
泰坦尼克號生存預測——kaggle排名403
乾貨 | 這是一份你急需的數據分析的職業規劃
你值5K還是15K?實戰案例,測測你的分析功力

TAG:職場 | 職業規劃 | 數據分析師 |