一個有三年工作經驗的優秀數據分析師所具備的能力有哪些?怎麼衡量?從哪幾個方面?

想取幾個關鍵欄位去衡量一個有三年工作經驗的數據分析師,因為人在評判一個人的時候,內心肯定會有一些指標,通過一些指標,比如看人群分布會從,平均值,中位數,眾數,偏態,峰值等。那麼衡量一個有三年工作經驗的優秀數據分析,我們會從哪些方面進行考慮,(語言,說話動作,神態氣質,技能水平,對業務的理解,統計知識)?你們是怎麼看的,你們心中評價一位有三年工作經驗的數據分析師,心裡都有哪些指標,你們認為最重要的指標是什麼??可以告訴我嗎

本題已加入圓桌 ? 數據挖掘應用,更多「數據挖掘」相關的話題歡迎關注討論


謝邀。

我來拋個磚,希望能引個玉,共勉。

受本人背景和知識水平所限,本答案局限性如下(包括但不限於):

1. 更適用於中大型公司;

2. 更適用於互聯網公司;

3. 可能更適用於美國的工作環境。

個人以為,一個三年工作經驗的數據分析師應該具備以下方面的能力:對技術的掌握,對產品的理解,對數據的敏銳性,數據和產品之間互相轉化的能力,分析思維的廣度、深度和速度,數理統計的能力,溝通的能力,輔導新人的能力,面試把關的能力。

以下分開來說,同時舉例的時候假設這個數據分析師是知乎這個產品的,目的是為了增長活躍用戶。

【1】對技術的掌握

不一定需要非常高深的技術,但是基本的一定要過關。比如針對互聯網行業的數據分析,SQL 是一定要過關的。在這基礎之上,Python / R 可以提高長期的工作效率,但在初期並不一定需要。

簡單來說,技術能力決定了一名數據分析能力的下限,而對產品和業務的理解則決定了上限。

如果缺乏技術的支持,那就只能去當 CEO 了。

就好比在電影 Margin Call 里,底下的小兵負責分析數據,各種模型預測金融危機什麼時候會發生。

而對於 CEO 來說,他的任務就是猜。

關於數據分析應該掌握哪些技術,可以參考這篇:

鄒昕:數據科學家 (Data Scientist) 的核心技能是什麼?

【2】對產品的理解

數據分析的目的是為了改進產品。如果缺乏對產品的理解,那麼技術再好,也有可能像是無頭蒼蠅到處亂撞。

或者是變成 data dump,提供一堆一堆的圖表,但其中有互相什麼關聯,能說明什麼問題,提供什麼樣的建議,卻並沒有好的想法。

如果是初入行的話,這還是問題不大的。

因為新人可以有老闆帶著,或者是老人帶著,但是如果想要更進一步,那就必須能夠自己獨立的做項目。

尤其是在互聯網行業更是如此,除了新人之外,對大多數人的基本要求都是能單兵作戰,不需要詳細的指導。

同時在很多情況下,問題是很開放性的,對於如何解決並沒有一個非常固定的套路,或者是因為這完全就是一個新的問題,或者因為不同產品之間套路無法直接套用,需要做大量的調整和創新。

比如這裡面增長的例子,哪些是可以借用於知乎的,哪些是需要調整的,哪些是完全不適用的?

鄒昕:有哪些通過產品上的精妙設計實現用戶增長的例子?

【3】對數據的敏銳性

對數據的敏銳性體現在兩方面,一是在結果還不是那麼清晰的時候,甚至根本就沒有什麼數據的時候,能夠大致感覺往哪個方向深挖是更有可能出成果的;二是在數據出問題的時候,能夠反應出來,及時找出原因。

比如做知乎的數據分析,目的是為了增長活躍用戶,可以做的地方有很多,比如增加獲新、增加內容、增加用戶關注話題數、增加用戶關注人數等等。一個經驗豐富的老司機可以快糙猛的大概估算一下各個方面的機會有多大,大致的實施難度如何,風險是大是小,產品哪些方面是有缺陷可以改進的。

另一方面,是人就會犯錯,最大的區別在於有的人可以很好的糾錯,而有的人則需要別人提醒,還有的人即使別人提醒了也反應不過來。

鄒昕:數據分析中會常犯哪些錯誤,如何解決?

【4】數據和產品之間互相轉化的能力

在互聯網行業,多數時候問題是很不清晰的,比如說問題可能是2017年新用戶留存遠差於2015年的用戶,如何解決?

對數據分析師來說,並不會有一個詳細的單子來告訴你都有哪些步驟,而是需要自己靈活處理。

一方面這些問題本身就比較新,雖然會有一個大致的套路,比如 AARRR 模型,解決增長需要先解決留存等等;然而再往下具體的時候,套路就沒有那麼固定了,因為不同的產品之間可以差別很大。

即使像是 Quora 和知乎這樣理應非常類似的產品,也可能因為一些或大或小的差異,導致給分析數據也帶來差別。

比如 Quora 的 upvote 並不完全代表贊同,而更多帶有傳播的意味。

而對於知乎來說,點贊即是贊同,傳播只是副產品而已。

如果只懂數據不懂產品的話,很容易進入一個誤區,要麼產品/業務方追著問數據,要麼沒活兒干。

鄒昕:數據分析團隊如何給自己找活干?

【5】分析思維的廣度、深度和速度

速度這個比較好理解,尤其是在互聯網行業,講究快糙猛,沒有時間精細打磨。

比如一個項目可以花兩個月時間做出 95%,也可以花兩周時間做 80%,那麼多數時候都會是後者。

廣度:產品的各個方面之間總是互相牽扯的。最簡單的例子,如果知乎的拉新做得非常好,那麼留存就有可能降低,用戶活躍度也有會降低。

如何分析各者之間的關係,如何保持一個合理的平衡,如何增加其中一個不過於負面影響其它,這些數據分析都需要在廣度上有一定的了解。

深度:有些問題一個人解決不了或者很難,多幾個人就可以了,比如說搬磚,十人人搬總會比一個人搬快得多,哪怕不是十倍速度。而有些問題,靠堆人力是沒用的。

鄒昕:數據分析團隊如何給自己找活干?

【6】數理統計的能力

這一部分跟 1,3,5 是相關的。不一定需要特別高精尖,但是對於分析問題會有很大的幫助。

比如說如何識別數據分析里可能出現的錯誤:

鄒昕:數據分析會騙人么?

【7】溝通的能力

除非兼任軟體工程師和產品經理的職,否則數據分析師總是需要通過說服產品和工程方面來改變產品,產生影響力。

有了好的結果是第一位,如何影響合作夥伴,讓他們接受自己的建議甚至比有好的結果還重要。

畢竟,沒有聲音,再好的戲也出不來。

【8】輔導新人的能力

毛主席說過,人多力量大,要把敵人淹沒在人民戰爭的汪洋大海中。

輔導新人,不只是團隊 leader/manager 的要求,對於獨立貢獻者(individual contributor)也是一樣重要的。

聞道有先後,術業有專攻。

一個人的力量終究是有限的,如果把自己的能力複製到整個團隊甚至整個公司,是增大自己影響力最有效的辦法之一。

【9】面試把關的能力

大多數人應該都希望自己的公司處於一個增長的狀況,如果是高速增長那就更好不過了。

有增長,就必然要招人。

而招人並不是簡單的招人來幹活,而是招來更優秀的人進一步提高團隊的水平。

這對於高速增長的團隊來說是一個很大的挑戰,所以提高面試技能和精準的判斷面試者的能力,無疑是有效的擴張團隊的不二法則。

【10】少睡的能力

比如說七周不睡覺,快速成為數據分析師(開玩笑的)。

鄒昕:如何快速成為數據分析師?


主要是思想成熟吧,漸漸摒棄「業務至上論」和「技術至上論」。

1. 是否在技術上止步不前。很多人信仰業務,可能做了3年不過寫寫SQL、分析也就僅限於EDA。但事實上,不了解技術可以改變很多。而且,原因相信業務至上的,事實上,是否認整個行業的價值,並且學術壁壘無法形成導致更多公司內不懂的人干涉。

2. 是否空學習了很多技術,但事實上運用時還是三板斧(SQL、EDA、PPT)。很多分析師執著於各種高大上的技術,但事實上很多和業務是脫節的。此外,很多資料來自於二手博客,導致對很多技術、業務模型的理解不深。據我現在的觀察,大多數人對用戶畫像的理解和其本意差別很大,國內往往理解成自動化的EDA用戶屬性。

3. 是否總是以把過於複雜的技術應用於業務。很多分析師為了炫技,經常花費不必要的時間,運用複雜的技術只是為了解決一個簡單問題。

4. 是否向業務部門傳遞正確的數據觀念。一部分分析師,由於過度炫技,往往很少和業務部門溝通清楚,導致大量時間的耗損,以及自己的結論無法對業務部門提供很好的幫助;沒有教育業務部門讓他們明白,以現今的分析技術,哪些是可以做的,哪些是不可以做的,導致攬下一堆其實很難處理的工作或者每次做的工作永遠限定在簡單的資料庫取數。

5. 是否在給出數據和報告時足夠謹慎。這包括:是否核查數據是否正確;是否能在提出結論時給出一個概率,譬如說「根據數據,有90%可能表明流失用戶正在挽回」,如果不能,嘗試給出你對你推斷的準確性有個定性的表述,比如「根據數據,流失用戶比例達12%。但是證據相對不足」。

6. 自己處理問題的方式是否照搬常見模型。事實上,對每個公司業務而言,很多方法不能完全套用,很多分析師的大量業務模型(漏斗、轉化)都是基於網上的經驗,但事實上這類模型只能滿足一個average的需求,作為一個有經驗的分析師,應該有自己的判斷能力找到更好更適合的模型。

=======

暫時想到這麼多,有空補充。


謝邀。

目前[2017-08-11 11:03]的問題是:「一個有三年工作經驗的優秀數據分析師所具備的能力有哪些?怎麼衡量?從哪幾個方面?」

我這裡的答案可能更適合這樣的問題:「怎樣衡量一個數據分析師是否優秀?」

既然是考察「優秀的」數據分析師,那麼基礎的統計與數學知識、編程能力等等這裡就不談了。以下三方面的能力是區分「優秀的」數據分析師的重要標誌:

研究學習的能力:數據分析工作要求能夠在短時間內掌握與項目相關、與數據相關的背景知識。這就要求數據分析師能夠獨立迅速地學習了解一個新領域,並能夠將新知識有效地應用於工作中。

邏輯思考的能力:數據分析師的工作成果往往用於決策支持,從數字中提取事實來回答各相關部門乃至企業高層關心的許多關鍵問題。因此,每一步工作都需要有其內在的邏輯性,否則就會得出不準確甚至荒謬的結論。

溝通交流的能力:和內外部人員溝通自己工作計劃和工作成果,是數據分析師工作的重要部分。口頭和書面溝通的能力,是數據分析崗位職業道路的重要推動力。

在實踐中是如何考察這幾方面能力呢?講講我在面試中的做法吧。

對於有經驗的人選,我會請你自己選擇簡歷上一個做過的項目,大概介紹一下。在你的介紹中,我會尋找以下內容:

1. 項目的目的,期限,預期目標,完成結果;

2. 團隊人員構成,你在團隊中的角色,以及發揮的作用;

3. 可用的數據,用到的分析方法,用到的工具與語言。

如果回答完之後,我沒有找到這些問題的答案,我會直接問。一個優秀的數據分析人員,應當能夠有意識地按這樣的輕重順序將一個項目介紹清楚。而一個較一般的候選人,往往說來說去都是第三部分的內容。

接下來我會針對這個項目問一些開放性問題:

- 針對這個項目你還考慮過什麼其他的分析方法?為什麼最後選擇你用的方法?

- 你覺得你掌握的數據足夠嗎?是否還有其他的數據能夠幫助你更好地解決這個問題?

- 你認為項目是否達到了預期目標?如果再做一次類似的項目,哪些地方可以改進?

最後,我會結合目前手頭的工作,建立一個簡化的假想項目。這個項目中能夠應用你之前講的分析方法,但並不是那麼一目了然。我會給候選人一個模糊的目標去完成,但你需要自己進一步問很多問題去澄清這個目標,以及去摸清楚所擁有的資源。你需要在此基礎上,提出一個可行的分析方案,規劃需要的時間和人力,並預估可能得到的結果。這基本就是日常工作的一種模擬,便於考察候選人的工作思路。

以上。

====================

題外話,說說為什麼我忽略了原問題中的『三年工作經驗』:

用時間長度來度量工作經驗是一件很荒謬的事情,在新興領域尤其如此。這種問法體現出的一種集體潛意識是:水平能力會隨著工作年限自然提升;很多能力需要通過一定年限的工作才能獲得。這兩條都是錯的。

即使已經工作三年,如果一個數據分析師的工作中充斥著大量非數據分析的工作,如簡單的匯總Excel報表,製作PPT,寫報告,調Word格式,調HTML格式等等,那這三年工作經驗怕是要大大地打個折扣。即使做的工作是數據相關,然而如果三年的工作內容都大同小異,無非是重複他剛工作前半年做的事情,這樣的工作經驗也沒什麼含金量。

很多所謂的工作經驗,並不只有參加工作才能獲得。我見過許多優秀的研究生甚至本科生,在學校期間就已經做出了傑出的工作,同時有旺盛的好奇心和強大的自覺性,比很多所謂三年或者五年工作經驗的人要更能勝任職位要求。


樓上都是大神啊,總結的都很精闢,讓人受益匪淺。我也談談個人觀點吧。我覺得一個有三年工作經驗的優秀數據分析師首先應該具備三大特質:求知慾、自信、努力

  • 求知慾 - 愛因斯坦曾經說過:「我並不是什麼天才,我只是一個充滿好奇心的人罷了。」 在強烈的求知慾推動下,會迫使我們主動地學習與實驗:這就要求我們具備學習能力豐富的想像力。上面說得已經很精闢了,我就不在這班門弄斧了。
  • 自信 - 蕭伯納有句名言:「有信心的人,可以化渺小為偉大,化平庸為神奇。」 充滿自信,使得我們敢於分享自己的得失,能夠正視自己的不足。這就要求我們具備溝通的能力自我批評的能力
  • 努力 - 沒有努力的話,即便再有才華、再有自信,他的成就也會非常有限。

因此,我認為一個有三年工作經驗的優秀數據分析師所具備的能力應該至少包括:學習能力想像力溝通能力自我批評的能力。受限於職責範圍和產品定位,我就不再誤導大家衡量的標準了。


你們啊,不審題,我在最後都說了多數時候不可能全用上。至於為什麼我說了這麼多,是因為不同方向不同規模的業務對分析師要求也不一樣,我粗暴的合到一起了而已。舉例,像美團和58這種,一定會涉及到線下銷售的情況,相關分析師需要對crm和銷售行為以及後續行為了解,而像新浪微博或者優酷土豆這種,肯定要對用戶行為以及abtest之類的了解。從規模上講,大公司的數據分析師可以專一一些,像阿里這種在內部做數據查詢的速度相當快,文檔和資料很全,定時發日報周報也不需要自己寫腳本,有數據產品可以更容易搞定,如此種種,反之,小公司對技能要求和涉及範圍就比較多,這麼多種情況合併一起當然多了。

---------------------------------------------------------------------

瀉藥,問題過大,我只能說下我的個人理解。為什麼說問題過大,因為涉於公司和不同BU的發展狀況,對於數據分析師的要求是不同的,所以重要方面要看實際需求。我只說下互聯網方向的數據分析師的能力拆解好了。簡單分為軟實力和硬實力,不過我懶,就不畫思維導圖了,想到哪寫到哪,沒什麼邏輯可言,所以下面的東西可能存在彼此交叉或者覆蓋的情況,而且僅限業務數據分析師。

·對互聯網至少一個垂直領域有足夠了解,即時了解行業動態

·了解市場渠道,包括並不限於SEM、SEO,以及應用市場、CPC、CPM、CPA等

·了解反作弊

·了解產品,甚至參與產品數據方向的改進優化,比如直播平台的主播露出演算法

·了解運營

·了解線下銷售體系

·數據指標體系,有能力根據不同的實際業務進行數據抽象,成為指標,譬如視頻網站的vv、播放完成率,電商的進銷存、妥投率等

·協助設計BI平台

·埋點設計,根據版本迭代更新而定

·用戶畫像

·用戶行為分析,可能涉及用戶分群,漏斗轉化,路徑分析等

·常規分析報告,專項分析報告,對外發布的分析報告

·數據指標異常預警

·了解Hadoop、spark、hive等

·了解mysql、sql server、oracle等

·了解excel、R、python、MATLAB、sas等

·了解商業化的數據分析產品,GA、友盟等

·了解數據可視化,tableau、echarts、power BI等,包括其他數據分析軟體的可視化展示,譬如ggplot2

·足夠的數理統計知識,良好的數據敏感度

·數學建模能力,乃至數據挖掘,機器學習,了解線性模型、主成分、logistic、決策樹、knn、隨機森林、svm、k-means、關聯分析等

·PPT製作,良好的審美觀,一定的表述能力

·豐富的項目經驗,有數據驅動業務經驗

·跨部門乃至對外溝通能力

日了哈士奇,感覺像是在寫JD似的,不過拆出來大致是這些吧,技術方向的我就不大熟了。以上說的,多數時候不可能全用上,看實際情況了。


首先先說明下,以下列舉的幾點均屬於本人在互聯網公司做數據分析師的一些個人理解,所涉及的能力均數據數據分析業務內的能力,職場必備的通用素質這裡暫不列舉,供各位參考~

如有不同見解,歡迎指教~

三年的時間大概是一個員工完成一個公司第一期勞動合同的一個時間段,也是職業習慣養成的關鍵時間段,因此在我看來成熟的數據分析師需要具備以下的習慣和思維意識:


  • 專業的工作習慣

在我看來,數據分析工作是需要極強邏輯性的工作,一個成熟的數據分析師,需要具備專業的工作習慣,才能在紛繁複雜的數據和業務問題中撥雲見霧,高效、準確的為目前遇到的問題找到解決方法。

以常見的分析工作為例,我認為專業的工作習慣包含一些幾點:

  1. 明確需求,確定分析目的這一步在我看來至關重要,是區分一個新人和成熟分析師的標誌。許多新人,往往從接受到需求的一開始就陷入寫代碼、找數據的忙亂中,但這樣往往不能快速獲得結果,有時還會因為沒有想清楚,導致結果與需求目標不一致,而白白浪費辛苦的工作。
  2. 構建分析框架 or 明確定義的模型特徵構建文檔,以結構化的方式進行思維的沉澱。
  3. 確認數據口徑,統計周期,進行數據處理,代碼備份。
  4. 數據發現-&> 商業洞見的準確翻譯,保證業務方準確理解。
  5. 反饋報告or模型使用方法文檔,並與需求方面對面溝通,確保說明文檔和表述的清晰、可被接受
  6. 留檔備案,經驗積累。分析工作非常依賴對業務和數據經驗的積累,成熟的分析師能夠注意為自己和團隊積累經驗。

  • 嚴謹的數據思維

數據分析師要保證提供數據的準確性(數據質量和業務耦合),同時數據安全是決不可突破的底線

  • 統計口徑的準確把握,除排除臟數據意外,還需要與業務邏輯強耦合,避免因為業務數據異常設計導致的異常輸出對數據的干擾;
  • 報告統計邏輯和可能存在誤導的明確解釋
  • 時刻明確數據安全意識,避免數據泄露,保證用戶數據的安全

  • 有效的理解溝通

數據分析團隊在公司中,通常面臨多方合作,因此成熟的數據分析師往往具備良好的溝通和合作能力,能夠通過與需求方和開發團隊的有效溝通,對業務從設計思路到實現方式的全流程有準確理解,這樣不僅能提升實際工作的效率,也能提升輸出分析結果的業務可解釋性。

  • 與需求方的溝通---最懂業務價值

需求方是能夠幫助數據分析師快速了解業務的老師,也是數據分析師把業務轉化為準確分析場景必須依賴的溝通環節

  • 與開發的溝通---最懂業務實現

數據中有什麼坑,業務規則如何在程序控制中實現,通過與開發人員的溝通,能夠有效避免數據問題,即時識別異常結果,也能有效提高數據分析結果的可解釋性。


  • 極強的學習實踐能力

如上所說,因為數據分析師需要與多部門各種,因此需要具備快速學習各業務的能力,並為各業務產生數據洞見。因此成熟的數據分析師能夠快速學習並學以致用。

  • 各業務場景的快速學習理解;
  • 新數據源的快速熟悉應用;
  • 各類分析方法的學習積累,並靈活將分析方法與業務場景準確匹配;
  • 保持對前沿新分析方法,新機器學習方法的敏感性

  • 產品化意識

對於常說的數據工作 80%的時間是數據處理,只有20%在做分析的說法,其實正在通過產品化的方式轉變。

成熟的數據分析師需要具備通過產品化,提升自己和團隊工作效率的意識。

在實際工作中,經常總結,將固化的分析模型轉化為數據產品,來提高數據處理、日常看數的效率。不僅能夠加速數據在業務方中的滲透,也有利於數據分析工作邊界的不斷拓展。

畢竟數據分析還是一個新的職業,其在企業能夠發揮價值的範圍正在不斷拓展,只有產品化,才能將更多數據分析師解放出來,去拓展數據在企業中發揮價值的邊界


可以從如下4個維度來看,同時如下4個內容也可以直接作為3年內數據分析師簡歷的結構

(1)基礎的數據分析技能:

剛入職的數據分析師,少不了面對一些基礎的工作,比如數據的提取、清洗、報表的製作等,體現這個維度的方式不外乎就是一些工具的使用水平,寫的一手好SQL,熟悉數據採集、生成、加工的流程等

(2)業務分析/項目經驗:

大部分人都會在這個部分分化。能夠從始至終深度的參與一個項目,並在其中通過數據分析提供了一些切實可行的方案,看似簡單,但其實在實際工作中這樣的人並不多見了。大部分人分析出來的東西,要麼是一些正確的廢話,要麼就是產品經理或者運營布置的「作業」。理想的狀態是既能清晰的定位這個項目在部門或者公司業務中的位置和價值,進一步再定位自身在項目中的作用,最後給出一些切實可行的操作方案。最後這點尤為難得,達成的關鍵就是能夠深入業務思考業務/項目上的痛點,自發的提出一個好問題,往往已經是成功的一大半兒了!

(3)對高階技術方法的學習:

當我們擁有了紮實的數據處理技術,以及一定的項目經驗和洞察之後,制約數據分析師進一步提升的往往就是運用一些技術將(1)(2)聯合貫徹。遇到過很多數據分析師日常就是SQL+EXCEL,其實這很正常也值得理解,但當面對更複雜的問題時,我們是需要高階的技術的,比如機器學習。我們不要求熟練操作深度學習,但我們至少也應該知道熟悉機器學習中一些經典的常用的演算法。能看到多遠,深刻的決定了我們能走多遠

(4)數據分析產品化思維:

數據分析師大多數時候是個苦力活,能夠自我解放的最大殺器就是數據產品了。這裡我直接上一個檔次,不說數據分析工具,能夠將日常對業務的分析思路,產品化自動化的實現出來,是一件非常重要的事兒。對於數據產品是什麼,具體就不闡述了,反正有很多回答。但可以負責任的說,數據產品肯定不是數據報表,而應該是將某個場景中的一系列問題按照分析邏輯串聯起來。


個人感覺需要根據不同的數據分析師的方向分別來講:

首先我認為分析師可能分以下幾個方向:

  • ETL,BI開發(有些公司也把這個叫數據分析師)
  • 數據挖掘,演算法(利用演算法來解決一些問題)
  • 業務數據分析(偏業務應用的)
  • 數據產品(其實就是分析的思路的一些固話和沉澱(包括分析套路和一些演算法的應用))

ETL,BI開發:

  1. 毫無疑問編程能力
  2. 針對一些演算法如何利用編程語言線上化
  3. 以及如何解決一些性能問題以及一些實時方案的解決方案

數據挖掘,演算法

1.數學能力要好,初級的可能調調包,利用一些調優技巧就可以滿足需求,但要真正如何讓模型上升一個等級,數學能力必不可少

2.對業務的抽象能力,什麼業務問題應該用什麼模型解決(其實這也是數學能力)

3.編程能力(特徵工程,大批量的數據的處理需要好的編程能力來提高處理效率)

業務數據分析:

  1. 對所在行業的理解深度(市場,營銷手段,面向的用戶),只有了解這些才能知道你的分析結果用在哪,如何用
  2. 針對某個問題的拆解能力和用什麼指標來衡量的能力(要發現一個問題,找到原因,必定得一層一層往下拆解,拆解的同時得知道使用什麼指標來衡量是相對能夠反映出情況)
  3. 指標體系的建立,目的為了讓公司里人員能夠利用這些指標來發現問題(結合公司情況,宏觀指標有哪些,每個宏觀指標如何拆解到微觀指標,從而發現問題所在)
  4. 技術方面:
    1. 提取SQL,分析R或PYTHON
    2. 分析的方法論和統計學基礎知識

數據產品:

  1. 產品經理所具備的技能
  2. 將業務數據分析的指標體系的東西產品化出來,將挖掘分析師的東西嵌入到生產系統


除了具備所有行業都要求的良好的心理素質、良好的品德和個人素養、良好的身體素質以外,還需要具備:

1.想像力:沒有人可以去不存在的地方,但是想像力可以。數字營銷是基於數據將想法推動到極限的。這需要你有足夠的想像力,並可以獲取數據來支持你的想像力,並且付諸實踐。

2.預測能力:想要做好成功的數據營銷,有一定的預測能力是必要的,這種預測能力來自於實踐經驗的培養。要記住學習+總結+改進方法+積累經驗永遠是最重要的。

3.對數據的理解能力:基於數據的營銷,不僅需要對於數據的分析能力與基礎敏感度,更需要對於數據分析領域的相關了解,就像是評價一輛車,內行人關注的是風阻與油耗的關係,外行人看得到是輪胎的尺寸與流線型的設計。換個角度看數據才能看到其中的指導意義,提升數據價值。

4掌握數據管理軟體是必備基礎:數據分析軟體的合理應用可以分層來看,數據分析層我們可以選擇Excel軟體、SPSS軟體、SAS軟體、JMP分析、XLstat等;數據表現層我們可以Xmind百度腦圖、Xcelsius軟體又或者是常用的PPT工具完成報告的撰寫。當深入了解各個軟體之後取長補短為之所用,才是真正掌握數據、使用數據的關鍵

5.網站技術能力:互聯網營銷與網頁製作、資料庫應用等常用程序密不可分,互聯網營銷人員不一定能成為編程高手,但是對於一些與互聯網營銷直接相關的基本代碼,應該有一定的了解,尤其是HTML、ASP、JSP等。即使不會熟練地用代碼編寫網頁文件,也應該了解其基本含義,並且在對網頁代碼進行分析時可以發現其中的明顯錯誤這樣才能更好地理解和應用網路營銷。

6.用戶體驗能力:我們需要更多的實踐體驗,這樣才能更深入地理解網路營銷。網路營銷學習最好的實踐方式之一是建設一個個人網站。因為通過個人網站建設和維護,會對網站建設、網站推廣、網站效果評估等方面的知識有更深刻的認識。這樣在做彩票合買代購程序的產品站,可以從整個網站營銷策略上考慮問題,這個是網路營銷的一個整體把控能力。


樓上諸位都說的很詳細了,想補充點自己的親身經驗吧。拋開必備的工具技能不講,能上升到能力層面的東西結合一個3年工作經驗的分析師來說,我覺得首要是學習能力

3年的時間,如果是在互聯網行業的話,應該也有一定認知了,3年的時間互聯網行業也可能會發生一定變化了,特別是產品形態大趨勢和數據分析工具(互聯網行業是個「追風」的行業啊)。

重要的是,能否隨著行業的變化,在沉澱自己已有技能的情況下,仍然可以快速學習到新形式的特點,並將其量化成指標和維度。或者在行業內剛出來的新方法論和工具,是否能快速應用到自己的日常工作中。

除了以上說到的學習能力外,我覺得還有幾種軟性技能,如「沉澱」自己已有經驗的能力、「探索」能力等。


剛好從職三年,從這些年遇到的人和事,也說說我的想法。

1、是否存在提升處理數據的效率的思維

就技術來講,基礎的技術無非Excel、sql,再進一步的就python、r、kettle等;

但是技術在不同的人手中發揮的作用都不一樣,過去我們一直說,處理數據所耗費的時間是在數據分析過程中佔比最高的,這點雖然沒有問題,但是我們還是能通過很多方式去減少數據處理的耗時

比如我的第一家公司用的是Excel,後來引入sql將數據處理自動化,以前差不多兩三天才能出的數據,周一早上一個小時內就處理好。

第二家公司曾經部門內剩下我和經理處理數據,需求太多,經常加班處理,後來引入python搭建了一個數據平台,直接整個人抽身出來做其它專題分析去了,後來其它分公司也來學習怎麼搭建,都想以此提升工作效率。

其實在我看來,只要是人能處理的都能自動化處理,方法很多,sql+python、kettle+sql+tableau、Excel+vba+sql等等;

我是發現很多數據從業者每天就在提取數據提取數據,時間基本都耗在上面了,但是都不去想解決的方法,結果剩下很少的時間進行數據分析,這種工作模式,做三年五年又有什麼用?數據分析按崗位分的確能分技術開發崗和分析崗,但是目前很多公司都沒有專門設開發崗,所以常規的數據處理還是要想辦法利用工具去進行提升效率。

2、是否存在邏輯清晰的分析思維

這點其實應該是作為數據從業者的基本技能,但是我看過不少都是直接套用網路的各種框架,或者領導要什麼就給什麼,其實現在的各種企業對於分析這一塊,都有不同的想法,其實也可以說是探索吧,有的公司希望數據分析部門能承擔起公司的分析職能,有些公司希望業務部門能承擔起公司的分析職能,數據部門做好數據處理和展現就行了,但是無論怎樣的方式,當一個新項目或者專題開始計劃的時候,分析職能就要開始發揮它的效用,見過太多數據從業者或者業務人員在做分析的時候,比分說考核指標,通常只知道領導要這個指標,但是指標口徑該怎麼定義更合適,要達到考核目標日常該監控什麼數據,當這些數據發生變化的時候該怎麼調整運營方案,沒有去想的,這樣的工作方式三年五年有什麼用?簡單的套用框架能走多遠?領導要啥就只給啥,難道指望領導去了解底層數據和業務的關聯嗎?

3、是否能使用統計學習模型對數據進行進一步提煉

單單第二點通常只是滿足了日常的運營需求,有一些特殊的重點項目是需要用到有關模型的知識,比方很多公司初期都會做的一個客戶打分模型,從客戶留資到最終成單,怎樣從留資階段就判斷客戶的成單概率,就需要根據已有的數據標籤或者引入外部的標籤去對客戶進行分類,哪一類的客戶成單率高,第一線的銷售人員就主攻哪一類客戶,如果用得更好的,就比如哪一類客戶能通過什麼方式提高成單率等等

基本上就是上述的三點,其它什麼學習能力,溝通能力等等軟技能我就不說了,有這些軟技能對每個人來說都是好事哈


前面的同學們回答了中大型公司的優秀數據分析師所具備的能力:對技術的掌握,對產品的理解,對數據的敏銳性,數據和產品之間互相轉化的能力,分析思維的廣度、深度和速度,數理統計的能力,溝通的能力,輔導新人的能力,面試把關的能力。

我覺得講的很全面了,我來回答一下中小型創業公司里優秀數據分析師的能力吧。

中小型創業公司沒有大公司那麼好的資源,往往很難找到同時具備上面這10項能力都優秀的人,尤其是只有三年工作經驗的同學,對行業的理解,對產品的理解都需要較長時間的積累。所以我們更看重的是「溝通的能力」和「從用戶角度考慮問題的能力」。

1.溝通的能力:包括聽、問和說(寫)的能力。

聽:能準確快速的理解對方表達的內容。

問:能正確的提問,確認雙方的理解是否一致。

說(寫):正確表達自己的觀點和內容。

一分鐘能溝通清楚的事情,一定不能拖到3分鐘。5分鐘能講明白的事,一定不能扯10多分鐘。

2.從用戶角度考慮問題的能力。

數據分析師也是有用戶的,他的用戶可能是領導,也可能是其他相關的需求部門,分析師能不能在完成自己的產品(分析報告、分析結果等)過程中,對產品多一些打磨,直接影響到最終用戶的體驗。尤其是有些需求並不是非常明確的情況下,優秀的分析師會站在用戶的角度去分析需求,給到超出用戶期望的產品。

舉個簡單的例子,電商部門想了解品牌本月銷量的排名,普通數據分析師的「產品」是:7月銷售額100萬,全網排名12名;優秀數據分析師的「產品」是:7月銷售額100萬,全網排名12名,排名比6月下降了2名,但比去年7月份上升了1名。

具備這兩項能力的數據分析師,經過工作中的鍛煉和培養,其他方面的能力我覺得相對都容易提升,而且這兩項能力優秀的人,未來帶好一個團隊的可能性也大很多。


1應當再次想起那句有名的話:早知道學CS了2如果沒有去落實1那麼應當逼逼水平直逼金融


情商 獨立高層次高維度思考 耐心恆心 學習能力


推薦閱讀:

請教如何做用戶行為路徑分析?用python或者R實現!
了解關於系統推薦演算法的知識,有什麼好的資源推薦?
從原理上來說,GBDT 和 SVM 哪個更強?為什麼?
南京大學LAMDA(周志華)組的實力如何?

TAG:數據挖掘 | 數據分析 | 數據科學家 |