如何準備數據分析師的面試?
作為一名數據分析師需要掌握的知識有什麼?數據分析領域的職業機會有哪些?簡歷該怎麼寫?面試時如何回答棘手問題?
謝 @京東白條 邀。
既然是為了找工作,那就要有針對的的準備。
研究招聘方的JD是一個不錯的方法。比如我在網上隨便找到的一個JD,你可以看看。
各個公司對於數據分析師的需求和定義可能有所差別,但是大同小異,在分析這個JD的同時回答你的問題。
1.本科或以上學位;數學、統計學、計算機、金融或相關專業;3年以上互聯網數據分析工作經驗;
數學,統計學,計算機,也就是說,這三種學科的基本常識你要掌握,能夠快速的應用。
比如統計學中的,概率和分布,統計推斷,線性模型,非參統計等等。
具體可以參看之前專欄寫的這篇:
想學數據分析,先從哪裡入手?
2.熟悉多種數據源深度診斷性組合分析、挖掘和建模、數理統計、數據分析、數據挖掘以及常用演算法;
3. 熟悉SQL語言,熟練操作Excel,熟練使用1種以上數據分析和挖掘工具(如SPSS/Clementine、SAS/EM、R等);
這裡其實說的是數據分析流程中需要掌握的技能,我們不妨來看下數據分析流程:
比如數據層,
數據獲取,如何獲取數據?公開數據,還是調查取樣,網路爬蟲?還是直接從庫中取數?所以這時候,有可能去考驗你的搜索能力,最為基礎的SQL取數能力,甚至還會涉及到爬蟲的知識(現在看來,Python或者R必須要掌握一項,才會有競爭力啊)
數據清洗,其實對於數據量較小的,Excel ,SPSS都能很好的完成,但是數據量一旦過多,這些工具就會力不從心,需要考慮資料庫,甚至是程序語言去實現數據清洗,比如政策表達式,Python的數據分析模塊,比如Pandas,NumPy,都是應該掌握的東西。
另外還需要了解一些公有的數據的獲取途徑,比如國家統計局(國家統計局),聚合數據(https://www.juhe.cn/),谷歌數據搜索(https://toolbox.google.com/datasetsearch)等等。
數據整理和建模分析,這塊無非是數據的呈現方式,常見的無非是以下幾種類型
- 細分
- 對比
- 漏斗
- 同期群
- 聚類
或者是這幾種類型的結合。
對於某些特殊的場景,比如會有AB測試,行為埋點,行為路徑,表單分析,這裡就不一而足了。
模型驗證,其實數據分析跟做實驗是一樣的過程,提出假設,收集數據,驗證假設,當我們建立一個模型之後,把從模型分析出的結果帶到實際中,看是否有用,再去檢查我們整個數據分析流程是否準確,檢查是否在某個環節出現了錯誤,是否陷入了某種統計陷阱,比如倖存者偏差,確認性偏差,缺失值處理是否正確。從而不斷的迭代優化。
輸出結論,數據可視化,這裡需要你了解一些數據可視化的原理和工具。比如最為基礎的
當然你可以可以嘗試其他工具,比如Tableau或是其他的可視化框架。
4. 商業感覺敏銳,對數據敏感,能快速理解業務,能主動尋找業務各環節中數據分析的應用機會;
5. 良好的邏輯分析、文字表達及溝通推進能力,能獨立完成專題分析及跟進落地; 6. 良好的學習與抗壓能力,能自我驅動,有強烈的責任感。
這些其實是軟能力,可以有針對性的寫,盡量符合JD去編寫你的簡歷,不建議一份簡歷通用。突出自己的項目經驗,項目業績,以及自己負責的部分,盡量展現出自己的能力。
比如,有良好的邏輯分析,文字表達,你可以說自己有一個數據分析的公眾號,出過幾分數據報告,大概多少人瀏覽之類的來表現你的這個能力。
這幾條也是面試中的一個重點,比如面試官會隨機給你出一些跟數據分析相關的問題,來檢驗你的邏輯。
這裡一定不要想到哪說道哪,你定要呈現出邏輯性,比如按照我們的數據分析的流程去給他講述。
每一個步驟怎麼操作,數據怎麼獲取,怎麼處理,這裡不用考慮實現或者數據是否準確的問題,體現的邏輯性和你的思考。
比如面試官要考研你的數據敏感度,你可以講講自己實際的例子,比如我之前說過的一個例子:
我今天去了一家超市買了點東西,收營員說,先生恭喜你,今天你是我們的第100位的客戶,特此送你一個幸運客戶大禮包,僅僅是關於100這個數字,你會想到什麼問題?
100位客戶這個數據是否準確,如何估算?100位產生了付費的用戶,平均客單價大概是多少?
根據100個付費用戶,如何估算該超市的人流量?100人的數量,和附近其他超市比是多是少?(對比)這100人的數量比昨天多還是少?(對比)100人有多少產生了實際購買?(轉化比例)路過超市,超市外的人流是多少?(轉化比例)
當然你要要勤于思考,比如為什麼超市的物品擺放是如此規律,商場的廣告牌的面積跟什麼有關?肯德基的選址為什麼是這樣的,只有多思考,在面對這樣的問題的時候,不會至於無話可說或者所說的內容信服度不高。
至於其他的抗壓能力啊,責任感什麼的,這個我建議你平時沒事多想幾個自己的案例,因為幾乎所有類型的工作都會遇到這個問題。
最後祝你能找到喜歡的工作,加油!
以上。
謝邀,由於是在國外,最近經歷的幾次面試都是遠程面,基本都通過了,回國進一步接觸。由於研究方向的問題,基本上投遞的崗位都是CV+Data。舉幾個例子:
獨角獸方面:必須承認獨角獸公司的面試是比較細的,或許他們想要的是能獨當一面的人。我博士做了幾個工程項目,面試,基本流程是,描述項目,然後面試官會選擇細節問題去問他感興趣的,演算法選擇原因,演算法改良的地方,為什麼這麼改,如何解決數據不均衡,如何標註數據,具體怎麼操作的數據增強;面過的幾家獨角獸公司面試時間沒有低於1小時的;很累,像頭腦風暴。有過幾次棘手的情況,比如有一次問到了我碩士課題,說實在的當時有點忘了,腦子一片空白。我當時就很直接地說我需要兩分鐘時間來回憶那個工作,然後就想起來了。
大公司:面過華為鵝腸。華為比較簡單,可能是博士課題與崗位符合度很高,基本就是就著博士課題談。軟硬體,數據流採集,數據計算加速都談,甚至還談到了搭建系統的供貨商的產品特點。畢竟是花費了幾年心血的課題,基本上沒有任何問題。鵝廠差不多,不過問的是另外一個項目。不過鵝廠的高級經理還是有水平的,最後說了一句你在國外沒有國內幹活兒賣力。哈哈哈哈,當時確實尷尬了一下。
體制內研究所:剛面了一家某頂級武器研究所,一刻鐘就妥了,體制內嘛基本上就是出身,項目,然後談一談,一向如此。
數據分析師需要掌握的東西我覺得基礎上來說概率統計數學,矩陣論,隨機過程等幾門數學要比較熟悉;演算法上來說,西瓜書李航的書要反覆看,別人說這兩本書是入門的書籍,我個人看的是李航,看了好多遍,每次看都會有新收穫,都會去有針對性的擴展,這個過程感覺很有意思,除此之外,XGBT等最近Kaggle上比較火的演算法要知道,而且要有自己的思考;分析工具上來說Python下面的庫比如Pandas還是重要的;可視化商軟,開源軟體會一兩種就差不多;主流框架會一種就夠用。
數據分析領域的職業機會:金融行業數據分析,額還是不寫了,確實太多了。AI時代哪裡不要數據?
簡歷怎麼寫:如實寫。
認識的人太多,匿了
這裡就先推薦一些入門類的書籍吧。
1、統計基礎(《深入淺出統計學》、《商務與經濟統計(第12版)》)2、分析理論和Excel(《誰說菜鳥不會數據分析》)3、SQL(《SQL必知必會》還有MySQL的官方教程)
4、Python)隨便一本入門教材 + 《利用Python進行數據分析》、《Python科學計算》5、R語言技能(《Learning R》、《R語言實戰》)需要用到的工具/軟體:資料庫軟體:SQL server;mysql;access;Hadoop;hive數據分析挖掘軟體:excel;spss;modeler;Matlab;SAS;R語言;python數據可視化:power BI;tableau職位
Google,Facebook,Amazon,騰訊, 阿里巴巴等廣告科技生態鏈里的名企中,衍生出很多和數據相關的新興工作。如Programmatic Buying,Search Engine Marketing,Paid Social,Business Analytics,Business Intelligence,Data Analytics,Data Science。這些新型的職位,有著大量的空缺崗位正在招人。
CNBC發布了產品經理,產品營銷以及數據科學這3 個就業方向,平均年薪都在10萬美金以上, 很多資深 從業者爆料這只是基本的,多數公司可以給到12-15 萬美金工資,加上股票和期權,比如像這兩年市值翻了N倍的亞馬遜家甚至矽谷一些瘋狂發展的創業科技公司,不少從事數字營銷(Digital Marketing), 產品 設計(Product Design), 商業智能分析(Business Intelligence), Data Science(數據科學)的90後的薪資待遇都接近20萬美金。
面試推薦你一些文章
90%面試者谷歌、京東等名企失敗的原因是什麼?
面試時絕大部分求職者都不會注意的3個細節
職圖CareerTu:求職四步走,Offer拿到手!簡歷、面試、人脈,技巧全都有
了解更多歡迎關注微信公眾號CareerTu
後台回復[知乎]
即可領取11節行業課程, 全面講解Google, Amazon, GrubHub, Gucci, LVMH等科技和時尚新零售公司求職攻略。
一名合格的數據分析師應該掌握
- 網頁爬蟲:Python或R
- 數據存儲:Excel或者MangoDB等
- 數據清洗:數據缺失處理等
- 數據分析:線性回歸等
- 數據可視化:Python或R的可視化包、Tableau等
進階級別數據分析師:
- 統計知識
- 運籌學知識
- 機器學習知識
掌握以上三個技能點
便可稱之為數據科學家
至於面試要準備些啥?
Simply按照上面技能點一一準備
但是今天要說的
是一項奇淫技巧
那就是--
寫一篇數據分析的推文
在這篇推文中展現前面1-5個技能點
這就是最好的簡歷和項目經歷(面試談資)
並且還能展現你的文字技巧(非常重要!!!)
記得把推文鏈接放在簡歷中
經典案例--出自公眾號『運籌OR帷幄』數據分析版塊:
留德華叫獸:【數據分析】用大數據帶你了解全球電影行業—華語篇?zhuanlan.zhihu.com
下面簡單截圖說明
閱讀完整推文:
【數據分析】用大數據帶你了解全球電影行業—華語篇
倆句話總結:
項目經歷是你最好的簡歷
把項目以推文的形式呈現--事半功倍!
本文發布在全球華人運籌學/數據科學/人工智慧社區(歡迎加群交流):
『運籌OR帷幄』大數據人工智慧時代的運籌學?zhuanlan.zhihu.com
福利:
公眾號 『運籌OR帷幄』後台回復關鍵詞:「華語電影福利」
獲取獲取9分以上且評價人數大於20萬、不容錯過的華語神片!
回復關鍵詞:「華語電影代碼」
獲取本文數據集和全部源代碼,助你上手第一個數據分析實戰項目!
隨著我國經濟決策逐漸由拍腦袋的「經驗決策」轉向「數據決策」,項目數據分析成為戰略決策、經營決策、投資決策必備的科學方法論。數據分析崗位已經成為企業重要的崗位,數據分析師也越來越多的受到重視。數據分析師面試時面試官喜歡問那些問題,我們可以從國外的數據科學家面試問題中得到一些參考,下面是幾個關於數據分析師應聘的時候常會被問到的幾個問題,數據分析師們參考。
1、你處理過的最大的數據量?你是如何處理他們的?處理的結果。
2、告訴我二個分析或者計算機科學相關項目?你是如何對其結果進行衡量的?
3、什麼是:提升值、關鍵績效指標、強壯性、模型按合度、實驗設計、2/8原則?
4、什麼是:協同過濾、n-grams, map reduce、餘弦距離?
5、如何讓一個網路爬蟲速度更快、抽取更好的信息以及更好總結數據從而得到一乾淨的資料庫?
6、如何設計一個解決抄襲的方案?
7、如何檢驗一個個人支付賬戶都多個人使用?
8、點擊流數據應該是實時處理?為什麼?哪部分應該實時處理?
9、你認為哪個更好:是好的數據還是好模型?同時你是如何定義「好」?存在所有情況下通用的模型嗎?有你沒有知道一些模型的定義並不是那麼好?
10、什麼是概率合併(AKA模糊融合)?使用SQL處理還是其它語言方便?對於處理半結構化的數據你會選擇使用哪種語言?
11、你是如何處理缺少數據的?你推薦使用什麼樣的處理技術?
12、你最喜歡的編程語言是什麼?為什麼?13、對於你喜歡的統計軟體告訴你喜歡的與不喜歡的3個理由。
14、SAS, R, Python, Perl語言的區別是? 15、什麼是大數據的詛咒?16、你參與過資料庫與數據模型的設計嗎?
17、你是否參與過儀錶盤的設計及指標選擇?你對於商業智能和報表工具有什麼想法?
18、你喜歡TD資料庫的什麼特徵? 19、如何你打算髮100萬的營銷活動郵件。你怎麼去優化發送?你怎麼優化反應率?能把這二個優化份開嗎?20、如果有幾個客戶查詢ORACLE資料庫的效率很低。為什麼?你做什麼可以提高速度10倍以上,同時可以更好處理大數量輸出?
21、如何把非結構化的數據轉換成結構化的數據?這是否真的有必要做這樣的轉換?把數據存成平面文本文件是否比存成關係資料庫更好?22、什麼是哈希表碰撞攻擊?怎麼避免?發生的頻率是多少?
23、如何判別mapreduce過程有好的負載均衡?什麼是負載均衡?
24、請舉例說明mapreduce是如何工作的?在什麼應用場景下工作的很好?雲的安全問題有哪些? 25、(在內存滿足的情況下)你認為是100個小的哈希表好還是一個大的哈希表,對於內在或者運行速度來說?對於資料庫分析的評價?
26、為什麼樸素貝葉斯差?你如何使用樸素貝葉斯來改進爬蟲檢驗演算法?
27、你處理過白名單嗎?主要的規則?(在欺詐或者爬行檢驗的情況下) 28、什麼是星型模型?什麼是查詢表?29、你可以使用excel建立邏輯回歸模型嗎?如何可以,說明一下建立過程?
30、在SQL, Perl, C++, Python等編程過程上,待為了提升速度優化過相關代碼或者演算法嗎?如何及提升多少?
31、使用5天完成90%的精度的解決方案還是花10天完成100%的精度的解決方案?取決於什麼內容?32、定義:QA(質量保障)、六西格瑪、實驗設計。好的與壞的實驗設計能否舉個案例?
33、普通線性回歸模型的缺陷是什麼?你知道的其它回歸模型嗎? 34、你認為葉數小於50的決策樹是否比大的好?為什麼?35、保險精算是否是統計學的一個分支?如果不是,為何如何?
36、給出一個不符合高斯分布與不符合對數正態分布的數據案例。給出一個分布非常混亂的數案例。37、為什麼說均方誤差不是一個衡量模型的好指標?你建議用哪個指標替代?
38、你如何證明你帶來的演算法改進是真的有效的與不做任何改變相比?你對A/B測試熟嗎? 39、什麼是敏感性分析?擁有更低的敏感性(也就是說更好的強壯性)和低的預測能力還是正好相反好?你如何使用交叉驗證?你對於在數據集中插入雜訊數據從而來檢驗模型的敏感性的想法如何看?40、對於一下邏輯回歸、決策樹、神經網路。在過去15年中這些技術做了哪些大的改進?
41、除了主成分分析外你還使用其它數據降維技術嗎?你怎麼想逐步回歸?你熟悉的逐步回歸技術有哪些?什麼時候完整的數據要比降維的數據或者樣本好? 42、你如何建議一個非參數置信區間? 43、你熟悉極值理論、蒙特卡羅邏輯或者其它數理統計方法以正確的評估一個稀疏事件的發生概率?44、什麼是歸因分析?如何識別歸因與相關係數?舉例。
45、如何定義與衡量一個指標的預測能力? 46、如何為欺詐檢驗得分技術發現最好的規則集?你如何處理規則冗餘、規則發現和二者的本質問題?一個規則集的近似解決方案是否可行?如何尋找一個可行的近似方案?你如何決定這個解決方案足夠好從而可以停止尋找另一個更好的? 47、如何創建一個關鍵字分類?48、什麼是殭屍網路?如何進行檢測?
49、你有使用過API介面的經驗嗎?什麼樣的API?是谷歌還是亞馬遜還是軟體即時服務?
50、什麼時候自己編號代碼比使用數據科學者開發好的軟體包更好?
分析師是個範圍很廣的tittle,各行各業都有分析師,在這裡分享下互聯網行業的數據分析師崗位。
不同公司、不同部門對「數據分析師」這個崗位的定義不同,搞清楚你去面的分析師崗位是哪種類型來針對性做準備是比較有效的。
- BI數據分析師類:有些數據分析崗位是在業務部門內部的、主要工作是報表開發和決策支持一類的,這種崗位的技能要求主要是SQL,SQL能力過硬是非常必要的。此外,邏輯思考能力和商業理解力也很重要,可以參考一些Consulting行業Case Interview的題目來準備;
- 數據科學/統計建模類:有些tittle是數據分析師的崗位主要工作是偏統計建模和數據挖掘的,比我所在的TMD中某廠,應屆的數據分析師崗位主要面向數據科學、統計分析方向。去面此類工作,統計學基礎是必考的,回歸和假設檢驗會是重點,因為在實際工作中很常用。很有必要提前了解一下互聯網行業AB實驗方面的方法理論,基本上是必考的。另外,如果機器學習沒有真的做過(只是上課大概學了一下),簡歷最好別寫精通機器學習啥的,不然很容易被面試官懟死:)
寫過一篇文章,你看看,內容我就不粘貼過來了
杜超:數據分析師面試與簡歷?zhuanlan.zhihu.com
老潘最近在招數據分析師,因此這塊有一點心得,姑婆就請他來分享給大家。
在談面試技巧之前先看看數據分析師崗位的意義以及工作內容:
崗位意義:
營銷效果數據能反應營銷渠道的健康度。能知道哪裡做的不足,後面需要哪些調整,數據經過分析後還能幫你做出正確的營銷方案。
渠道效果數據的挖掘像是給渠道用戶畫像。先收集用戶在網路上留下的痕迹也就是數據,然後對數據進行分析,得出用戶特徵,洞察用戶喜歡,將用戶的畫像越描越細。比如渠道用戶地域分布,訪問路徑,訪問時長,下單時間,客單價,訂單類型等等。如此後續可通過精準的營銷,根據用戶喜好,匹配用戶喜歡的產品,從而提升渠道效果。
此外,專業的數據分析崗,不僅可以給營銷人員提供數據支持,亦可極大減輕營銷人員的壓力,使得營銷人員有足夠的精力去拓展資源。
工作原則:
數據的保密性,外部門要數據,需請示領導。內部門要數據,只能要自己渠道的數據,別的數據不提供,如確實需要,發郵件給領導申請。
工作內容:
1、理清數據定義。每個指標是什麼意思?
2、搭建報表模型。報表的指標,報表的功能,模塊等等。需要站在業務角度,給技術提需求。跟進需求,直至完成。
3、搭建報告模型。周報,月報,季報,年報,渠道分析報告等等指標的搭建。表格表頭的搭建,PPT樣版的搭建。
4、錄入數據表格。從報表裡選擇需要的數據,錄製到表格里。
A、單渠道單天效果表。可反映渠道單天的效果以及變化。
B、單渠道月度效果表。可反映渠道月度的效果以及變化。
C、營銷費用表。可反映渠道的花費以及變化。
D、整體月度效果表。可反映所有渠道的整體月度效果。
E、日報,周報,月報,季報,年報。固定時間段的數據錄入以及分析,包括環比,同比的增長趨勢。
F、報告製作。錄入數據後,將數據做成圖形,入曲線圖,柱狀圖,餅圖等等。
G、數據分析。根據圖形數據,分析數據的變化原因,從而提出自己的營銷建議。
H、合同提報,錄入。收到合同提報需求後,提報,直至完成。
I、付款整理提報。收到合同提報需求後,提報,直至完成。
J、部門流程梳理,章程建設。將部門的一些流程(渠道合作流程,渠道上線流程,營銷活動流程等等製作成圖)
K、渠道監播。監播渠道的廣告位是否上線。比如在91買了首頁第一的位置,需要看是否按時上線,按時下線,是否全量(全時間,全地域)。
工作順序:
1、了解清楚部門有哪些數據?
2、各個數據的定義,意義?
3、業務人員的需求?目前的數據是否滿足需求?
4、調研需求,製作表頭。
5、製作報告,分析模板。
6、優化,修改。
經過上面的論述,已經大致了解了數據分析師的崗位意義以及工作內容。下面我們來談面試數據分析師的技巧。
數據分析師和營銷推廣崗位不同。數據分析師的靠譜與不靠譜,是能很直觀的反映出來的。我面試數據分析師的方式比較簡單粗暴,一般就是一看二問三PK。
一看,看他之前做過什麼表格,做過什麼PPT,做過什麼類型的分析。表格和PPT的製作是反映工作的基本能力,數據分析是反映如何更好勝任工作。看到這2個能力之後,數據分析師的業務能力也就可以看出來了。
二問,問他之前工作的數據指標,大概的一些數據。問他數據背後的邏輯推導意義。
問他之前工作的數據指標,大概的一些數據。可以反映他之前的熟練程度,是否對數據敏感,達到信手拈來,脫口而出的境界。一個好的數據分析師需熱愛數據,保持對數據的敏感性,將一些基本數據印在腦海里。
問他數據背後的邏輯推導意義。可以反映他之前對數據的理解力,是否是囫圇吞棗,是否只知其然,不知其所以然。一個好的數據分析師,需要知道數據背後的意義,數據的推導邏輯,到底這個數據是怎麼來的,是否合理。
三PK。PK他做數據的細節,PK他做數據的穩定性,PK他做數據的態度。
好的數據分析師需追求數據的完美,數據的格式,字體都要保持一致。好的數據分析師,數據需要準確,嚴謹。好的數據分析師,要堅持任何一個數據不能出錯。
數據分析師的最高境界,保持推敲,質疑數據的習慣。能主動建立數據模型,真切的反映數據,使得各項數據健康化。
歡迎私信交流知乎運營心得~或者留言評論進姑婆的知乎運營交流群
我們組只要統計或者應數的博士,所以我覺得數學類本碩博是硬性條件。
很多人覺得沒必要,其實是需要的,其它的,會不會寫代碼,會不會profiling,我們有碼農的。我看過計算機甚至更遠專業的簡歷,除非頂校了。我覺得不需要準備,我們就是聊聊
推薦閱讀: