職場 | 只會Excel能勝任大數據方向的實習工作嗎?
編者按
最近又到了畢業求職季,許多應屆畢業生想要進入數據分析或者大數據行業,但又不知道自己在這些崗位為上該做些什麼、應該學習那些技能。在知乎上也看到這樣一個提問,答主挖數的回答完整而系統,C君獲得授權,整理在此,供大家參考。
問題:大數據方向實習生到底該做些什麼?最近逃離學校在某大數據公司實習,雖然我不認為大數據像現在很多人說的那麼邪乎,但是我認為互聯網時代所帶來的大量數據是很有價值的。所以便在這個公司做實習生,已經一個多星期了,都是做一些簡單的搜索,排序,去重的活。excel就完全搞定了。每天需要找的東西毫無技術含量,卻挺耗費時間。不知道這是不是實習的融入期。大三就逃離學校,冒的風險也挺大的。我該學點什麼,做點什麼準備才能讓未來走的更快。畢業目標,在北上廣年薪10w+這個目標容易實現么,需要具備什麼樣的素質。答主挖數:
Excel2013目前可以支持104萬行數據,即使是這樣也遠遠算不上大數據。
以下是華院數據整理的2015年大數據相關公司排名,看看你的公司在不在裡邊?
話說回來,對於一個實習生來說,讓你處理Excel不能說不合理,因為Excel處理是數據分析的基礎中的基礎,拉拉數據透視表,寫寫vlookup等函數甚至用vb寫一些自動化,一旦熟悉了對於你的數據分析是大有卑益的!還別說,一般公司的數據分析師崗位或者說一些市場調研公司還就只是要求會Excel和PPT。說到薪資,對於北上廣來說10W+是應屆畢業生的程序員職位的起薪,如果你僅會Excel,去一些靠譜的市場調研公司做數據分析,大一點的公司如尼爾森、華通明略這種可以拿到6K左右的薪資,6*13就是8W左右了,如果你想去BAT這種公司裡邊做數據分析,只會Excel是不夠的,你還需要至少懂點SPSS或者R,當然如果能進去的話10W+是有的。個人建議的話,最好不要為了錢而去學一樣東西,這樣內在驅動力不會大到讓你走得比別人快,儘快確定一個感興趣的方向,隨著大數據概念的興起以及企業的越加重視,數據相關的崗位細分越來越多,每一個細分都足夠你好好鑽研個10年+。看到評論區有人問到是否會SPSS就可以進BAT做數據分析,答案是肯定的,並不是說進BAT一定要會擼代碼,因為隨著數據職位的細分,互聯網公司需要一些有產品思維並且略有統計背景的人來做數據分析,以下貢獻一張圖。
我喜歡根據職位離業務端(如產品、運營、銷售等)的遠近以及離技術端(開發部門)的遠近來描述職位,可以看到,在不同的位置都有數據相關的職位。
說說市場調研,這種職位是最靠近業務的,他們的工作主要是調研外部數據,比如產品目標用戶的情況,競爭對手的情況,整個行業的情況等,為產品的每一個改版提供數據支撐,對於互聯網公司來說這種職位一般會放在UED(用戶體驗部)或者產品部下面,日常工作比如去各個城市開用戶訪談會,用調研問卷的形式收集用戶數據,打用戶調研電話,設計訪談問卷等,崗位要求不會涉及到編程,一般的要求就是統計學基礎知識,EXCEL跟PPT,SPSS懂一些更好,BAT及其他中小型互聯網公司都有崗位招聘。
對於這種類型的崗位,建議一開始可以去諮詢公司,市場上有非常多好的諮詢公司可以選擇,比如全球最大的尼爾森、華通明略、易普索、蓋洛普之類,互聯網行業的有艾瑞、艾媒、易觀之類,都是不錯的選擇。從職業發展道路來講,市場調研除了是各個行業普適的職位之外(快速消費品行業對市場調研的需求量很大),在大公司縱向發展可以做到市場調研總監,橫向發展可以去做品牌經理或者互聯網公司產品策劃類的產品經理。
數據分析師,各行各業都有做數據分析的崗位,但估計是最近1,2年在互聯網公司才有數據分析師這個title的職位出現,之前一直是產品經理或者運營經理在做數據分析的活,之所以細分出來是因為隨著數據量越來越大以及數據價值的凸顯,做數據分析的門檻越來越高,舉個栗子,做數據分析你需要取數據吧,取數據一般需要寫SQL語句從資料庫里取,你讓一個產品經理或者運營經理去寫SQL估計有些難度,當然技術出身的除外,另外說到分析,數據量大的話Excel總歸不好分析,你得會點能處理大數據量的工具如SAS或者R,如果是SAS的EG模塊還可以圖形化操作,如果是R的話就是純編程了,所以我認為數據分析崗位有30%在於技術,是因為在數據處理層面它需要涉及很多大數據量的操作。
從業務端來看,數據分析師的價值在於能夠為公司搭建數據流,通過數據來對產品功能進行反饋,支持日常的業務部門取數,以及為產品改版提供數據支撐,做到這些你需要跟進整個數據流從頭到尾的流動過程,源頭端比如產品開發時候的數據埋點,你需要跟產品經理及開發溝通哪個功能需要上報哪些數據,有數據上報了你需要跟進這些上報的數據要錄入哪個資料庫的哪張表,數據錄入口徑怎麼定,數據存在資料庫了你需要讓這些數據產生價值,除了業務部門跑來跟你要數據之外,你需要主動地定一些分析課題,自己取數自己用工具進行分析,最後寫成PPT呈現給業務部門並最終影響決策,如果業務部門的取數任務多了,你需要思考怎麼去將這些重複性的取數工作形成報表,自動化地呈現數據,這時你需要去跟後端開發以及數據倉庫的人溝通,並從頭到尾跟進報表的實現。
另外有一種職位叫數據產品經理,它跟數據分析師的職責有重疊的部分,不同的地方是這個職位關注的點是數據分析的產品化。這是普通互聯網公司數據產品經理的日常:
那數據產品經理跟互聯網公司里的產品經理有什麼區別呢?在大的互聯網公司,產品經理有各種細分的,有偏向功能界面設計的產品經理,這類型的產品經理關注的是產品界面的美觀吸引,他們要會用Axure畫各種界面按鈕,最好有繪畫功底,他們跟數據相關的地方在於需要通過數據反饋來改進產品界面;有偏向功能實現的產品經理,這類型的產品經理關注的是產品功能實現是否滿足用戶預期,效率是否夠高,實現步驟是否夠短,他們要求最好有技術背景,能了解開發的各種實現邏輯,他們跟數據相關的地方在於需要通過數據反饋來提高功能實現的成功率,降低崩潰率以及提高實現速度;前面兩者都是屬於前端的產品經理,而後端的產品經理除了幫助各個部門搭建管理平台的產品經理外,剩下的就是數據產品經理了。從以上可以看到,產品經理有各種細分,而數據產品經理也有他不一樣的要求和關注點。這是智聯上某公司數據產品經理的職位描述:
職位描述:1) 負責門戶端、APP端數據統計產品開發及推薦演算法迭代等相關工作,獨立負責產品線的日常迭代工作,以數據為導向對運營結果負責。2) 監管全部產品核心KPI數據,可對運營團隊及時輸出價值數據。3) 負責產品上線後的數據管理和運營工作,對相關數據進行持續監控和分析,並定期對自身產品、整體行業、競爭對手等進行數據分析並評估,不斷優化產品,完成產品生命周期管理。4) 彙報項目核心數據指標和項目進度,對產品生命周期內各項指標負責。5) 負責產品的持續運營,不斷優化、改進、迭代,深度挖掘用戶需求。
從以上描述可以看到該數據產品經理職位有三個關注點:一是數據統計後台;二是推薦系統;三是對產品數據的監控和分析。那麼延伸出來該職位的要求應該是對數據要敏感,了解一定的數據挖掘演算法,於是一個數學或統計學的學位會有所助益。下圖簡單地從背景以及工作中打交道的人來區分數據產品經理和其他產品經理:
終於說到數據挖掘工程師了,在數據相關職位里,我認為數據挖掘和數據架構門檻最高,也是最能體現數據價值的職位。大部分公司在招聘數據挖掘工程師時的門檻都是數學、統計學或者計算機的碩士以上,為什麼本科不行非要碩士?大部分企業認為,只有4年的本科學習不足以理解數據挖掘相關演算法的推導以及應用場景,要做好數據挖掘,除了堅實的數學和統計學基礎之外,演算法的代碼實現也是很重要的考察地方。
數據挖掘何以門檻這麼高,他對企業真有那麼高的價值么?如果將其應用場景搬出來便知分曉。某音樂公司A成立多年,一直以界面小清新用戶體驗絕佳著稱,可惜多年來對音樂版權的重視程度不夠,導致用戶因下載不了喜歡的歌曲而頻頻流失。後來公司痛定思痛,決定另闢蹊徑於是重金聘請了一支數據挖掘工程師團隊,打造了音樂界最好的推薦系統,一下子挽回了大量用戶,現在用戶佔有率穩居行業前三。
是的,推薦系統可以說是數據挖掘最重要的應用場景,最初來源於電商網站的瀏覽了該商品的用戶還瀏覽了什麼,購買了該商品的用戶還購買了什麼,現在發展到各種複雜的特徵度提取並從各個維度來計算相關性。很多著名的數據挖掘演算法,如樸素貝葉斯、神經網路、邏輯回歸等,都需要紮實的統計學基礎以及相關項目經驗才能成熟地應用於業務實踐。
數據挖掘是隨著大數據技術的發展而崛起的一門職業,過去由於技術的局限,很多時候只能通過抽樣來選取訓練數據,導致最後通過演算法出來的預測概率只有60%左右,而大數據的成熟讓工程師能夠對接近全量的數據進行建模,導致最後出來的預測概率能達到80%甚至90%,從而更能體現數據挖掘的價值。從職業發展角度來說,BAT是最適合做數據挖掘的地方,巨量的數據,對技術的重視甚至崇拜以及成熟的應用場景讓數據挖掘工程師如魚得水。一個碩士畢業並有1-2年工作經驗的數據挖掘工程師在互聯網行業能輕易拿到25K往上的月薪。
挖數
互聯網資深數據分析師,愛好爬蟲。
推薦閱讀:
※諮詢顧問實習揭秘——一個矛盾的職業
※實習回憶錄
※實習生吐糟"我的極品上司"
※在酷家樂實習的日子
※獨家!某股票大V「騙炮」女實習生被拒,名利場重演?(轉起來)