這是一份數據分析求職指南--當我爬取拉勾、前程無憂、Boss直聘後

項目簡介

很多人想要轉行做數據分析,我也是其中一員,但是糾結於去哪個城市,最高能夠拿多少薪水,學歷和工作經驗有沒有限制?相信有很多人也和我一樣有這些困惑。

為了弄清這些問題,我決定用數據獲得答案。因此本次項目主要分析了招聘網站上數據分析崗位的相關信息,然後進行分析。

帶著問題展開項目

本次分析期望解決以下問題:

1、哪些城市對數據分析師的需求較大?

2、轉行換城市時應該住在哪裡找工作最為方便?

3、數據分析師的薪酬是多少?哪些城市數據分析師的薪資最高?

4、隨著工作經驗增加,數據分析師的薪資如何變化?

3、數據分析師對學歷的要求是怎樣的,學歷對個人發展是否有影響?

7、不同的招聘網站信息是否有差異?差別在哪裡?

一、獲取數據

我爬取了自己最常用的三個網站的數據:

1、 拉勾網

2、 前程無憂

3、 Boss直聘

爬取數據時使用的是爬蟲類工具:八爪魚,

主要爬取了以下信息:

崗位名稱、薪資、城市、區域、公司規模、所屬行業、融資階段、經驗要求、學歷要求、全職/兼職。

爬取出來的數據是excel格式,原始數據格式較為混亂,在此不再展示。

二、數據清洗

我是用power query對數據進行了簡單的清洗,使其變得規範,經過處理後的數據大致如下。

拉勾網數據處理結果

前程無憂數據處理結果

Boss直聘數據處理結果

其中有幾個小問題:

1、我將全職與實習崗位中的實習崗位刪除了,不作分析

2、前程無憂網站對數據分析匹配不夠精準,爬取數據較多,有很多干擾數據,因此我按照職位劃分將其中明顯不是數據分析的崗位刪除了(比如美工等)。在刪除崗位的過程中有一定的主觀因素。

3、原始的薪資範圍為一個範圍,如2-8K/月,我將其取均值,實際上可能很多人拿到的薪資偏上限或偏下限,這方面存在誤差

4、Boss直聘爬取數據較少,再加上考慮到篇幅問題,有些分析的比較細的地方不再分析Boss直聘的情況。

三、數據分析與展示

首先我比較困惑哪些城市裡數據分析相關的工作較多。因此做了一個簡單的可視化。發現幾個招聘網站的數據差別挺大。

1、每個城市的招聘信息數量

拉勾網上每個城市的招聘信息數

從拉勾網上可以看出對數據分析相關的人才需求量較大的城市依次是北京、上海、杭州、深圳、廣州、成都。其他城市的需求量非常小。值得注意的是,北京佔比接近50%,其次是上海。

為了進一步弄清每個城市的需求量,我又對比了前程無憂上的數據。

前程無憂上每個城市的需求量

前程無憂上的數據跟拉勾網上有一定的區別。

其一,前程無憂上需求量最大的城市依次是上海、北京、杭州、鄭州,其他城市需求較小,對比拉勾網,這裡少了深圳和廣州,多了鄭州。

其二,前程無憂上上海的需求量超過50%,其次是北京、杭州,這個數據跟拉勾網上反了過來,值得進一步探究。這可能跟每個招聘網站的特徵以及城市的地域特點有關(比如:拉勾網上多為互聯網企業,北京互聯網企業最多),可以嘗試從公司領域進行分析。(由於還沒學會分詞技術,因此先保留公司所在領域這一部分信息,留待以後進一步探究。)

通過對以上兩個網站的對比,我發現一個讓我憂慮的問題。大都是一線城市工作機會比較多,如北京、上海,杭州極可能是因為互聯網公司較多,除杭州外的二線城市機會很少,三線城市缺口更少。考慮到房價等現實因素,很多人未來還會回到家鄉發展,到時候可能會比較困難。

Boss直聘上每個城市的招聘信息數

我對Boss直聘上的數據也進行了分析,發現事情也許沒那麼糟糕,在這個網站上,並未出現某個城市佔據半壁江山的場景。依然是北京、上海、杭州、廣州、深圳這幾個城市的需求量比較大,其他城市比較少。但是有些二線城市,比如成都、南京、濟南、鄭州、佛山、天津、武漢、西安等地也有一定的需求量。

總體來說,如果想尋找相關工作,機會最多的城市依次是北京、上海、杭州、廣州、深圳,可以考慮去這幾個城市發展。如果後期不能留在這幾個城市,請做好合適的工作比較少的心理準備。

2、住哪裡

我本身不在這幾個城市工作,在換城市換工作的過渡期,比較糾結於住哪裡,能夠面試比較方便。

為了探究轉行換城市時應該住在哪裡找工作最為方便,我接著分析了不同城市每個區域的招聘信息數量。

同樣的,我先分析了拉勾網的數據。由於篇幅問題,我只列舉了北京和上海的情況,如果你要去的是其他城市,可以打開文末的報錶鏈接中,選擇你意向的城市。

北京

上海

如上圖所示,如果選擇去北京工作,不管想要去什麼規模的公司工作,朝陽區和海淀區的工作機會都更多,居住在朝陽區比較合適。如果選擇去上海工作,浦東新區和靜安區工作機會較多,浦東新區是個不錯的選擇。

在前程無憂上北京同樣是朝陽區和海淀區機會較多,上海的話,如果想要去大公司浦東新區和徐匯區比較合適,小公司的話浦東新區和靜安區較為合適。

北京

上海

3、數據分析師的薪資

薪酬跟工作經驗、學歷、城市、公司規模等因素息息相關,我覺得如果僅從宏觀上給出薪資,意義不大。因此,我從以上四個角度,綜合對比了三個網站的薪資。

拉勾網上不同維度的平均薪資

上圖為拉勾網的平均薪資,從工作經驗上,經驗5-10年、3-5年、1-3年、1年以下、不限工作經驗的情況下,數據分析師的月均薪資分別師為29.8K、20K、14.7k、12.4k、5.3k。基本上符合工作經驗越高,薪資越高的規律。

從學歷方面分析,本科及以上學歷、碩士及以上學歷、大專及以上學歷、不限學歷職位的平均薪資分別為19.1K、17.1k、10k、18k,本科和碩士學歷的薪資較為接近,但是大專學歷的數據分析師平均薪資僅有10k。這說明當求職者的學歷為大專時,學歷可能是影響薪資的制約因素之一,而本科和碩士的差別則不大。

從公司規模的維度來說,月均薪資最高的是50-150人規模的小公司,達21.8k,除此之外基本符合規模越大,薪資越高的特點。

從城市的維度來說,在拉勾網上薪資最高的幾個城市依次是北京、深圳、上海、杭州、武漢,北京的的平均薪資高達20.9K。

Boss直聘上月均薪資詳情

根據BOSS直聘的信息,平均薪資最高的城市是廣州,其次是北京、深圳、杭州、上海。學歷和平均薪資成正比,學歷越高,薪資越高。公司規模也與薪資成正比,總體上公司越大,給出的平均薪資越高。工作經驗和薪資基本呈正比關係,但是無工作經驗的平均薪資略高於1年以內與1-3年工作經驗。5-10年經驗的員工月均薪資達28K, 3-5年員工月均薪資為16k,薪資水平略低於拉勾網。

用同樣的方法對比前程無憂的數據,發現前程無憂上的薪資水平明顯低於拉勾網。但是前程無憂上的薪資分布規律跟拉勾網上較為接近。

在工作經驗方面,基本符合經驗越高,薪資越高的規律,但是值得注意的是,在該網站上,工作經驗小於三年時,平均薪資集中在8-10K,無工作經驗的薪資甚至略高於1-2年工作經驗,當工作經驗大於3年時,薪資上漲幅度較大,當工作經驗大於5年時,月均薪資又會有一個的大幅度的上漲,但是當工作經驗超過五年時,月均薪資甚至略有下降,且該網站上沒有9年以上工作經驗的招聘,5-9年可能是數據分析師的一個瓶頸期,若想從事該工作,應當關注該崗位的長期發展。

從學歷的維度分析,前程無憂上碩士和博士,尤其是碩士學歷具有一定優勢,本科以下的學歷則月均薪資較低,尤其是中專學歷,月均薪資只有5.5K。

從公司規模的維度分析,該網站上大中型公司的薪資集中在11-13K左右,小型公司略高於10k,對比大公司略有差別。

從城市的維度分析,需求較大的城市中,北京、上海、杭州的月均薪資分別為11.9k、11k、9.5k。

前程無憂上不同維度月均薪資

拉勾網上不同維度月均薪資

4、工作經驗與薪資的關係

但是,值得注意的是,在分析拉勾網不同工作經驗的月均薪資時,工作經驗1年以下時,薪資反而遠遠低於1年工作經驗的薪資。

工作經驗1年以下時的月均薪資

工作經驗不限時的月均薪資

進一步對二者進行對比分析,發現對比不限經驗,一年以下經驗的崗位多要求大專學歷,招聘城市很少,於是猜測可能是拉勾網上該類招聘信息很少,不具代表性。通過分析發現一年以下經驗的招聘信息僅有兩條。

我分別分析了兩個網站上不同年限工作經驗的薪資詳情,他們的規律和總體規律基本保持一致,因此不再贅述,僅給出圖片。

前程無憂1年經驗詳情

前程無憂2年經驗薪資詳情

前程無憂3-4年經驗薪資詳情

拉勾網1-3年工作經驗詳情

因此,不考慮一年以下經驗的干擾,在10年內,工作經驗與月均薪資是成正比的,也就是說,數據分析師越老越吃香的。但是我也注意到,網站上招聘信息上未出現是十年以上經驗的要求,結合前面對前程無憂的分析,工作經驗超過五年時,月均薪資甚至略有下降,且該網站上同樣沒有9年以上工作經驗的招聘。因此,5-10年是否是數據分析師的頂峰,5-10年以後是否會進入瓶頸期,這些問題都還未知。若想從事該工作,應當關注該崗位的長期發展。

拉勾網上3-5年經驗月均薪資

拉勾網上5-10年經驗月薪詳情

前程無憂上工作經驗5-10年月薪詳情

根據上圖,對於5-10年工作經驗的求職者來說,在前程無憂上,工作經驗超過5年以後,10000人以上的大公司更傾向於給出高薪,而且我注意到,北京、上海、杭州幾個城市的薪資十分接近,幾乎沒有差異。在拉勾網情況並不相同,工作經驗超過3年後,小公司更傾向於給出高薪,工作經驗5-10年時,廣州和北京的薪資明顯高於其他城市。

另一方面,可能一部分人會關心,當工作經驗達到一定程度後,能否彌補學歷上的欠缺。工作經驗為3-5年時,拉勾網上大專學歷薪資仍遠低於本科及碩士學歷;工作經驗超過5年以後,在拉勾網上的相關招聘信息均要求本科學歷及以上,在前程無憂上大專學歷的平均薪資仍然只有12.1K,這並不是一個理想的數據。

4、不同的招聘網站的要求與薪資對比

我從上面的分析中我們已經看出不同網站的信息差別較大,但是具體有哪些差別呢?

因此我以北京市為例,分析了不同網站的公司規模、薪資、學歷要求等因素。如果你想查看其他城市的情況,可以在文末共享的報錶鏈接中點擊查看。

從下圖可以看出在北京,招聘公司最多的依次為規模為2000人以上的大中型公司,150-500人規模的小公司,500-2000人規模的公司,更小的公司比較少。薪資集中在10-30K。

在崗位要求上,拉勾網對經驗的要求多為3-5年和1-3年,對於轉行的人來說,有一定的門檻。拉勾網對學歷的要求多為本科及以上即可,只有少數公司要求碩士及以上。

拉勾網上招聘信息數量分布

接下來看前程無憂的數據,同樣以北京為例,招聘公司最多的依次為規模為150-500人、50-100人、500-1000人中型或小型公司。在薪資方面,0-10K佔比達52%,多數企業給出的薪資集中在0-20K之間,這個數據低於拉勾網。

但是相應的,在崗位要求上,該網站對工作經驗的要求多為無工作經驗,這可能跟前程無憂上的校招版塊有關。大多數公司未註明學歷要求,註明的公司一般要求本科及以上即可,部分公司僅要求大專學歷。

前程無憂上招聘信息數量分布

在薪資方面,招聘信息較多的幾個城市中,北京的平均薪資最高,上海次之,其次是杭州。學歷和平均薪資成正比,學歷越高,薪資越高。公司規模也與薪資成正比,總體上公司越大,給出的平均薪資越高。值得注意的是,工作經驗和薪資並未嚴格呈正比關係,無工作經驗的平均薪資略高於一年與二年工作經驗。5-7年工作經驗的平均薪資超過20K,略高於8-9年工作經驗的平均薪資,總的來說工作經驗達到三年和五年薪資都會明顯上漲,當工作經驗超過七年後是一個瓶頸期。

接下來看Boss直聘的數據,同樣以北京為例,招聘公司最多的依次為規模為10000人以上、100-499人、1000-9999人。在薪資方面,0-10K範圍最多,其次是10-20K,多數企業給出的薪資集中在0-20K之間,這個數據略低於拉勾網。

相應的,在崗位要求上,該網站對工作經驗的要求多為1-3年工作經驗和無工作經驗,學歷要求本科或者碩士,僅要求大專或者不限學歷的公司較少。

Boss直聘上招聘信息數量分布

總體來說,三個網站,拉勾網的薪資最高,但是相對來說對工作經驗的要求較高,1-3年工作經驗的話,在拉勾網上求職更有優勢。Boss直聘的薪資略低於拉勾網,但是相對來說對學歷有所要求。前程無憂薪資最低,對學歷與工作經驗要求沒有其他兩個網站嚴格。

4、選擇大公司還是小公司

上述分析僅是宏觀層面的簡單分析,實際上每個人的情況不同。通常很多人都會糾結選擇大公司還是小公司,我也有這種糾結,所以在薪資方面和人才需求方面對大公司和小公司進行了對比。

以我自己為例,我做了一個簡單的分析,首先我的意向城市是北京,學歷是碩士,工作經驗在1年以內。

首先在拉勾網上,根據以上情況做選擇,我發現可供選擇的公司規模較少,多為2000人以上規模的公司和150-500人規模的公司。在薪資方面,2000人以上的大公司給出的平均薪資略高15.4k。150-500人規模的公司給出的平均薪資為24K,二者的薪資差別較大。

拉勾網

在前程無憂上,根據以上情況做選擇,結果和拉勾網相反,可供選擇的公司規模較多,多為中小型公司,給出的月均薪資在在9-11K的範圍之間。大公司的人才需求較少。在薪資方面,5000-10000人和10000人以上的大公司給出月均工資均大於14K,超過中小型公司。

前程無憂

在BOSS直聘上,可供選擇的公司規模如下,其中大中型公司最多,且給出的薪資最高。

Boss直聘

以上數據在大家找工作的過程中可作參考。不同的招聘網站情況不同,實際情況中,我們可能還要考慮帶公司所在領域、個人職業規劃等因素。

小結:

1、從城市的維度,如果想尋找相關工作,薪資最高、機會最多的城市是北京、上海、杭州、,如果後期不能留在這幾個城市,請做好合適的工作比較少的心理準備。

2、在找工作時,如果選擇去北京工作,朝陽區和海淀區的工作機會都更多,居住在朝陽區比較合適。如果選擇去上海工作,浦東新區是個不錯的選擇。每個人可根據自己的意向在文末共享的報錶鏈接查找合適的居住區域。

3、從城市的維度來說,在拉勾網上薪資最高的幾個城市依次是北京、深圳、上海、杭州、武漢,北京的的平均薪資高達20.9K。BOSS直聘上月均薪資最高的城市是廣州,其次是北京、深圳、杭州、上海。前程無憂上月均薪資最高的城市依次是北京、上海、杭州。

4、三個招聘網站均基本符合工作經驗越高,薪資越高的規律。但是無工作經驗的平均薪資可能會略高於1年以內與1-3年工作經驗。一般來說,當工作經驗大於3年時,薪資上漲幅度較大,當工作經驗大於5年時,月均薪資又會有一個的大幅度的上漲。在10年內,工作經驗與月均薪資是成正比的,也就是說,數據分析師越老越吃香的。但是網站上招聘信息上未出現是十年以上經驗的要求,因此,5-10年是否是數據分析師的頂峰,5-10年以後是否會進入瓶頸期,這些問題都還未知。若想從事該工作,應當關注該崗位的長期發展。

5、三個招聘網站均基本符合學歷越高,薪資越高。一般本科以下學歷薪資與本科以上差別很大,本科和碩士差別不大。其中前程無憂上碩士和博士,尤其是碩士學歷具有一定優勢。求職者的學歷為大專時,學歷可能是影響薪資的制約因素之一,工作經驗為3-5年時,拉勾網上大專學歷薪資仍遠低於本科及碩士學歷;即使工作經驗超過5年以後,在拉勾網上的相關招聘信息均要求本科學歷及以上,在前程無憂上大專學歷的平均薪資仍然只有12.1K,這並不是一個理想的數據。

6、三個網站基本符合公司規模越大,給出的平均薪資越高的規律。其中較為例外的是拉勾網上月均薪資最高的是50-150人規模的小公司,達21.8k。

7、三個網站,拉勾網的薪資最高,但是相對來說對工作經驗的要求較高,1-3年工作經驗的話,在拉勾網上求職更有優勢。Boss直聘的薪資略低於拉勾網,但是相對來說對學歷有所要求。前程無憂薪資最低,對學歷與工作經驗要求沒有其他兩個網站嚴格。

8、在關於大公司小公司的選擇上因人因城市而已,感興趣的人可以根據我在文末共享的鏈接查看自己的情況,了解你的個人情況下,大公司小公司的薪資差異,以便你結合其他因素作出選擇。

我插入的圖片可能不清晰,所以我共享了一下報表,如果你想查看詳細的報表,對自己的情況做出分析,請點擊以下鏈接:

拉勾網:

Microsoft Power BI?

app.powerbi.com

前程無憂:

Microsoft Power BI?

app.powerbi.com

BOSS直聘:

Microsoft Power BI?

app.powerbi.com

詳細數據見以下鏈接:pan.baidu.com/s/1aE-HOp

本次分析不足:

沒有分析公司領域的影響;

未考慮招聘要求中的專業要求以及技能要求等因素。

歡迎大家在留言區批評指正。


推薦閱讀:

治療癌症的有效解藥--基因數據
如何用表單收集高價值數據?
李彥宏談隱私這麼有底氣,原來已有案例做支持
搜狐視頻模擬登錄以及上傳
數據科學的新生代工具(附實操代碼)

TAG:數據分析 | 數據 | 數據分析師 |