標籤:

Kaggle數據分析:什麼專業最有錢景?

專業選擇對於職業生涯的發展非常重要,如果選擇的專業錢景不佳,轉行帶來時間、精力的浪費不可避免。現在出國留學盛行,對於普通家庭來說,孩子留學費用是一筆不小的開支,如果選錯了專業,很有可能打了水漂。那麼,哪些專業最有錢景,哪些專業是收入最差的呢?

數據選擇:Kaggle上的College-Salaries數據集。數據集一共包括三個文件,分別是按照專業、學校類別和地區的薪資數據。其中薪資數據中,均包括了起薪中位數、十年後年薪中位數、十年後年薪的10分位、25分位、75分位和90分位的中位數。按照專業類別的數據中還包括年薪變化百分比。

一、專業與薪資關係:

我們先來看專業與薪資的關係。在R中打開數據集中的degrees-that-pay-back文件,因為列名比較長,首先將列名重命名。

因為所有薪資數據前均帶有美元符號和逗號分隔符,所以將所有薪資數據變化為不帶貨幣符號的數字格式。

1、不同專業薪資數據分布情況:

首先我們看一下所有專業薪資數據的分布情況。

可以看出,50個專業的起薪中位數的平均值在44310美元,十年後薪資中位數平均值為74786美元,平均的薪資變化百分比為69.27%。

2、不同專業起薪數據分析:

將所有數據按照起薪升序排序,顯示前五個起薪最低的專業。

可以看到西班牙語、宗教、教育、刑事司法和新聞是起薪最低的五個專業。其中新聞雖然起薪低,但是可以看到這個專業的年薪變化百分比還算比較高,因此在這五個最低起薪專業中算是有希望的。另外新聞專業十年後的年薪變化幅度也很大,說明這個專業在從業後只要繼續努力,還是有希望拿到10萬美元以上的年薪的。

那麼哪些專業起薪最高呢?重新將所有數據按照起薪降序排序,顯示前五個最高起薪的專業。

可以看到,起薪最高的五個專業分別是醫師助理、化工、計算機、電子工程和機械工程。五個最高起薪專業中有四個都是工程類專業。其中唯一的例外——醫師助理的年薪變化幅度非常小,也就是說,如果一直只能當助理,那麼十年以後薪資也不會有很大變化。

3、不同專業十年後薪資數據分析:

同樣將十年後的薪資水平排序,得到十年後的最低和最高薪資專業。

可以看到十年後最低薪專業依次是教育、宗教、西班牙語、室內設計和音樂。看來教育行業比較悲催,起薪第三低,十年後變成最低……需要注意的是,十年後薪資最低專業增加了室內設計和音樂。這兩個專業起薪僅比新聞專業高一點兒,十年後的薪資徹底滑入了倒數五名以內。

十年後最高薪的五個專業分別是化工、計算機、電子工程、航空航天工程和經濟學。工程類專業依然把持著最高薪中的四個位置。值得注意的是經濟學,憑藉96.8%的薪資變化率進入最高薪前五名,看來經濟學專業作為不擅長理工科的同學不失為一個好的選擇。而且經濟學十年後薪資變化幅度也很大,說明通過努力高薪還能繼續增長。

4、不同專業工作十年薪資變化的數據分析:

剛才看到有些專業雖然起薪不一定高,但是薪資變化百分比比較大,所以十年後薪資水平並不低。那麼十年變化最小和最大的專業分別有哪些呢?

可以看到,醫師助理、護理、營養學、室內設計和教育是十年薪資變化最小的專業。而數學、哲學、國際關係、經濟學和市場專業是薪資增長最快的,基本翻倍。

在看這些數據的過程中,我們發現十年後薪資數據中,許多專業的薪資範圍比較寬,為了進一步了解哪些專業薪資變化範圍最小和最大,我們計算一下標準差,然後將各專業標準差添加到數據中,然後按前面的方法找出標準差最小和最大的五個專業。

可以看到,標準差最小的五個專業分別是護理、醫師助理、營養學、衛生保健管理和西班牙語。也就是說,努力也不會有太大差別……相反經濟學、金融、數學、哲學和市場專業是標準差最大的五個專業,換言之,這裡面經濟學、數學、哲學和市場專業不僅在工作十年的時間裡薪資增長速度快,而且如果在這十年中持續努力,薪資水平翻幾倍也沒有問題。

二、學校類別與薪資關係:

1、不同學校類別起薪數據分析:

除了專業因素,選擇的學校類別對於薪資水平有沒有影響呢?我們按前面的方法打開Salaries-by-college-type數據文件,首先找出起薪最低和最高的學校有哪些。

可以看到起薪最低的學校均是州立大學,起薪最高的學校中,工程類學校佔據前三名,後兩名是常春藤……看來名校確實是保證起薪的敲門磚。下面我們看看十年後的薪資情況。

2、不同學校類別十年後薪資數據分析:

十年後薪資水平最低的幾個學校依然是州立大學……,薪資水平最高的學校中,常春藤從兩個變成四個,而工程類只有麻省理工留了下來。看來想辦法進入常春藤,不僅是起薪,更重要的是十年後的薪資保證。下面我們看看薪資變化標準差最小和最大的學校有哪些。

3、不同學校類別十年薪資變化數據分析:

薪資變化標準差最小的學校依然全部是州立大學,而且其中Black Hills State University出現在全部最低前五名名單中——最低起薪、最低十年薪資和最低標準差,看來學校不好,不僅起薪低,改變的希望也不大……標準差最大的五個大學中,常春藤佔了四個,文科出現了一個。這四個常春藤大學中,達特茅斯、哈佛和耶魯也在十年薪資最高的前五名名單中。看這幾個學校畢業後的薪資數據,我們可以看到,通過在工作中不斷努力,最高薪資可以超過中位數的兩倍。

4、不同類別學校起薪和十年後薪資圖示:

使用dplyr包中函數計算不同學校類別起薪和十年後薪資的中位數平均值。

使用ggplot2繪圖,首先繪製不同學校類別起薪情況圖。

可以看到,儘管起薪最高的前三名被工程類學校佔據,但是如果分組取平均值,則常春藤學校的起薪依然高於工程類學校。下面看下十年後薪資情況。

十年後常春藤學校不僅依然最高,而且平均薪資水平與工程類的薪資水平差距明顯加大了。另外值得注意的是,文科學校(國內也叫文理學院)與Party類、州立大學起薪差不多,但十年後薪資的平均水平超過了另外兩個。

三、學校所在地區與薪資關係:

剛才討論了專業與學校類別對薪資的影響,下面我們來看學校所在地區是否對薪資有影響。打開數據集中的salaries-by-region文件,按前面方法對數據進行排序。

1、不同地區學校起薪數據分析:

可以看出,起薪最低的地區中,四個在南部,一個在中西部;起薪最高的地區中,有三個位於加州,兩個位於東北部。下面看看十年後的情況。

2、不同地區學校十年後薪資數據分析:

十年後薪資水平最低的五個學校中,中西部和南部各有兩個,西部有一個。而最高的五個學校中,除了斯坦福在加州,剩下的都在東北部。

3、不同地區學校的薪資變化數據分析:

變化最小的五個學校中,中西部有兩個,南部有三個。而變化最大的五個學校全部在東北部。

4、不同地區學校起薪和十年後薪資情況圖示:

如前使用dplyr和ggplot2製作不同地區薪資水平的平均值圖示。

可以看到加州的平均起薪最高,而中西部最低。儘管前五名最低起薪的學校有四個在南部,但就平均水平看,中西部要略低於南部和西部。

十年以後,中西部依然最低,而儘管前五名最高薪學校均位於東北部,但平均薪資水平依然沒有超過加州,只是十年後的平均薪資水平比起薪的差距縮小了。

四、結論:

從上面數據分析我們可以找出一些學校和專業選擇上的規律:

1、 通常起薪低的,十年後依然低,無論是專業還是學校。所以最初的選擇很重要。不要著急隨便選擇一個學校和專業就趕緊申請。

2、 從專業選擇來看,工程類和經濟類是錢景比較好的專業,其中經濟類專業需要在工作後繼續努力,可以實現薪酬的明顯增長。數學和哲學專業的起薪雖然不算高,但是增長幅度比較快,十年後薪酬水平超過平均值。

3、 從學校類別來看,州立大學無論起薪、十年後薪資還是薪資變化都最低,常春藤學校最高,其次是工程類學校。

4、 從地區類別看,中西部最差,加州無論起薪還是十年後薪資均最高,其次是東北部。

綜上所述,錢景最好的是位於加州的大學或者常春藤大學的經濟或工程專業。儘管現在很多人認為常春藤大學與期望的不一樣,權貴以及富商、明星子女可以通過捐款等途徑更輕鬆地進入這些學校學習,但對於絕大多數普通人來說,這還是給自己和家人帶來財富的最好途徑。


推薦閱讀:

機器學習的學習筆記(0)
惠眾在線行業情報|互聯網改變下的傳統節日
「有層次、可發展」的門店數字化管理,是通往新零售的必經之路
2017上半年數據分析學習計劃

TAG:數據分析 |