深入剖析拉勾網,小白也來玩數據(一)

花了一晚上分析網站,半天寫代碼半天爬,最後做成BDP圖表。

總的大概3萬多條數據吧,因為沒學到scrapy和多線程,所以有些慢。

結果就是

今天先來看數據吧~

圖上標有的數據即為抓到的總數,比如下面4400代表抓到有關C++總條數

一、先來看看整個互聯網行業的狀況

(當然這裡數據不能保證全面,只做舉例)

可看出目前市場上java、php、c/c++主打半壁江山,當然最火的還是java啦~.

至於php是否是世界上最好的語言不得而知,不過數據看來形勢不賴。

小眾而又獨特的腳本語言,例如python等貌似有上升的趨勢。

(為更直觀地展示結果,小於30不顯示)

由圖可見,一半以上互聯網工作彙集北京。

北京、上海、深圳、廣州、杭州、成都等為互聯網熱門城市。

規律:一二線城市普遍互聯網更發達,工作機會也更多。

看看詞雲圖~

二、然後看看我們的移動端開發

互聯網時代人人都離不開手機,所以移動端不管怎樣都不會冷下去啦^_^

ios和Android一直是難分天下,突然火了個HTML5,可謂異軍突起呀

不過離三足鼎立還是。。。有點遠

三、最後具體分析優雅強大的Python

果然來來去去還是北京、上海、廣州、深圳、杭州、武漢、南京、成都這幾個地方機會最多,一線城市多發展 不是懵人噠

薪資普遍還是不錯的,當然拉鉤網上招聘的數據不等於實際,各位看官看看就好咯(話說還要不要逃離北上廣→_→

看看出 有點經驗又畢業不久 的人群最受僱主青睞,尤其畢業1-5年的本科生。

公司多是 創業成長型,互聯網行業當前該有多火熱!

當然也折射出這一領域還是有廣闊的發展前景的,嘿嘿機會多多。

對python來說,雖在全國範圍也不見的很多

但隨著大數據和人工智慧 興起,真的是越來越「炙手可熱」啦~

可以搞後端開發,可以數據挖掘、數據分析,無聊還能 寫寫爬蟲爬爬美女圖

優美、輕量又強大,真是個小萬能呢~

最後放詞雲圖

簡單即是美啊。

人生苦短,我也用python ^_^

先挖個坑,下一節分析代碼和破解過程 ,本篇就是這樣啦~


推薦閱讀:

TAG:爬虫 | Python | 自学编程 |