數據分析精華文章大集合

閱讀本文大概需要3分鐘

Python的數據分析是我比較喜歡的一個方向,因為可以探索數據裡面的秘密,加上可視乎會非常漂亮,但是裡面也蘊含著很多技巧的綜合,陸陸續續我已經寫了好多這樣的文章,大部分都是爬蟲和數據分析,數據可視化結合的相關的文章,裡面也有一些鐵杆粉絲的優秀投稿的文章!今天我們來總結回顧一下~~

數據分析篇內容很豐滿

1.爬蟲:

從單頁面的爬蟲,到多頁面的多線程的爬蟲,然後用scrapy框架爬取,最後用selemium模擬器爬取,裡面包含了一些反爬蟲的策略運用,比如cookies,代理池等等.

2.數據的清洗

從基本的正則表達式,到Pandas的大量的技巧運用

3.數據的可視化

從Pandas的matplotlib,到R語言的ggplot2,再到Tableau神奇的運用

數據分析精華文章回顧

1.Python1200本書爬取

市面上Python的書這麼多,出版社也很多,有很多出版社都跟我聯繫出書的事情,於是我把整個市面上所有的Python書都爬取了,並進行了深度分析。想知道Python那本書最火,評分最高,哪家出版社出版了Python書最多,最受歡迎,那本Python書名最長.

詳細請看:

我爬取了市面上所有的Python書|想知道幾件事

如何爬取全網1200本Python書|爬蟲實戰篇

史上最全的Python書排行榜|你想知道的都在這裡

2.Python分析福利彩票

這篇文章出自粉絲「路上行舟」同學,數據分析部分我加了一點內容,福利彩票相信大家都買過,裡面有沒有啥秘密或者規律呢,不妨看看這篇文章。

詳細請看:

【小白學爬蟲】用Python分析福彩3D|發現數字的秘密

3.股票的數據分析

基金和股票的數據分析,其實我已經分析了很久了,這塊的數據分析有趣,而且投資價值非常大!當然我只是業餘的選手,股票的分析涉及到量化交易和投資模型,風險策略等等。我只是從數據分析的一個小角度探索了一些:

詳細請看:

爬取4000多隻股票2年的數據|只為找到七夕必漲的她

有趣!【9個月銀行股數據】|可視化分析

當然還有專業的大牛,比如量化基金的投資可以看下面的鏈接文章:

用Python定投基金|看看巴菲特有坑我們嗎?

用Python來分析股票|發現炒股軟體里驚人內幕

4.NBA數據分析

我有一個鐵杆粉絲小鄭同學,對NBA有獨特的情懷,於是投稿了幾篇關於NBA的優秀的文章。向自己的偶像科比致敬,非常不錯!

詳細請看:

38年來,NBA最有價值球員|數據分析

厲害了!20年【科比NBA】生涯|數據分析

5.爬取全網5000部手機

現在手機已經成為每個人的必需品,這篇文章是我的另外一個忠實粉絲"BlueDamage"同學的投稿,思路和技巧都非常不錯,值得一讀!

詳細請看:

實戰爬取全網5000部手機|上篇

實戰爬取全網近5000手機|下篇

6.周星馳的電影

我自己是周星馳的超級影迷,非常喜歡他的電影,看他的電影看了很多遍,有一些電影可能反覆看了5-6遍,真的是非常經典!於是我做了一個小小星爺30年電影的數據分析.

詳細請看:

周星馳30年電影數據分析

7.近20000套南京二手房數據分析

房價之高,房價漲幅之大,讓屌絲望而卻步!於是我爬取了南京近20000多套二手房的數據,進行深入分析,發現300萬幾乎買不到什麼房子,不信的話,請看:

屌絲想買房,爬取南京20000多套二手房|上篇

南京的房子有多貴| 分析近20000套二手房的數據

南京的房子賣的有多火|二手房成交數據分析上篇

南京樓市火嗎|16000套二手房數據分析

8.深圳的租房數據分析

這個我的另外一個粉絲"閃亮的日子"同學,寫了一篇關於分析深圳的租房情況,寫的非常不錯,尤其是數據清洗部分!

詳細請看:

深圳租房有多貴|我爬取了深圳所有的房子告你訴答案

9.學Python薪資如何,爬取了全國1600多個Python崗位

Python這麼火,每個學Python的同學一定都想知道Python的薪資待遇如何,哪些城市招聘數量多,崗位待遇比較高。

詳細請看:

學好Python薪水有多少|我爬取了所有的Python職位

Python年薪最高有50w|探秘全國近1600個Python崗位數據分析

10.爬取淘寶上4000件羽絨服

雙十二來了,想買件羽絨服,於是把淘寶上的羽絨服全部爬取了,並做了數據分析,發現折扣力度並不大,打折最多的都是1200多塊的羽絨服。

詳細請看:

雙十二來了,我爬取了淘寶上所有的羽絨服|想找到最大折扣


結論

Python從入門到進階,到數據分析,到數據可視化我已經寫了累計有120多篇了.下面我準備開始寫機器學習的文章,有同學會問那前面幾個主題還會寫嗎,如果有好玩的數據,厲害的Python高級技巧,我依然會寫的.

如果說數據分析是寶馬x5,機器學習應該是波音747飛機,機器學習對數據集的探索威力更大,更好玩!數據探索的路上,我還是一隻菜鳥,夜空中最亮的星,照亮我繼續前行,讓我們繼續出發!

好了,以上4個多月的數據分析精華文章分享給大家了,歡迎大家指正交流。這裡再次感謝小鄭同學,路上行舟,BuleDamge,閃亮同學的投稿,現在他們都在我的小密圈裡,可以互相交流切磋.想成為高手,一定要多和高手交流,和一個人交流只能獲得一份知識,和100個交流就能獲得100份知識,進步才會更快。數據分析,機器學習無疑是未來10年最有錢途的工作,也歡迎有興趣的同學加入小密圈,一起加油!

歡迎大家關注公眾號 菜鳥學Python",留言獲取更多源碼

推薦閱讀:

關於召回率、準確率、F測度值的一個小程序
通俗 Python 設計模式——享元模式
自製機械網速表
Flowpython, 讓Python變得好一點

TAG:爬虫计算机网络 | 数据分析 | Python |