數據科學入門篇3:數據處理利器Pandas使用手冊

n工欲善其事必先利其器,在使用Python做數據挖掘和數據分析時,一大必不可少的利器就是Pandas庫了。pandas 是基於NumPy 的一種工具,該工具是為了解決數據分析任務而創建的,其納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。

下面就從創建數據、查看數據、篩選數據、統計數據、缺失值處理、數據可視化等14個方面介紹Pandas數據處理的基本操作,希望對廣大數據愛好者有所幫助。

1、創建數據

2、查看數據

3、選擇數據

4、讀取和保存

5、篩選數據

6、增加和刪除數據

7、計數統計

8、數據分組

9、缺失值處理

10、排序和合併

11、可視化

12、字元串操作

13、廣播

14、資料庫操作

說明一下,本人現在也還只是一個學生,目前算數據菜鳥一枚,因為自己即將參加17年的校招,需要梳理所學知識,就順便將將其進行一下分享,如果對您有所幫助,那甚好;如果沒有,還請大神們自動屏蔽掉。

另外,更多據挖掘和機器學習方面的學習資源,歡迎關注我的微信公眾號「DT新紀元」,期待與您一起成長。

註:以上內容雖不完全自己原創,但也是自己辛苦學習和整理所得,知識可以分享,但請不要惡意抄襲,轉載前請先徵求我的同意,希望大家多多理解,在此謝過!

推薦閱讀:

一個編外

TAG:Python | 机器学习 | 数据挖掘 |