急速入門Python數據分析(1)--常見的Python數據科學庫
01-30
一、在數據科學領域,Python目前一共有五個主流的庫
1.Numpy
- N維數組矩陣,快速高效,矢量數學運算
- 高效的Index,不需要循環
- 開源免費跨平台,運行效率足以與C/Matlab媲美
2. Scipy
- 依賴於Numpy
- 專為科學和工程設計
- 實現了多種科學計算,如線性代數、傅里葉變換、信號和圖像處理等
3. Pandas
- 結構化的數據分析利器(依賴Numpy)
- 提供了多種高級的數據結構
- 強大的數據索引和處理能力
4. Matplotlib
- Python 2D繪圖領域最廣泛的套件
- 基本能取代Matlab的繪圖功能
- 通過mplot3d可以繪製精美的3D圖
5. scikit-learn
- 機器學習的Python模塊
- 建立在Scipy之上,提供了常用的機器學習演算法:聚類、回歸等
- 簡單易學的API介面
二、本專題將僅介紹如下內容,而這幾個專題庫的介紹足夠你應付日常工作80%的應用場景,從0基礎與你一起邁入Python數據分析的行列,感受Python無與倫比的美麗。
- Numpy入門:通過Numpy進行數組和矩陣運算;
- Pandas入門:介紹pandas里最重要的兩種數據結構Series和DataFrame開始,介紹其創建和基本操作,並且使用Pandas進行高級的數據分析操作,包括如何去做數據清洗、預處理和排序等數學計算;
- Matplotlib:介紹Matplotlib的基本使用,包括如何對Pandas里的Series和DataFrame繪圖, 以及圖形樣式和顯示模式的設置等內容;
- 綜合實戰:一個股票市場的分析實戰項目,分析股票數據的數據分析曲線。
三、本專題可能需要你有簡單的大學基礎數學知識(如矩陣、數組等)以及Python基礎。本專題將持續更新,期待與你不期而遇,一起成長!
推薦閱讀:
※如何七周成為數據分析師(附視頻教程)
※數據分析八大禁忌,數據分析師必看的避邪寶典
※34歲轉行數據分析師靠譜么?
※軟硬兼備方能成為一名合格的數據分析師
※大學經濟學專業,5年知名互聯網公司數據分析經驗,想做數據挖掘和機器學習,是否要去讀個相關學位? ?