利用python進行數據分析之準備(一)
01-31
本書講的是利用python進行數據控制、處理、整理、分析等方面的具體細節和基本要點。書中的「數據」主要指的是 結構化數據(structured data),例如
- 多維數據(矩陣)
- 表格型數據,其中各列可能是不同的類型(字元串、數值、日期等)
- 通過關鍵列(對於SQL來說就是主鍵和外鍵)相互聯繫的多個表
- 間隔平均或不平均的時間序列
numpy(numberical python),是python的科學計算基礎包。提供的功能(不限於此):
- 快速高效的多維數組對象ndarray
- 讀寫硬碟上基於數組的數據集的工具
- 線性代數運算、傅里葉變換、以及隨機數的生產
scipy是一組專門解決科學計算中各種標準問題域的集合,主要包括:
- scipy.integrate 數值積分常式和微分方程求解器
- scipy.linalg 擴展了由scipy.linalg提供的線性代數常式和矩陣分解功能
H:python;H:pythonScriptsn
標準開發環境?Ipython外加一個文本編輯器(pycharm)
行話數據規整:指的是將非結構化或散亂數據處理為結構化或整潔形式的整個過程。偽碼:演算法或過程的「代碼式」描述,而這些代碼本身並不是實際有效的源代碼。語法糖:這是一種編程語法,並不會帶來新的特性,但是能使代碼更易讀、更易寫。聲明:
以上學習筆記來自
《利用python進行數據分析》Wes McKinney 編著 唐學韜等譯 機械工業出版社
推薦閱讀: