想學Python做數據分析,請教安裝問題?

補充:但在網上找了好久也沒有找到具體的安裝、配置介紹,希望用Python做數據分析的大神介紹點安裝要點和所需要的庫,非常感謝!!


直接去裝 Anaconda Scientific Python Distribution

不要按照樓上說的一個一個弄。


拿Python做數據分析,那麼肯定要讀的一本書是OReilly的《Python for Data Analysis》,第一章就詳細介紹了安裝,看下會有很大收穫的。

就我個人來言,推薦Enthought的Canopy。

Express版本就夠用了,缺少一些不常用的lib(Basic和Pro版本添加lib比較方便)。Express版本如果需要什麼lib可以自己去pip install 下,官網有相應的文檔。Basic和Profession版本,當然價格也是不便宜的。Enthought還額外有提供給教育機構的academic license。


NumPy: 基本數組運算。Python自身的數據容器是列表,詞典和集合,並不支持數組這一數據結構。Numpy是下面各個包的基礎。

SciPy:基本的統計、數據分析工具

SymPy:符號運算,公式表達

matplotlib:繪圖

Pandas:時序和表格數據處理

scikit-learn:高級統計和機器學習

此外,從網頁上扒數據的,比如Beautiful Soup,常用於收集數據。

安裝一些特別版本的Python,它們可能包含這些包。比如Enthought Python。但這些特別版本的Python可能並不免費,而且可能所包含的包不全,到最後還是要自己安裝。

已經裝好Python的前提下。最容易的是在Linux系統下,在源里找已經編譯好的包,比如Ubuntu下:

sudo apt-get install python-matplotlib

此外,你可以用easy_install或者pip安裝包。比如:

pip install numpy


  • NumPy — Numpy

  • SciPy.org — SciPy.org

  • matplotlib: python plotting


python+pip


推薦閱讀:

如何找到數據分析的工作?是否很困難?
若想對中國的經濟問題形成解釋力較強的一套認知體系,是邏輯分析比較重要,還是數據分析比較重要?
怎麼看貴陽大數據交易所的成立?
想找一份數據分析師的工作該做什麼準備?

TAG:Python | 數據分析 |