[資料分析 & 機器學習]Python懶人包介紹 & 安裝

[資料分析 & 機器學習]Python懶人包介紹 & 安裝

來自專欄恆仔のPython

Anaconda介紹

Anaconda中文是森蚺,一種非常肥大的蟒蛇。簡單來說你可以把Anaconda當作是Python的懶人包,除了Python本身(python2, 3) 還包含了Python常用的資料分析、機器學習、視覺化的套件。

Anaconda內含的重要套件,詳情可查看官網

當中比較重要的

  • Numpy: Python做多維陣列(矩陣)運算時的必備套件,比起Python內建的list,Numpy的array有極快的運算速度優勢
  • Pandas:有了Pandas可以讓Python很容易做到幾乎所有Excel的功能了,像是樞紐分析表、小記、欄位加總、篩選
  • Matplotlib:基本的視覺化工具,可以畫長條圖、折線圖等等…
  • Seaborn:另一個知名的視覺化工具,個人認為畫起來比matplotlib好看
  • SciKit-Learn: Python 關於機器學習的model基本上都在這個套件,像是SVM, Random Forest…
  • Notebook(Jupyter notebook): 一個輕量級web-base 寫Python的工具,在資料分析這個領域很熱門,雖然功能沒有比Pycharm, Spyder這些專業的IDE強大,但只要code小於500行我覺得用Jupyter寫非常方便,Jupyter也開始慢慢支援一些Multi cursor的功能了,可以讓你一次改許多的變數名稱。

總之

優點:省時,一鍵安裝完90%一般人這一輩子會用到的Python套件,剩下的再用pip install個別去安裝即可

缺點:占空間:包含了一堆用不到的Python的套件(可安裝另一種miniconda)

另外,安裝完Anaconda之後你會獲得一個叫Conda的指令可以用,可以讓你用conda管理不同Python的版本以及套件,但我自己幾乎沒用到,都是直接用Pip install安裝。如果想了解關於conda install 詳情可參考:Anaconda使用總結

Anaconda安裝

Anaconda 下載連結:Downloads - Anaconda

選擇你的操作系統:

初學者建議從Python3.6開始,然後點選download。(在資料分析、機器學習的領域Python2,3 我是覺得沒有差很多,主要是Print跟unicode,還有Map Reduce)

接著打開命令行(我這裡是Mac OS的terminal),輸入Python

如果看到下方有出現Anaconda字樣就代表安裝完成啦!!

Annaconda的主頁面

你可以直接打開Anaconda,裡面提供了各種工具,我比較常用的是Jupyter notebook

然後往terminal中輸入:Jupyter notebook,就能夠打開Jupyter notebook寫代碼啦(也可以直接在Anaconda中打開notebook)

jupyter notebook

Jupyter notebook主頁面

這時候你就能夠通過右上角的New(新建)新的Python2 或 Python3文件啦。

不過要注意,你terminal打開Jupyter notebook時的路徑狀態,就是你之後保存文件的路徑,所以要留意一下。

關於Jupyter Notebook的內容,我之後再總結一下。

參考資料:基於Medium文章[Yeh James],增添修改了部分內容。


推薦閱讀:

南京大學周志華教授綜述論文:弱監督學習
SVD奇異值分解的數學描述
ZT:機器學習中如何選擇特徵值
用Python實現線性回歸,8種方法哪個最高效?

TAG:Python | 機器學習 | 數據分析 |