python_anaconda安裝與環境配置
anaconda - 搜索結果 - 知乎
來源:知乎
事實上Anaconda 和 Jupyter notebook已成為數據分析的標準環境。
簡單來說,Anaconda是包管理器和環境管理器,Jupyter notebook 可以將數據分析的代碼、圖像和文檔全部組合到一個web文檔中。
接下來詳細介紹下Anaconda,並在最後給出Jupyter notebook:
1.Anaconda是什麼?
2.如何安裝?
3. 如何管理包?
4.如何管理環境?
5.Jupyter notebook如何快速上手?
1.Anaconda是什麼?
Anaconda在英文中是「蟒蛇」,所有你看下面Anaconda的圖標就像一個收尾互相咬住的「蟒蛇」。
你可能已經安裝了 Python,那麼為什麼還需要 Anaconda?有以下3個原因:
1)Anaconda 附帶了一大批常用數據科學包,它附帶了 conda、Python 和 150 多個科學包及其依賴項。因此你可以立即開始處理數據。
2)管理包
Anaconda 是在 conda(一個包管理器和環境管理器)上發展出來的。
在數據分析中,你會用到很多第三方的包,而conda(包管理器)可以很好的幫助你在計算機上安裝和管理這些包,包括安裝、卸載和更新包。
3)管理環境
為什麼需要管理環境呢?
比如你在A項目中用了 Python 2,而新的項目B老大要求使用Python 3,而同時安裝兩個Python版本可能會造成許多混亂和錯誤。這時候 conda就可以幫助你為不同的項目建立不同的運行環境。
還有很多項目使用的包版本不同,比如不同的pandas版本,不可能同時安裝兩個 Numpy 版本,你要做的應該是,為每個 Numpy 版本創建一個環境,然後項目的對應環境中工作。這時候conda就可以幫你做到。
2. 如何安裝Anaconda?
Anaconda 可用於多個平台( Windows、Mac OS X 和 Linux)。你可以在下面地址上找到安裝程序和安裝說明。根據你的操作系統是32位還是64位選擇對應的版本下載。
(Anaconda已經不支持Windows XP;同時查看自己電腦是32位還是64位,不要裝錯了。)
官網地址:https://www.continuum.io/downloads
如果官網地址網速太慢無法下載,可以從我公眾號:猴子聊人物,中回復「資料」從網盤下載
Anaconda 的下載文件比較大(約 500 MB),因為它附帶了 Python 中最常用的數據科學包。
如果計算機上已經安裝了 Python,安裝不會對你有任何影響。實際上,腳本和程序使用的默認 Python 是 Anaconda 附帶的 Python。
可以在終端或命令提示符中鍵入 conda list,以查看你安裝的內容。
如果安裝後,在Anaconda Prompt中都無法使用Conda命令,解決方法在這裡:
猴子:Python管理包工具anaconda安裝過程常見問題解決辦法如果Anaconda Prompt中可以使用conda命令,接著下面繼續操作。
為了避免後面使用報錯,你需要先更新下所有包。在終端輸入更新所有包的命令:
conda upgrade --all
並在提示是否更新的時候輸入 y(Yes)讓更新繼續。初次安裝下的軟體包版本一般都比較老舊,因此提前更新可以避免未來不必要的問題。
如果以上命令運行後報錯,參考這裡的解決辦法:
猴子:Python管理包工具anaconda安裝過程常見問題解決辦法3. 如何管理包?
安裝了 Anaconda 之後,就可以很方便的管理包了(安裝,卸載,更新)。
1)安裝包
在終端中鍵入:
conda install package_name
例如,要安裝 pandas,在終端中輸入:
conda install pandas
你還可以同時安裝多個包。類似 conda install pandas numpy 的命令會同時安裝所有這些包。還可以通過添加版本號(例如 conda install numpy=1.10)來指定所需的包版本。
conda 還會自動為你安裝依賴項。例如,scipy 依賴於 numpy,因為它使用並需要 numpy。如果你只安裝 scipy (conda install scipy),則 conda 還會安裝 numpy(如果尚未安裝的話)。
2)卸載包
在終端中鍵入 :
conda remove package_names
上面命令中的package_names是指你要卸載包的名稱,例如你想卸載pandas包:conda remove pandas
3)更新包
在終端中鍵入:
conda update package_name
如果想更新環境中的所有包(這樣做常常很有用),使用:conda update --all。
4)列出已安裝的包
#列出已安裝的包
conda list例如我已經成功安裝了numpy和pandas這兩個常用的包。
如果不知道要找的包的確切名稱,可以嘗試使用 conda search search_term 進行搜索。例如,我知道我想安裝numpy,但我不清楚確切的包名稱。我可以這樣嘗試:conda search num。
4.如何管理環境?
conda 可以為你不同的項目建立不同的運行環境。
0)安裝nb_conda用於notebook自動關聯nb_conda的環境。
1)創建環境
在終端中使用:
conda create -n env_name package_names
上面的命令中,env_name 是設置環境的名稱(-n 是指該命令後面的env_name是你要創建環境的名稱),package_names 是你要安裝在創建環境中的包名稱。
例如,要創建環境名稱為 py3 的環境並在其中安裝 numpy,在終端中輸入 conda create -n py3 pandas。
2)創建環境時,可以指定要安裝在環境中的 Python 版本
當你同時使用 Python 2.x 和 Python 3.x 中的代碼時這很有用。要創建具有特定 Python 版本的環境,例如創建環境名稱為py3,並安裝最新版本的Python3在終端中輸入:
conda create -n py3 python=3
或也可以這樣創建環境名稱為py2,並安裝最新版本的Python2:
conda create -n py2 python=2
因為我做的項目不同,有時候會用到Python2,還有時候會用到Python3。所以我在自己的計算機上創建了這兩個環境,並分別取了這樣的環境名稱:py2,py3。這樣我可以根據不同的項目輕鬆使用不同版本的python。
如果你要安裝特定版本(例如 Python 3.6),請使用 conda create -n py python=3.6
3)進入環境
在 OSX/Linux 上使用 source activate my_env 進入環境。
進入環境後,你會在終端提示符中看到環境名稱,下面圖片是我進入py3的環境(這裡的py3是我上面創建環境時自己起的名稱,你可以起個自己喜歡的名稱)。
進入環境後,我可以用conda list 查看環境中默認安裝的幾個包:
在環境中安裝包的命令與前面一樣:conda install package_name。
不過,這次你安裝的特定包僅在你進入環境後才可用。
3)離開環境
在 OSX/Linux 上 輸入:
source deactivate
4)共享環境
共享環境非常有用,它能讓其他人安裝你的代碼中使用的所有包,並確保這些包的版本正確。比如你開發了一個藥店數據分析系統,你要提交給項目部署系統的王二狗來部署你的項目,但是王二狗並不知道你當時開發時使用的是哪個python版本,以及使用了哪些包和包的版本。這怎麼辦呢?
你可以在你當前的環境中終端中使用 conda env export > environment.yaml 將你當前的環境保存到文件中包保存為YAML文件(包括Pyhton版本和所有包的名稱)。
命令的第一部分 conda env export 用於輸出環境中的所有包的名稱(包括 Python 版本)。
在「notebook工作文件夾」下(及你在終端中上圖的路徑)可以看到導出的環境文件:
在 GitHub 上共享代碼時,最好同樣創建環境文件並將其包括在代碼庫中。這能讓其他人更輕鬆地安裝你的代碼的所有依賴項。
導出的環境文件,在其他電腦環境中如何使用呢?
首先在conda中進入你的環境,比如activate py3
然後在使用以下命令更新你的環境:
#其中-f表示你要導出文件在本地的路徑,所以/path/to/environment.yml要換成你本地的實際路徑
conda env update -f=/path/to/environment.yml對於不使用 conda 的用戶,我通常還會使用 pip freeze > environment.txt 將一個 txt文件導出並包括在其中。
具體見這裡:https://pip.pypa.io/en/stable/reference/pip_freeze/
舉個例子你可能更容易理解這個使用場景:
首先,我在自己的電腦上在conda中將項目的包導出成environment.txt 文件:
然後我將該文件包含在項目的代碼庫中,其他項目成員即使在他的電腦上沒有安裝conda也可以使用該文件來安裝和我一樣的開發環境:
他在自己的電腦上進入python命令環境,然後運行以下命令就可以安裝該項目需要的包:
pip install -r /path/requirements.txt
其中/path/requirements.txt是該文件在你電腦上的實際路徑。
5)列出環境
我有時候會忘記自己創建的環境名稱,這時候用 conda env list 就可以列出你創建的所有環境。
你會看到環境的列表,而且你當前所在環境的旁邊會有一個星號。默認的環境(即當你不在選定環境中時使用的環境)名為 root。
6)刪除環境
如果你不再使用某個環境,可以使用 conda env remove -n env_name 刪除指定的環境(在這裡環境名為 env_name)。
最後重新再強調下,不要被上面的命令嚇到。雖然上述命令多,給了誰都記不住的。後面你跟著我在知乎上多做項目,用的多了自然記住了。你只需要跟著上面步驟操作下,並理解了每一步是幹什麼的就可以了。後面遇到要做的事情,忘記了回頭查這個文檔就可以了。
conda的官方文檔:https://conda.io/docs/user-guide/tasks/index.html
按照上面的步驟你親自操作一遍後,你已經學會了Anaconda,並安裝好你的數據分析Pyhton環境了,接下來你就可以愉快的使用Jupyter notebook來做數據分析了:
jupyter notebook 可以做哪些事情?其他常見問題,見這裡:
猴子:Python管理包工具anaconda安裝過程常見問題解決辦法推薦閱讀:
※Scrapy對接Splash
※Python 黑客相關電子資源和書籍推薦
※Python黑帽編程3.0 第三章 網路介面層攻擊基礎知識
TAG:Python |