python機器學習的準備工作
機器學習python準備工作
2018年2月12日
現在幾乎每個人都聽說過人工智慧,一提到人工智慧就必須說到python,為什麼人工智慧和python有不解之緣呢?主要的原因在於兩個方面,1是python的語言比較簡單,寫代碼容易理解,人工智慧中的機器學習和深度學習的那麼多演算法就已經讓人很頭痛了,用python語言可以讓人們更加關注是在演算法上面,而不是說還要先跨過c++這樣最難語言的一座大山。2是機器學習和深度學習的框架都是有python語言介面的,比如大名鼎鼎的機器學習scikit-learn包和谷歌的深度學習tensorflow。所以學好python加上各種包,是很必要的。本文介紹如何在python中安裝scikit-learn包。因為要安裝的東西比較多比較雜,很多人都摸不到頭腦,我就寫了一個自己安裝過程的教程。我個人是用習慣pycharm。
1.安裝pycharm,這個是python 的IDE。官網下載,再找找註冊碼。
2.安裝Anaconda2,該軟體有python2和python3版本之分,還有32位和64位版本之分,選擇下載的時候要看清楚。剛入門的人會問為什麼安裝這個。因為這個軟體集成了機器學習裡面需要的大部分的包,numpy,matplotlib,pandas,sci-kit learn都集成在裡面,安裝一個一勞永逸。這裡有要注意就是看看你想安裝python2.7還是python3.6版本,其實都差不多,python2.7不支持中文,還有某些語法與python3.6有點點區別,但沒多大影響。但是網上很多機器學習視頻是基於python2.7的,所以可以看個人的喜好選擇。
百度搜索上官網下載就可以了。下載完直接安裝。
3.在pycharm中把Anaconda2添加到python解釋器中。
安裝後import numpy
import matplotlib
import pandas
import sklearn可以檢查是否添加包成功
可以看到導包後沒有爆紅線,說明添加成功
4.下載安裝graphviz,因為機器學習裡面有一個演算法是決策樹,這個軟體是用來列印決策樹的,最終可以輸出pdf的決策樹文件。
5.安裝graphviz,安裝後按照下圖配置環境變數。這主要是為了在命令行使用graphviz。
安裝後dot -version查看安裝是否成功,下面顯示安裝成功。
6.python生成的決策樹文件是.dot的,看起來很不「友好」。
下面就是用sci-kit learn生成的決策樹,是不是看起來很「噁心」。那就要用到graphviz
7.必須在命令行中,進入到你的決策樹文件夾路徑,使用下面的命令,才能把上面的決策樹文件轉換成友好的決策樹文件
dot -Tpdf xxx.dot -o xxx.pdf
其中xxx是文件名
我生成的決策樹文件myDT是放在F:MLDTree下面的,所以我要先進到這個文件夾。再用轉換命令。
8.列印出的決策樹的樣子。這就是第6步的決策樹轉換後的文件,是不是友好了。
好的,到這裡,基本上python中玩機器學習的配置就結束了。希望對你有幫助。看完點個贊吧!
推薦閱讀:
※引領深度學習革命--CNN架構全解析
※【最優化】無約束優化方法-阻尼牛頓法
※《大演算:機器學習的終極演演算法將如何改變我們的未來,創造新紀元的文明》
※機器學習基礎與實踐(一)----數據清洗
※讓我們一起來學習CNTK吧