Windows7 Anaconda環境下xgboost的安裝配置

本來這個專欄的第一篇文章是打算寫一些基礎性的演算法的,但是由於昨天(準確來說是今天凌晨)在做一個特徵評估的時候需要用到xgboost而好一番折騰,終於才把xgboost安裝好了之後就決定用xgboost作為這個專欄的開篇。

其實xgboost的安裝在網上搜一下有很多種方法,而且大部分基本都是一樣的,但是由於每個人的電腦不同,導致最終有人成功有人失敗,因此,不想讓大家再在這種安裝的環節就被噁心到,我決定把我的詳細安裝配置過程和其中遇到的問題都寫出來,為大家創造一點便利。如果真的幫到了您,那就是再好不過了。

下面開始:

1、需要下載的軟體

首先是需要下載的軟體,有三個:Anaconda、Git以及Mingw64,Anaconda比較容易下載,但是Git和Mingw64這兩個軟體因為各種原因,在官網下載的過程總是不順利,很容易下到一半沒網速了或者根本無法開始下載,因此我就把我的Git和Mingw64的安裝包放到我的百度雲盤裡,需要的各位可以自行下載安裝。

下載鏈接如下:

Anaconda:Download 各位根據自己的需要下載對應的python版本以及32bit或者64bit,安裝的過程也是一路Next即可(除了安裝軟體的文件夾位置自己選一下),安裝完成後點擊左下角Windows圖標,再點開「所有程序」,就能看到Anaconda套裝了,如下圖所示:

安裝過程中需要用到第三個Anaconda Prompt來將xgboost配置到Anaconda環境中,Spyder是我們的編譯器,一般用Spyder來編寫和運行python代碼;

Git(64 bit):百度雲盤 Git 我這個Git版本可能不是最新的,但是已經夠用了。在安裝的過程中我是一路next下來的,但是看到網上的教學貼里有人說在其中的PATH adjust環節有需要注意的地方,也就是下圖所示的環節:

有些人的默認選項可能是第一項,建議最好選擇第二項,這樣Git Bash和Windows的cmd都可以用git,會更加方便一點。剩下的就一路next,這個軟體本身也不大,裝到哪裡也沒什麼關係。裝好之後,在桌面會有一個Git Bash的圖標,那個就是我們待會兒要用的工具,點開之後的樣子如下圖所示:

Git到這裡就裝完了,下面是Mingw的安裝與配置,這一個是比較關鍵的,很多教學貼都說沒有這個大佬就沒辦法進行後面的安裝,因此我們就不管三七二十一,裝上他就是了;

Mingw64:百度雲盤 Mingw64 在安裝Mingw64的時候需要注意,點開下載驅動後的第一個界面選擇一下Architecture的版本,選擇x86_64版本,如下圖所示:

剩下的也是一路next就好了,不過要記得安裝在哪個文件夾的位置,安裝完成之後,需要把路徑添加到環境變數的path裡面。拿我的Mingw做個例子,我的安裝路徑如下圖所示:

因此我就要把C:Program Filesmingw-w64x86_64-7.2.0-posix-seh-rt_v5-rev0mingw64in這個路徑添加到環境變數的path中去,注意,要具體到bin文件夾,以及用分號和path中已經存在的路徑分隔開

添加完以後打開Git Bash,運行指令:

which mingw32-make

如果顯示類似下面的結果就是配置成功了,結果是mingw32-make所在的文件夾:

還有一個需要注意的是,Mingw64在安裝過程中會有一個下載必要配置的階段,有時候會因為網路或者電腦的問題下載失敗無法繼續安裝,不知道大家會不會遇到這種情況,可能是因為我的電腦被我折騰的太久了吧(無奈)。如果有人真的遇到了,重啟一下電腦就好了,我就是這樣搞定的,而且這個下載的過程會比較長,所以需要一點耐心,可以先去干點別的等一下;

經過上面的準備工作,我們就可以開始下載安裝xgboost了。

2、xgboost的下載與編譯

(1)打開Git Bash,按順序輸入以下指令:

cd /f #指定下載路徑,根據自己的實際情況選擇合適的文件夾即可,放在哪裡都行。 git clone --recursive https://github.com/dmlc/xgboost cd xgboost git submodule init git submodule update

第一個指令就是選擇一個文件夾進入,我們之後會把xgboost下載到這個文件夾里,隨便選一個就行,在哪裡對後面的配置沒有影響。在這裡我是直接放到F盤裡面;

上述指令運行完畢後,打開你之前進入的文件夾,你會發現多了一個xgboost文件夾,這就是我們剛剛下載的xgboost;

(2)重新打開Git Bash,運行下面的指令:

alias make=mingw32-make cd /f/xgboost cd dmlc-core make -j4 cd ../rabit make lib/librabit_empty.a -j4 cd .. cp make/mingw64.mk config.mk make -j4

上述指令運行完畢後,最後如果出現下面的信息,那麼恭喜你,編譯成功:

上面的步驟完成後,我們已經成功地配置好了xgboost需要的安裝環境,就只剩最後一步的安裝了。

3、安裝xgboost

打開我們第一步提到的Anaconda Prompt,如下圖所示:

跟Windows的命令行沒什麼兩樣,然後進入到你放置xgboost的文件夾中,也就是用cd指令,以我的電腦為例,輸入指令:

F:cd xgboostcd python-package

這樣就進入到了放置安裝程序的文件夾中,下面運行最後一道指令:

python setup.py install

然後就是xgboost的安裝啦,很快就裝好了,prompt裡面顯示如下信息:

因為我已經安裝過了,所以就在教學貼裡面照了一張圖貼過來,差不多就長這個樣子,如果你看到了類似的記過,那麼恭喜你,裝好啦~~~

最後,我們只需要驗證一下我們的xgboost是不是真的已經裝好了即可,打開Spyder,在temp.py裡面輸入如下代碼:

然後直接運行,如果編譯器沒有報錯,那麼就說明xgboost已經成功安裝到Anaconda的環境中啦,否則編譯器會提示你沒有xgboost這個module。

4、結語

好了,以上就是xgboost所有的安裝過程了,xgboost是一個非常強力,非常高效的演算法,應用很廣,反響也很好,強烈建議大家去嘗試一下,以後我也會在xgboost上做更多的探索和研究,來方便更多的人。

最後,如果我的這篇文章有幫助到您,希望您不要吝嗇您的贊;如果有什麼錯誤之處,希望您在評論區指出。

非常感謝您能夠閱讀我的文章~

推薦閱讀:

TAG:xgboost | 機器學習 | 特徵選擇 |