GTX1080/1070配置深度學習環境。求指導,剛入手~?


這裡有一篇非常詳細的文章,包括硬體的選擇,雙系統的安裝,以及深度學習框架和CUDA環境安裝等等——

來源: Build Personal Deep Learning Rig: GTX 1080 + Ubuntu 16.04 + CUDA 8.0RC + CuDnn 7 + Tensorflow/Mxnet/Caffe/Darknet

作者: Guanghan Ning

文章的著作權屬於我,如果需要轉載,請註明來源和作者~


剛配好,參見這裡 http://wh1te.me


這是個人前幾天配置環境的流程,走了不少彎路。。。

部署Ubuntu 16.04+cuda8.0+Tensorflow+OpenaiGym:

使用機器:

CPU Intel i7 6700k

MB Gigabyte Z170X-UD3

Mem Kingstone Hyper Fury DDR4 2400 16Gx1

GPU Galaxy GTX1080 Gamer

HDD Smasung PM951 512GB

部署過程:

1.使用U盤安裝Ubuntu 16.04 LTS.

2.安裝完後只有默認桌面與滑鼠指針,並且有閃爍現象。做如下處理

-按Ctrl+Alt+F1切換到控制台界面,輸入用戶名與密碼登陸

-安裝NVIDA顯卡驅動,步驟:

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update

sudo apt-get install nvidia-367

sudo apt-get install mesa-common-dev

sudo apt-get install freeglut3-dev

-之後重啟主機。

3.重啟後仍然只有桌面與滑鼠,但是沒有閃爍情況,也能打開右鍵菜單。做如下處理

-右鍵打開終端,運行compiz –replace

-發現opengl plugin not loaded

-運行sudo apt-get instal ccsm apt-get install -y python-numpy cmake zlib1g-dev libjpeg-dev libboost-all-dev gcc libsdl2-dev wget unzip

-運行ccsm

-Enable Unity Plugin

4.重啟後系統進入可用狀態。

5.從NVIDIA官網下載CUDA 8.0 RC 和 cdDNN 5.0.

-https://developer.nvidia.com/cuda-toolkitcxx_builtin_include_directory: "/usr/local/cuda-8.0/include"

-https://developer.nvidia.com/cudnn

需要註冊NVIDA賬號。

筆者下載的CUDA 是runfile形式的,操作如下:

-運行sudo sh cuda_8.0.27_linux-run.runapt-get install -y python-numpy cmake zlib1g-dev libjpeg-dev libboost-all-dev gcc libsdl2-dev wget unzip

-按CTRL+C跳過EULA,同意EULA

-不安裝361驅動

-其他全選y和默認

安裝完畢後,寫入環境變數:

-gedit ~.bashrc

-寫入下面二行(如果文件非空,找個順眼的地方寫進去就好)

export PATH=$PATH:/usr/local/cuda/binrefer=intelligentunit

export LD_LIBRARY_PATH=:/usr/local/cuda/lib64

聽說nouveau會導致安裝CUDA後無法進入系統,筆者抱著反正也用不上這驅動的心態屏蔽了nouveau驅動,步驟如下:

-sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

-向這個空文件寫入

blacklist nouveau

blacklist lbm-nouveaucxx_builtin_include_directory: "/usr/local/cuda-8.0/include"

options nouveau modeset=0

alias nouveau off

alias lbm-nouveau off

重啟完成CUDA安裝。然後安裝cuDNN:

-解壓cudnn-8.0-linux-x64-v5.0-ga.solitairetheme8

- cd cuda

sudo cp lib64/* /usr/local/cuda/lib64/

sudo cp include/cudnn.h /usr/local/cuda/include/

6.安裝Tensorflow:

CUDA8 ,cuDNN5下需要自己從源碼build並安裝。

準備工作:

-下載tensorflow源碼:git clone GitHub - tensorflow/tensorflow: Computation using data flow graphs for scalable machine learning

-下載bazel:https://github.com/bazelbuild/bazel/releases/download/0.3.0/bazel-0.3.0-installer-linux-x86_64.sh

-下載pip以及tensorflow的各種依賴:

sudo apt-get install python-pip

sudo apt-get install python-numpy swig python-dev python-wheel

-安裝java:

一開始安裝的是openjdk-9,但是後面使用bazel的時候出錯了,改為使用openjdk-8

sudo apt-get install openjdk-8-jdk

sudo apt-get purge openjdk-9*

-下載build時的一些依賴:

sudo apt-get install libcurl3 libcurl3-dev

sudo apt-get install gcc-4.8 g++-4.8

sudo apt-get install zlib1g-dev

開始安裝:

-安裝BAZEL:./bazel-0.3.0-installer-linux-x86_64.sh –user

-添加PATH和BAZEL服務:

在~/.bashrc中添加二行:

source /home/(你的用戶名)/.bazel/bin/bazel-complete.bash

export PATH=$PATH:/home/(你的用戶名)/.bazel/bin

-運行source ~/.bashrc

-進入tensorflow目錄,運行./configure進行配置,開頭選兩個yes後剩下全部默認即可

-為了防止missing dependency declarations錯誤,在third_party/gpus/crosstool/CROSSTOOL

文件中的toolchain {}中 添加

cxx_builtin_include_directory: "/usr/local/cuda-8.0/include"

-測試向編譯:bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer

-測試編譯結果:bazel-bin/tensorflow/cc/tutorials_example_trainer –use_gpu

-正式編譯並安裝tensorflow:

bazel build -c opt --config=cuda //tensorflow/tools/pip_package:build_pip_package

bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg

sudo pip install /tmp/tensorflow_pkg/tensorflow-0.9.0-py2-none-any.whl

-提示:如果編譯中遇到了各種奇怪的問題比如網路問題,換了gcc版本,改了配置,甚至本來解壓從github下載的tensorflow-master然後換回clone得到的tensorflow什麼的,可以用bazel clean命令清潔下環境

7.安裝OpenaiGym:

-安裝doom-py的依賴

apt-get install -y python-numpy cmake zlib1g-dev libjpeg-dev libboost-all-dev gcc libsdl2-dev wget unzip

-運行sudo pip install gym[all] -i Simple Index –trusted-hosts pypi.douban.com

參考資料:

深度學習主機環境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow

深度學習主機環境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow

TensorFlow, Caffe, Chainer Deep Learning大御所を一気に source code build GPU向けに setupしてみた

TensorFlow, Caffe, Chainer と Deep Learning大御所を一気に source code build で GPU向けに setupしてみた

Getting "missing dependency declarations" with bazel 0.3.0

https://github.com/tensorflow/tensorflow/issues/3431

DQN實戰篇1 從零開始安裝Ubuntu, Cuda, Cudnn, Tensorflow, OpenAI Gym

DQN實戰篇1 從零開始安裝Ubuntu, Cuda, Cudnn, Tensorflow, OpenAI Gym - 智能單元 - 知乎專欄

Unity not loading after nvidia drivers installation

http://ubuntuforums.org/showthread.php?t=2124823

Installation broken on Ubuntu 16.04

Installation broken on Ubuntu 16.04 · Issue #1456 · bazelbuild/bazel · GitHub


以上回答都太複雜了,直接用 docker容器搭建深度學習環境,快、准、狠

zhudaoruyi/deep-learning-gpu-env

拿去不謝!!


1080P 顯卡安裝過程


基於GTX1070的軟硬體配置詳情,可以看看這篇文章Artificial Intelligence For Coder


參考:

深度學習工作站攢機過程記錄

:: DIGITS DEVBOX Documentation


Ubuntu15.04+caffe+cuda7.5+cudnn+matlab

安裝教程,環境ubuntu


so幸福,選個喜歡的深度學習框架就可以自己飛翔了


如何搭建一台深度學習伺服器

看看這個吧

不過如果自己玩還是用亞馬遜的服務挺好,也不算貴


推薦閱讀:

如何評價Facebook Training ImageNet in 1 Hour這篇論文?
如何看待賈揚清Caffe2go開源,手機就能訓練神經網路?

TAG:Ubuntu | CUDA | 深度學習DeepLearning | Caffe深度學習框架 | gtx1070 |