GTX1080/1070配置深度學習環境。求指導,剛入手~?
這裡有一篇非常詳細的文章,包括硬體的選擇,雙系統的安裝,以及深度學習框架和CUDA環境安裝等等——
來源: Build Personal Deep Learning Rig: GTX 1080 + Ubuntu 16.04 + CUDA 8.0RC + CuDnn 7 + Tensorflow/Mxnet/Caffe/Darknet
作者: Guanghan Ning文章的著作權屬於我,如果需要轉載,請註明來源和作者~剛配好,參見這裡 http://wh1te.me
這是個人前幾天配置環境的流程,走了不少彎路。。。
部署Ubuntu 16.04+cuda8.0+Tensorflow+OpenaiGym:
使用機器:
CPU Intel i7 6700k
MB Gigabyte Z170X-UD3
Mem Kingstone Hyper Fury DDR4 2400 16Gx1
GPU Galaxy GTX1080 Gamer
HDD Smasung PM951 512GB
部署過程:
1.使用U盤安裝Ubuntu 16.04 LTS.
2.安裝完後只有默認桌面與滑鼠指針,並且有閃爍現象。做如下處理
-按Ctrl+Alt+F1切換到控制台界面,輸入用戶名與密碼登陸
-安裝NVIDA顯卡驅動,步驟:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-367
sudo apt-get install mesa-common-dev
sudo apt-get install freeglut3-dev
-之後重啟主機。
3.重啟後仍然只有桌面與滑鼠,但是沒有閃爍情況,也能打開右鍵菜單。做如下處理
-右鍵打開終端,運行compiz –replace
-發現opengl plugin not loaded
-運行sudo apt-get instal ccsm apt-get install -y python-numpy cmake zlib1g-dev libjpeg-dev libboost-all-dev gcc libsdl2-dev wget unzip
-運行ccsm
-Enable Unity Plugin
4.重啟後系統進入可用狀態。
5.從NVIDIA官網下載CUDA 8.0 RC 和 cdDNN 5.0.
-https://developer.nvidia.com/cuda-toolkitcxx_builtin_include_directory: "/usr/local/cuda-8.0/include"
-https://developer.nvidia.com/cudnn
需要註冊NVIDA賬號。
筆者下載的CUDA 是runfile形式的,操作如下:
-運行sudo sh cuda_8.0.27_linux-run.runapt-get install -y python-numpy cmake zlib1g-dev libjpeg-dev libboost-all-dev gcc libsdl2-dev wget unzip
-按CTRL+C跳過EULA,同意EULA
-不安裝361驅動
-其他全選y和默認
安裝完畢後,寫入環境變數:
-gedit ~.bashrc
-寫入下面二行(如果文件非空,找個順眼的地方寫進去就好)
export PATH=$PATH:/usr/local/cuda/binrefer=intelligentunit
export LD_LIBRARY_PATH=:/usr/local/cuda/lib64
聽說nouveau會導致安裝CUDA後無法進入系統,筆者抱著反正也用不上這驅動的心態屏蔽了nouveau驅動,步驟如下:
-sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
-向這個空文件寫入
blacklist nouveau
blacklist lbm-nouveaucxx_builtin_include_directory: "/usr/local/cuda-8.0/include"
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
重啟完成CUDA安裝。然後安裝cuDNN:
-解壓cudnn-8.0-linux-x64-v5.0-ga.solitairetheme8
- cd cuda
sudo cp lib64/* /usr/local/cuda/lib64/
sudo cp include/cudnn.h /usr/local/cuda/include/
6.安裝Tensorflow:
CUDA8 ,cuDNN5下需要自己從源碼build並安裝。
準備工作:
-下載tensorflow源碼:git clone GitHub - tensorflow/tensorflow: Computation using data flow graphs for scalable machine learning
-下載bazel:https://github.com/bazelbuild/bazel/releases/download/0.3.0/bazel-0.3.0-installer-linux-x86_64.sh
-下載pip以及tensorflow的各種依賴:
sudo apt-get install python-pip
sudo apt-get install python-numpy swig python-dev python-wheel
-安裝java:
一開始安裝的是openjdk-9,但是後面使用bazel的時候出錯了,改為使用openjdk-8
sudo apt-get install openjdk-8-jdk
sudo apt-get purge openjdk-9*
-下載build時的一些依賴:
sudo apt-get install libcurl3 libcurl3-dev
sudo apt-get install gcc-4.8 g++-4.8
sudo apt-get install zlib1g-dev開始安裝:
-安裝BAZEL:./bazel-0.3.0-installer-linux-x86_64.sh –user
-添加PATH和BAZEL服務:
在~/.bashrc中添加二行:
source /home/(你的用戶名)/.bazel/bin/bazel-complete.bash
export PATH=$PATH:/home/(你的用戶名)/.bazel/bin
-運行source ~/.bashrc
-進入tensorflow目錄,運行./configure進行配置,開頭選兩個yes後剩下全部默認即可
-為了防止missing dependency declarations錯誤,在third_party/gpus/crosstool/CROSSTOOL
文件中的toolchain {}中 添加
cxx_builtin_include_directory: "/usr/local/cuda-8.0/include"
-測試向編譯:bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer
-測試編譯結果:bazel-bin/tensorflow/cc/tutorials_example_trainer –use_gpu
-正式編譯並安裝tensorflow:
bazel build -c opt --config=cuda //tensorflow/tools/pip_package:build_pip_package
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
sudo pip install /tmp/tensorflow_pkg/tensorflow-0.9.0-py2-none-any.whl
-提示:如果編譯中遇到了各種奇怪的問題比如網路問題,換了gcc版本,改了配置,甚至本來解壓從github下載的tensorflow-master然後換回clone得到的tensorflow什麼的,可以用bazel clean命令清潔下環境
7.安裝OpenaiGym:
-安裝doom-py的依賴
apt-get install -y python-numpy cmake zlib1g-dev libjpeg-dev libboost-all-dev gcc libsdl2-dev wget unzip
-運行sudo pip install gym[all] -i Simple Index –trusted-hosts pypi.douban.com
參考資料:
深度學習主機環境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow
深度學習主機環境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow
TensorFlow, Caffe, Chainer と Deep Learning大御所を一気に source code build で GPU向けに setupしてみた
TensorFlow, Caffe, Chainer と Deep Learning大御所を一気に source code build で GPU向けに setupしてみた
Getting "missing dependency declarations" with bazel 0.3.0
https://github.com/tensorflow/tensorflow/issues/3431
DQN實戰篇1 從零開始安裝Ubuntu, Cuda, Cudnn, Tensorflow, OpenAI Gym
DQN實戰篇1 從零開始安裝Ubuntu, Cuda, Cudnn, Tensorflow, OpenAI Gym - 智能單元 - 知乎專欄
Unity not loading after nvidia drivers installation
http://ubuntuforums.org/showthread.php?t=2124823Installation broken on Ubuntu 16.04
Installation broken on Ubuntu 16.04 · Issue #1456 · bazelbuild/bazel · GitHub
以上回答都太複雜了,直接用 docker容器搭建深度學習環境,快、准、狠
zhudaoruyi/deep-learning-gpu-env拿去不謝!!
1080P 顯卡安裝過程
基於GTX1070的軟硬體配置詳情,可以看看這篇文章Artificial Intelligence For Coder
參考:深度學習工作站攢機過程記錄:: DIGITS DEVBOX Documentation
Ubuntu15.04+caffe+cuda7.5+cudnn+matlab安裝教程,環境ubuntu
so幸福,選個喜歡的深度學習框架就可以自己飛翔了
如何搭建一台深度學習伺服器看看這個吧不過如果自己玩還是用亞馬遜的服務挺好,也不算貴
推薦閱讀:
※如何評價Facebook Training ImageNet in 1 Hour這篇論文?
※如何看待賈揚清Caffe2go開源,手機就能訓練神經網路?
TAG:Ubuntu | CUDA | 深度學習DeepLearning | Caffe深度學習框架 | gtx1070 |