CentOS 7 安裝 Cuda 的經歷
來自專欄時間的玩具4 人贊了文章
第一次安裝 Cuda,趟了好幾個坑,總結了幾點經驗。
拿到的伺服器,配了 P2000 的卡,IT 人員預先轉了 CentOS 7,是最小化安裝。官方文檔提示,需要安裝 Kernal,於是運行了:
yum install -y kernel-devel
當然,gcc 也轉好了。看了一些人的分享,一般事先運行
yum update
不過公司網路不好,太耗時,就沒有執行。
早先的步驟大概是:
- 屏蔽nouveau;
- 安裝 dkms
sudo yum install epel-releaseyum install --enablerepo=epel dkms
- 下載安裝文件,安裝之
安裝過程中,accept 之後,在是否安裝 Nvidia Driver 選項時,選了 No。為這個錯誤付了幾個小時的代價。
安裝完畢後,就是驗證是否成功:
# 驗證 Nvidia 驅動dkms statusnvidia-smi# 驗證 cuda./usr/local/cuda-9.1/extras/demo_suite/deviveQuery
於是去官網下載最新版本驅動,把 cuda 卸載,先裝驅動。執行 dkms ,成功,執行 nvidia-smi,一直報 「NVIDIA-SMI has failed because it couldnt communicate with the NVIDIA driver ...... 」
在網上轉了一圈後,執行了一行命令
yum install kernel*
解決了第一個問題,總算心情好一點了。
重現安裝 cuda,運行 deviceQuery,報「CUDA driver version is insufficient for CUDA runtime version」。
Google 之,好多人遇到同樣的問題。
重新安裝驅動和 cuda,重啟 .......,折騰了兩遍,還是一樣。蠻幹解決不了問題,還是坐下來仔細分析了日誌,應該是 cuda 版本和顯卡驅動版本不符合導致的。想起在安裝 cuda 時,每次在 "Install Nvidia Driver" 項都選了 "No",心裡忽然有了不好的預感。
於是下載顯卡驅動和 cuda,直接安裝 cuda,這回毫不猶豫選了 「Yes」,然後一切就完美了。
折騰了大半天,得到的一個教訓是:要認真閱讀程序員給的錯誤提示,不管它是多麼糟糕的錯誤提示。
推薦閱讀:
※用CUDA實現一個稀疏的Logistic Regression
※Kubuntu 16.04上安裝Nvidia GPU驅動 + CUDA + cuDNN
※NVIDIA CUDA、AMD stream、C++ AMP、OpenCL等GPU計算框架各有什麼特點?
※Ubuntu16.04下Nvidia+Cuda8.0+Dynet安裝教程
※CUDA和OpenCL有什麼區別?
TAG:CUDA |