win10 + CUDA 9.0 + cuDNN 7.0 + tensorflow源碼編譯安裝

02-09

1、前言

在配置了個人深度學習主機後，就有開始著手安裝一些必備的軟體環境了，我是使用anaconda5.0.0 python3.6版本（下載地址Downloads）來管理我的win10 python環境的，新建了基於python3.5的tensorflow-gpu-py35 conda環境，如果使用conda安裝tensorflow則會默認安裝tensorflow-gpu 1.1.0並會主動安裝cudatoolkit8.0 + cudnn6.0，但是就算配置好cuda環境還是無法使用，如果是使用python pip命令安裝則會默認安裝最新版本的tensorflow-gpu 1.3.0版本，而cuda需要自己到NVIDIA官網上下載並安裝配置好環境變數（吐槽一下：老黃下載cudnn的官網鏈接掛了，一直無法下載cudnn，據說已經有一個月了！！！）。其實不管是安裝tensorflow-gpu哪個版本，還是配置CUDA8.0 + cuDNN6.0/cuDNN5.1或者CUDA9.0 + cuDNN7.0，我的環境import tensorflow時都會報如下錯誤：

>>> import tensorflow as tfTraceback (most recent call last): File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow_internal.py", line 18, in swig_import_helper return importlib.import_module(mname) File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libimportlib\__init__.py", line 126, in import_module return _bootstrap._gcd_import(name[level:], package, level) File "<frozen importlib._bootstrap>", line 978, in _gcd_import File "<frozen importlib._bootstrap>", line 961, in _find_and_load File "<frozen importlib._bootstrap>", line 950, in _find_and_load_unlocked File "<frozen importlib._bootstrap>", line 648, in _load_unlocked File "<frozen importlib._bootstrap>", line 560, in module_from_spec File "<frozen importlib._bootstrap_external>", line 922, in create_module File "<frozen importlib._bootstrap>", line 205, in _call_with_frames_removedImportError: DLL load failed: 找不到指定的模塊。During handling of the above exception, another exception occurred:Traceback (most recent call last): File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow.py", line 41, in <module> from tensorflow.python.pywrap_tensorflow_internal import * File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow_internal.py", line 21, in <module> _pywrap_tensorflow_internal = swig_import_helper() File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow_internal.py", line 20, in swig_import_helper return importlib.import_module(_pywrap_tensorflow_internal) File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libimportlib\__init__.py", line 126, in import_module return _bootstrap._gcd_import(name[level:], package, level)ModuleNotFoundError: No module named _pywrap_tensorflow_internalDuring handling of the above exception, another exception occurred:Traceback (most recent call last): File "<stdin>", line 1, in <module> File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflow\__init__.py", line 24, in <module> from tensorflow.python import * File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpython\__init__.py", line 49, in <module> from tensorflow.python import pywrap_tensorflow File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow.py", line 52, in <module> raise ImportError(msg)ImportError: Traceback (most recent call last): File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow_internal.py", line 18, in swig_import_helper return importlib.import_module(mname) File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libimportlib\__init__.py", line 126, in import_module return _bootstrap._gcd_import(name[level:], package, level) File "<frozen importlib._bootstrap>", line 978, in _gcd_import File "<frozen importlib._bootstrap>", line 961, in _find_and_load File "<frozen importlib._bootstrap>", line 950, in _find_and_load_unlocked File "<frozen importlib._bootstrap>", line 648, in _load_unlocked File "<frozen importlib._bootstrap>", line 560, in module_from_spec File "<frozen importlib._bootstrap_external>", line 922, in create_module File "<frozen importlib._bootstrap>", line 205, in _call_with_frames_removedImportError: DLL load failed: 找不到指定的模塊。During handling of the above exception, another exception occurred:Traceback (most recent call last): File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow.py", line 41, in <module> from tensorflow.python.pywrap_tensorflow_internal import * File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow_internal.py", line 21, in <module> _pywrap_tensorflow_internal = swig_import_helper() File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libsite-packages ensorflowpythonpywrap_tensorflow_internal.py", line 20, in swig_import_helper return importlib.import_module(_pywrap_tensorflow_internal) File "D:ProgramDataAnaconda3envs ensorflow-gpu-py36libimportlib\__init__.py", line 126, in import_module return _bootstrap._gcd_import(name[level:], package, level)ModuleNotFoundError: No module named _pywrap_tensorflow_internalFailed to load the native TensorFlow runtime.See https://www.tensorflow.org/install/install_sources#common_installation_problemsfor some common reasons and solutions. Include the entire stack traceabove this error message when asking for help.

關鍵報錯：ModuleNotFoundError: No module named _pywrap_tensorflow_internal

這種報錯，網上也有很多解答，無非就是CUDA和cuDNN版本不對，需要配置成正確的版本，如需要對應CUDA版本配置CUDA 8.0 + cuDNN 6.0(cuDNN 5.1)以及他們的環境等等，但是好尷尬，我這邊依然報錯。試想一下，剛剛買了一塊強大的gtx 1080ti顯卡，而我卻不能用它來做訓練提高效率，那該有多難受多浪費啊，這是我不能接受的！而我安裝tensorflow cpu版本試運行是沒有任何問題的，說明就是CUDA環境沒有配好了，這就讓我萌生了源碼編譯tensorflow的念頭！

官網上介紹在window下編譯tensorflow源碼的文章較少，大部分都是介紹在linux下bazel如何編譯源碼的，但是在github tensorflow主目錄tensorflow ensorflowcontribcmake下有詳細的網頁介紹Windows環境編譯方法，其實這個介紹有寫到源代碼目錄C:TF ensorflow ensorflowcontribcmake下的README.md，通讀整篇文檔，得到如下重要信息：

1-1）官網介紹cmake window build tensorflow的網頁（被牆了無法打開）https://www.tensorflow.org/install/install_windows

1-2）當前已知限制

1-3）官方要求準備的軟體

1-4）window編譯僅支持python3.5

1-5）window下cmake編譯tensorflow步驟

官方文檔所給的步驟已經很詳細了，因此，我主要是參考該文檔來執行編譯操作。但是，你會覺得這真的有那麼簡單的嗎？事實上，並非如此簡單，更何況我所使用的軟體環境都是比較新的，與官方要求有些出路，主要是自己之前已有安裝類似軟體只是版本比較新不想再多折騰，且網上沒有任何win10 + cuda 9.0 + cudnn 7.0 + cmake + tensorflow-gpu的編譯介紹，我算是第一個吃螃蟹的人了吧，說句實話，這個過程真的很折騰，耗費的時間精力也很多，希望官方儘快給出解決方案出來吧！

那麼以下就是我個人的源碼編譯安裝tensorflow-gpu的過程啦，僅供參考！

2、環境準備

先說一下我的主機環境情況：

win10 64bit + gtx 1080ti + anaconda5.0.0（python3.6）

2-1）安裝git

我安裝的版本是Git-2.14.3-64-bit.exe，是比較新的，該工具主要是方便在window環境下從github下載tensorflow源碼。

鏈接: https://pan.baidu.com/s/1kVqthtX 密碼: mr16

2-2）下載tensorflow源碼並切換分支

git clone --recursive https://github.com/tensorflow/tensorflow.git

注意要加上「--recursive」，否則一些submodule不會下載。

下載好後，默認分支是master屬於最新的，建議切換到r1.4版本，參照命令如下：

git checkout -b tensorflow-gpu-1.4.0 --track origin/r1.4

2-3）安裝python環境管理工具anaconda3-5.0.0

anaconda不是必需的，安裝它主要是為了方便管理window下的python環境,你也可以直接到python官網上下載安裝python3.5，但是tensorflow現在只支持64位的window python3環境!

鏈接: https://pan.baidu.com/s/1i4NWYWl 密碼: dfwd

安裝完anaconda後，因其是基於python3.6的，所以我們打開anaconda prompt執行如下命令切換到python3.5：

conda create -n tensorflow-gpu-py35 python=3.5

這樣我們就擁有了python3.5的環境！然後按照官方說明下載安裝numpy，命令如下：

conda install numpy==1.12.0

建議指定numpy版本為1.12.0，因在python3.5下numpy兼容性不夠好！

2-4）安裝swig

SWIG是一個幫助使用C或者C++編寫的軟體能與其它各種高級編程語言進行嵌入鏈接的開發工具，這個是google官方要求必裝的工具！

我裝的是swigwin-3.0.12 鏈接: https://pan.baidu.com/s/1c1UmLLe 密碼: vx6j

2-5）安裝CMake

我們來看看百度百科對cmake的介紹：

CMake是一個跨平台的安裝（編譯）工具，可以用簡單的語句來描述所有平台的安裝(編譯過程)。他能夠輸出各種各樣的makefile或者project文件，能測試編譯器所支持的C++特性,類似UNIX下的automake。只是 CMake 的組態檔取名為 CMakeLists.txt。Cmake 並不直接建構出最終的軟體，而是產生標準的建構檔（如 Unix 的 Makefile 或 Windows Visual C++ 的 projects/workspaces），然後再依一般的建構方式使用。這使得熟悉某個集成開發環境（IDE）的開發者可以用標準的方式建構他的軟體，這種可以使用各平台的原生建構系統的能力是 CMake 和 SCons 等其他類似系統的區別之處。

如果安裝了CMake 3.6.3，那麼就得安裝visual studio 2015了，否則CMake會找不到C/C++編譯器！

鏈接: https://pan.baidu.com/s/1qYUK544 密碼: weeb

2-6）安裝CUDA和cuDNN

版本當然是如題所述的CUDA 9.0 + cuDNN 7.0的，但是一定要配置好其路徑！

值得注意的是，我在win10下安裝CUDA8.0提示找不到合適的硬體，這也是不得不安裝更新的CUDA 9.0原因！

CUDA安裝時一路next就好，沒有什麼特別注意的地方，只要不報錯就好，這個網上教程也很多就不細說，唯一要特別說明的是cuDNN的配置！

cuDNN是專用於神經網路計算加速的，其實他就是一包庫文件，每一個CUDA版本都有特定與之匹配的cuDNN庫文件，如CUDA 9.0就匹配cudnn-9.0-windows10-x64-v7，通常我們到官網上下載並解壓縮後，直接將其文件替換到CUDA相應目錄下即可！如下，解壓縮cuDNN後在cuda目錄下得到三個文件夾，裡面分別有cudnn64_7.dll、cudnn.h及cudnn.lib。

我們將其拷貝合併到CUDA的安裝目錄C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0下

之後配置CUDA的環境變數，按如下步驟依次打開：

此電腦-->滑鼠右鍵-->屬性-->高級系統設置-->環境變數(N)...

然後新建如下標黃環境變數：

CUDA下載：鏈接: https://pan.baidu.com/s/1hsxkQEw 密碼: r8cp

cuDNN下載：鏈接: https://pan.baidu.com/s/1slG5s5n 密碼: unv2

2-7）安裝visual studio 2015

我是下載Visual Studio professional 2015版，所安裝模塊如下：

visual studio 2015主要是在cmake配置好tensorflow後提供給cmake使用的主要編譯工具！

以下鏈接提供了visual studio 2015的各個版本，可結合自身需要安裝不同版本，並非一定按照官方要求安裝企業版的！

個人免費！Visual Studio 2015官方下載-Visual Studio,Visual Studio 2015,正式版,免費,下載-驅動之家

至此，相關的軟體都已安裝完了！

所有的軟體工具都放到了百度網盤上，上面所給的鏈接是單個軟體的，當然也可以統一下載：

鏈接: https://pan.baidu.com/s/1qXFBiBM 密碼: ky1j

3、CMake配置

3-1）修改CMakeLixts.txt更新CUDA和cuDNN版本

由於官方所提供的適配只是基於CUDA 8.0 + cuDNN 6.0的，而我們是要編譯基於CUDA 9.0 + cuDNN 7.0，因此分析tensorflow ensorflowcontribcmakeCMakeLists.txt後，我們需要修改相應的配置：

如下圖，將上圖標黃的依次改為下圖標黃式樣：

3-2）在cmake目錄下新建build文件夾

以管理員身份打開cmd命令行界面，然後按如下步驟操作：

3-2-1：cd C:TF ensorflow ensorflowcontribcmake3-2-2：mkdir build3-2-3：cd build

3-3）執行如下命令配置tensorflow

cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^-DSWIG_EXECUTABLE="D:win10 softwareswigwin-3.0.12swig.exe" ^-DPYTHON_EXECUTABLE="D:ProgramDataAnaconda3envs ensorflow-gpu-py35python.exe" ^-DPYTHON_LIBRARIES="D:ProgramDataAnaconda3envs ensorflow-gpu-py35libspython35.lib" ^-Dtensorflow_ENABLE_GPU=ON ^-DCUDNN_HOME="C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0"

如上命令就是指定swig、python和CUDA環境，可根據個人情況具體適配，其中「-Dtensorflow_ENABLE_GPU=ON ^」是打開GPU版本編譯的選項，必須要設為「ON」，否則還是用CPU版本的話真的沒有必要大費周章！當然你也可以直接修改C:TF ensorflow ensorflowcontribcmakeCMakeLists.txt，按照如下格式修改也可以：

此外，根據cmake下面的READRM.md說明，還有不少選項，你也可以自行選擇是否重新配置，但是也許會報出未知的錯誤！

當你看到類似如下的終端信息時，恭喜你配置cmake成功，至少我們已經邁開第一步了！

然而這麼配置後就OK了嗎！？其實不是的，還有更多的問題等著我們去分析解決！！！

具體相關問題的分析解決方法請看第五條！

4、visual studio編譯

從cmake的配置來看，我們並沒有使用CMake-GUI版本，而是在cmd.exe完成所有動作了！

cmake配置後會生成tensorflow.sln，這個就是visual studio項目模板，我們可以使用visual studio打開並生成tensorflow python安裝包，但是，直接命令行也是可以的，更加簡單快捷，只是要記得以管理員身份運行cmd，命令如下：

"C:Program Files (x86)MSBuild14.0Binamd64MSBuild.exe" /p:Configuration=Release tf_python_build_pip_package.vcxproj

至此，就開始真正編譯tensorflow源碼了！

5、編譯問題分析解決方法

問題一：cudnnSetRNNDescriptor參數不匹配

tensorflow ensorflowstream_executorcudacuda_dnn.cc(239): error C2660: 「cudnnSetRNNDescriptor」: 函數不接受 8 個參數 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild f_stream_executor.vcxproj]

這個問題是在tensorflow r1.3有發現，原以為官方有釋放tensorflow-gpu-1.3.0版本，應該更好適配，但事實上發現tensorflow-gpu-1.3.0使用的是cuDNN 7.0里的v5版本。

在cuda_dnn.c（239）看到如下：

而PERFTOOLS_GPUTOOLS_CUDNN_WRAP其實也是一個宏

它指向cuDNN 9.0下的cudnn.h頭文件里的cudnnSetRNNDescriptor

很明顯，原本的cudnnSetRNNDescriptor有10個形參，肯定不接受8個形參了！

好在cudnn.h有cudnnSetRNNDescriptor函數的不同版本

通過將http://cuda_dnn.cc里的cudnnSetRNNDescriptor修改為cudnnSetRNNDescriptor_v5可解決這個問題！

問題二：unable to access https://boringssl.googlesource.com/boringssl

編譯tensorflow過程中會伴隨各種submodule的下載，有些thirty module是要訪問外網才可下載的，在r1.3和r1.4版本中都有遇到了這個問題，解決方法如下：

進入tensorflow ensorflowcontribcmakeexternal修改boringssl的url，將其URL由原來指向https://boringssl.googlesource.com/boringssl 改為 https://github.com/google/boringssl

但這並不足以完全解決問題，在第一次編譯因grpc不全錯誤退出後，我們需要再修改一些文件：

a、修改C:TF ensorflow ensorflowcontribcmakeuildgrpcsrcgrpc.gitmodules，將third_party/boringssl-with-bazel的url為https://github.com/google/boringsslb、修改C:TF ensorflow ensorflowcontribcmakeuildgrpcsrcgrpc.gitconfig中的third_party/boringssl-with-bazel的url為https://github.com/google/boringsslcc、為了防止重新下載grpc及其submudule，我們需要修改相應的cmake文件C:TF ensorflow ensorflowcontribcmakeuildgrpc mpgrpc-gitclone.cmake，主要是不讓他存在刪除或重新下載grpc的命令，我們將如下命令注釋掉：#execute_process(# COMMAND ${CMAKE_COMMAND} -E remove_directory "C:/TF/tensorflow/tensorflow/contrib/cmake/build/grpc/src/grpc"# RESULT_VARIABLE error_code# )#if(error_code)# message(FATAL_ERROR "Failed to remove directory: C:/TF/tensorflow/tensorflow/contrib/cmake/build/grpc/src/grpc")#endif()同時不讓它retry git clone 3 times，主要是在while(error_code AND number_of_tries LESS 3)之前set(error_code 0)

問題三：error C2001: 常量中有換行符

C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2 e2 estingsearch_test.cc(247): error C2001: 常量中有換行符 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2search_test.vcxproj] [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2.vcxproj] C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2 e2 estingsearch_test.cc(248): error C2001: 常量中有換行符 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2search_test.vcxproj] [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2.vcxproj] C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2 e2 estingsearch_test.cc(249): error C2001: 常量中有換行符 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2search_test.vcxproj] [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2.vcxproj] C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2 e2 estingsearch_test.cc(250): error C2001: 常量中有換行符 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2search_test.vcxproj] [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2.vcxproj] C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2 e2 estingsearch_test.cc(252): error C2064: 項不會計算為接受 1 個參數的函數 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2src e2search_test.vcxproj] [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuild e2.vcxproj]

這個問題主要出現在http://re2_test.cc和http://search_test.cc文件內，根據錯誤提示進入到文件相應位置，看到如下代碼：

哈哈，看到了嗎，有表情包哦，這裡真的想放個大大的表情包（驚訝~），那麼這個問題是因為編碼引起的，所以可以用notepad++或其他軟體將http://re2_test.cc和http://search_test.cc由utf-8轉換為ANSI編碼格式得解！

問題四：CUSTOMBUILD : error : RPC failed; curl 56 OpenSSL SSL_read: error:1408F119:SSL routines:SSL3_GET_RECORD:decryption failed or bad record mac, errno 0

CUSTOMBUILD : error : RPC failed; curl 56 OpenSSL SSL_read: error:1408F119:SSL routines:SSL3_GET_RECORD:decryption failed or bad record mac, errno 0 [C:UsersAdministratorDesktopTensorFlow ensorflow ensorflowcontribcmakeuildprotobuf.vcxproj]

這個問題看起來是無法下載protobuf庫，可是查看C:TF ensorflow ensorflowcontribcmakeexternalprotobuf.cmake並沒有發現有何問題，鏈接是https://github.com/mrry/protobuf.git瀏覽器是可以打開的呢，所以可不用管，事實證明，再次編譯後就可以正常下載了哦，網路好的時候你也不一定看到這個問題！

問題五：fatal error C1083：無法打開包括文件：「zlib.h」：No such file or director

fatal error C1083：無法打開包括文件：「zlib.h」：No such file or director [C:TF est ensorflow ensorflowcontribcmakeuildgrpc.vcxproj]

我查找該錯誤的上下文，發現存在如下warning信息：

那麼打開C:TF ensorflow ensorflowcontribcmakeuildgrpcsrcgrpcCMakeList.txt分析發現：

文中說gRPC_ZLIB_PROVIDER要使用package方式，所以可以修改gRPC_ZLIB_PROVIDER為package方式，如下：

其他的不用動否則就又會報出其他錯誤了，畢竟編譯log里只警告gRPC_ZLIB_PROVIDER有問題，那麼查看警告輸出的120行上下文，又發現ZLIB_ROOT_DIR指向了一個不存在的目錄，所以這個問題的另外一種解法是修改ZLIB_ROOT_DIR文件指向，如下：

值得注意的是，我們不能直接修改C:TF ensorflow ensorflowcontribcmakeuildgrpcsrcgrpc下的CMakeList.txt，因為在編譯的時候他會被覆蓋掉的，那我分析到替換的文件是在C:TF ensorflow ensorflowcontribcmakepatchesgrpc，所以我們修改這個目錄的CMakeList.txt文件可得解！

問題六：error : downloading https://storage.googleapis.com/libpng-public-archive/libpng-1.2.53.tar.gz failed

-- Retry after 5 seconds (attempt #2) ... --- LOG END --- -- downloading... src=https://storage.googleapis.com/libpng-public-archive/libpng-1.2.53.tar.gz dst=C:/TF/test/tensorflow/tensorflow/contrib/cmake/build/downloads/libpng-1.2.53.tar.gz timeout=noneCUSTOMBUILD : error : downloading https://storage.googleapis.com/libpng-public-archive/libpng-1.2.53.tar.gz failed [C:TF est ensorflow ensorflowcontribcmakeuildpng.vcxproj] status_code: 35 status_string: "SSL connect error" log: --- LOG BEGIN --- timeout on name lookup is not supported Trying 172.217.27.144...

這種錯誤，看log後面又成功下載了，所以不用管，不行的話多試幾遍看看！

問題7：致命的錯誤，無法解決

使用r1.4版本編譯出現的錯誤：

CUSTOMBUILD : Internal error : assertion failed at: "C:/dvs/p4/build/sw/rel/gpu_drv/r384/r384_00/drivers/compiler/edg/EDG_4.12/src/lookup.c", line 2652 [C:TF ensorflow ensorflowcontribcmakeuild f_core_gpu_kernels.vcxproj] 1 catastrophic error detected in the compilation of "C:/Users/ADMINI~1/AppData/Local/Temp/tmpxft_00000c94_00000000-8_adjust_contrast_op_gpu.cu.cpp4.ii". Compilation aborted. adjust_contrast_op_gpu.cu.ccCUSTOMBUILD : nvcc error : cudafe++ died with status 0xC0000409 [C:TF ensorflow ensorflowcontribcmakeuild f_core_gpu_kernels.vcxproj] CMake Error at tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release.cmake:267 (message): Error generating file C:/TF/tensorflow/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj

這看起來是CUDA編譯器的問題，我這邊重裝CUDA也無解！

使用1.3版本編譯出現的問題：

c: f est ensorflow ensorflowcontribcmakeuildexternaleigen_archiveeigensrc/Core/util/Macros.h(416): fatal error C1017: 無效的整數常量表達式 [C:TF est ensorflow ensorflowcontribcmakeuild f_core_gpu_kernels.vcxproj] CMake Error at tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release.cmake:267 (message): Error generating file C:/TF/test/tensorflow/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj已完成生成項目「C:TF est ensorflow ensorflowcontribcmakeuild f_core_gpu_kernels.vcxproj」(默認目標)的操作 - 失敗。

Macros.h分析沒看到任何錯誤，他是http://adjust_contrast_op_gpu.cu.cc造成的，但任憑我如何倒騰都無解！

以上兩個問題，已經超出了我可以解決的能力，我已經try again by again，but couldn』t find any solution，so mad！

所以，這是一個失敗的嘗試，不過，我將我編譯過程中遇到的問題做個分析總結，以便後來者不再采坑。另外，我已經將錯誤問題提交到github tensorflow上，可以關注一下：

fail to build tensorflow-gpu by CUDA 9.0 cuDNN 7 at win10 envs · Issue #14126 · tensorflow/tensorflow

6、安裝tensorflow-gpu並驗證

未完待續。。。