Docker Compose + GPU + TensorFlow 所產生的奇妙火花

02-04

選自 hackernoon

機器之心編譯

參與：黃小天、路雪

Docker 有很多優勢，但是在數據科學和深度學習方面，使用 Docker 也存在一些阻礙。本文介紹了一系列 Docker 實用工具，以及 GPU-ready 樣板文件，讓我們看看 Docker Compose + GPU + TensorFlow 能產生什麼奇特效果吧。

Docker 很棒——越來越多的人在開發與分布中使用它。Docker 有很多優勢：即時環境設置、獨立於平台的 app、現成的解決方案、更好的版本控制、簡化的維護。

但是在數據科學和深度學習方面，使用 Docker 有一些阻礙。你必須記住所有的 Docker 標誌，以在主機和容器之間共享埠和文件，創建不必要的 run.sh 腳本，並處理 CUDA 版本和 GPU 共享。如果你曾經見過下面這個錯誤，你就會明白這種痛苦：

我們的目標

本文的目的在於為你介紹一系列 Docker 實用工具，以及我們經常在公司使用的 GPU-ready 樣板文件。

因此，以下結果將不會出現：

取而代之的是這種結果：

酷！

我們實際上想要達到的：

通過一個指令管理我們的應用程序狀態（運行、停止、移除）
把所有的運行標誌保存到我們能夠提交到 git repo 的單個配置文件
忘記 GPU 驅動程序版本不匹配和共享
在生產工具比如 Kubernetes 或 Rancher 中使用 GPU-ready 的容器

因此，這裡是我們強烈推薦給每個深度學習者的工具清單：

1. CUDA

首先，你需要 CUDA 工具包，如果你打算自己動手訓練模型，那這是必須要有的。我們推薦使用 runfile 安裝程序類型而不是 deb，因為它不會在以後的更新中混淆依賴關係。

（可選）如何檢查它是否工作：

2. Docker

你不想讓海量的庫污染你的計算機，也害怕版本出現問題。同樣，你不必親自構建和安裝——通常，軟體已為你創建好了，並包裝在圖像中。安裝 Docker 很簡單：

3. Nvidia Docker

如果使用 Docker，必須有來自英偉達的實用程序（https://github.com/NVIDIA/nvidia-docker），它真正簡化了在 Docker 容器內使用 GPU 的步驟。

安裝非常簡單：

現在，不用每次都用下列方式來共享英偉達設備：

你可以使用 nvidia-docker 命令：

同樣，你也無需擔心驅動程序版本不匹配：英偉達的 docker 插件將會幫你解決問題。

4. Docker Compose

超級有用的實用程序，允許你在文件中存儲 docker run 配置，並更輕鬆地管理應用程序狀態。儘管它的設計目的是組合多個 docker 容器，但 docker compose 在你只有一個服務的時候依然非常有用。這裡有一個穩定版本（https://github.com/docker/compose/releases）：