【Python3網路爬蟲開發實戰】1.9.1-Docker的安裝

Docker是一種容器技術,可以將應用和環境等進行打包,形成一個獨立的、類似於iOS的App形式的「應用」。這個應用可以直接被分發到任意一個支持Docker的環境中,通過簡單的命令即可啟動運行。Docker是一種最流行的容器化實現方案,和虛擬化技術類似,它極大地方便了應用服務的部署;又與虛擬化技術不同,它以一種更輕量的方式實現了應用服務的打包。使用Docker,可以讓每個應用彼此相互隔離,在同一台機器上同時運行多個應用,不過它們彼此之間共享同一個操作系統。Docker的優勢在於,它可以在更細的粒度上進行資源管理,也比虛擬化技術更加節約資源。

對於爬蟲來說,如果我們需要大規模部署爬蟲系統的話,用Docker會大大提高效率。工欲善其事,必先利其器。

本節中,我們就來介紹三大平台下Docker的安裝方式。

1. 相關鏈接

  • 官方網站:https://www.docker.com
  • GitHub:github.com/docker
  • Docker Hub:https://hub.docker.com
  • 官方文檔:https://docs.docker.com
  • DaoCloud:http://www.daocloud.io
  • 中文社區:http://www.docker.org.cn
  • 中文教程:runoob.com/docker/docke
  • 推薦圖書:yeasy.gitbooks.io/docke

2. Windows下的安裝

如果你的系統是Windows 10 64位,那麼推薦使用Docker for Windows。此時直接從Docker官方網站下載最新的Docker for Windows 安裝包即可:docs.docker.com/docker-

如果不是Windows 10 64位系統,則可以下載Docker Toolbox:docs.docker.com/toolbox

下載後直接雙擊安裝即可,詳細過程可以參考文檔說明。安裝完成後,進入命令行。

運行docker命令測試:

docker

運行結果如圖1-81所示,這就證明Docker安裝成功了。

圖1-81 運行結果

3. Linux下的安裝

詳細的分步驟安裝說明可以參見官方文檔:docs.docker.com/engine/

官方文檔中詳細說明了不同Linux系統的安裝方法,根據文檔一步步執行即可安裝成功。但是為了使安裝更加方便,Docker官方還提供了一鍵安裝腳本。使用它,會使安裝更加便捷,不用再去一步步執行命令安裝了。

首先是Docker官方提供的安裝腳本。相比其他腳本,官方提供的一定更靠譜,安裝命令如下:

curl -sSL https://get.docker.com/ | sh

只要執行如上一條命令,等待一會兒Docker便會安裝完成,這非常方便。

但是使用官方腳本安裝有一個缺點,那就是慢,也可能下載超時,所以為了加快下載速度,我們可以使用國內的鏡像來安裝,所以這裡還有阿里雲和DaoCloud的安裝腳本。

阿里雲的安裝腳本:

curl -sSL http://acs-public-mirror.oss-cn-hangzhou.aliyuncs.com/docker-engine/internet | sh -

DaoCloud的安裝腳本:

curl -sSL https://get.daocloud.io/docker | sh

這兩個腳本可以任選其一,速度都非常不錯。

等待腳本執行完畢之後,就可以使用Docker相關命令了,如運行測試Hello World鏡像:

docker run hello-world

運行結果:

Unable to find image hello-world:latest locallylatest: Pulling from library/hello-world78445dd45222: Pull complete Digest: sha256:c5515758d4c5e1e838e9cd307f6c6a0d620b5e07e6f927b07d05f6d12a1ac8d7Status: Downloaded newer image for hello-world:latestHello from Docker!This message shows that your installation appears to be working correctly.

如果出現類似上面提示的內容,則證明Docker可以正常使用了。

4. Mac下的安裝

Mac平台同樣有兩種選擇:Docker for Mac和Docker Toolbox。

Docker for Mac要求系統為OS X EI Captain 10.11或更新,至少4GB內存。如果你的系統滿足此要求,則強烈建議安裝Docker for Mac。

這裡可以使用Homebrew安裝,安裝命令如下:

brew cask install docker

另外,也可以手動下載安裝包(下載地址為:download.docker.com/mac)安裝。

下載完成後,直接雙擊安裝包,然後將程序拖動到應用程序中即可。

點擊程序圖標運行Docker,會發現在菜單欄中出現了Docker的圖標,如圖1-82中的第三個小鯨魚圖標。

圖1-82 菜單欄

點擊小鯨魚圖標,展開菜單之後,再點擊Start按鈕即可啟動Docker。啟動成功後,便會提示Docker is running,如圖1-83所示。

圖1-83 運行頁面

隨後,我們就可以在命令行下使用Docker命令了。

可以使用如下命令測試運行:

sudo docker run hello-world

運行結果如圖1-84所示,這就證明Docker已經成功安裝了。

圖1-84 運行結果

如果系統不滿足要求,可以下載Docker Toolbox,其安裝說明為:docs.docker.com/toolbox

關於Docker for Mac和Docker Toolbox的區別,可以參見:docs.docker.com/docker-

5. 鏡像加速

安裝好Docker之後,在運行測試命令時,我們會發現它首先會下載一個Hello World的鏡像,然後將其運行。但是這裡的下載速度有時候會非常慢,這是因為它默認還是從國外的Docker Hub下載的。因此,為了提高鏡像的下載速度,我們還可以使用國內鏡像來加速下載,於是就有了Docker加速器一說。

推薦的Docker加速器有DaoCloud(詳見daocloud.io/mirror)和阿里雲(詳見cr.console.aliyun.com/#)。

不同平台的鏡像加速方法配置可以參考DaoCloud的官方文檔:guide.daocloud.io/dcs/d

配置完成之後,可以發現鏡像的下載速度會快非常多。


本資源首發於崔慶才的個人博客靜覓: Python3網路爬蟲開發實戰教程 | 靜覓

如想了解更多爬蟲資訊,請關注我的個人微信公眾號:進擊的Coder

weixin.qq.com/r/5zsjOyv (二維碼自動識別)


推薦閱讀:

在 Pycom 使用 Python + Micropython + MQTT 進行物聯網編程
python3爬蟲中文亂碼問題求解?(beautifulsoup4)
Python的定位?

TAG:Python | 爬蟲計算機網路 |