看了這篇才明白為什麼GPU選型要挑M60

從深度學習到人工智慧,近幾年GPU逐漸走入人們的視線,它使得大規模計算神經網路成為可能。在眾多不同系列和規格複雜的情況下,如何選擇適合的卡來做計算成為很多人遇到的問題。

近日,美團雲GPU雲主機正式上線開放使用。在GPU選型方面,美團雲目前主要使用NVIDIA Tesla系列專業加速計算設備M60。這一選型是基於多個維度的詳細測試分析對比。今天我們把測試結果分享出來,相信會對想要購買美團雲GPU雲主機的人有很大幫助。

目前在深度學習領域,主流的商用GPU型號是K40、M40以及M60,我們將對比這三款產品的關鍵性能參數,並確定性價比最優的產品。官方的參數對比如下:

M60 擁有兩個 GM204 核芯,每個 GM204 核芯擁有 2048 個計算單元,擁有8G顯存,單精度浮點性能可達 4.85Tflops。在美團雲上,一個 M60 的 GPU雲主機是擁有一個 GM204 核芯的計算能力,售價為 1.2 元/時(僅GPU,不包括CPU、內存、網路、磁碟的價格)。

M40 擁有一個 GM200 核芯,該核芯擁有 3072 個計算單元,擁有12G顯存,單精度浮點性能可達 7Tflops。在美團雲上,一個 M40 的 GPU雲主機是擁有一個 GM200 核芯的計算能力,售價為 2.5 元/時(僅GPU,不包括CPU、內存、網路、磁碟的價格)。

K40 擁有一個 GK110 核芯,該核芯擁有 2880 個計算單元,擁有12GB顯存,單精度浮點性能可達 4.29Tflops。出售時的價格是 1.8 元/時(僅GPU,不包括CPU、內存、網路、磁碟的價格)。

可見,一個 M40 雲主機的計算能力約為一個 M60 雲主機(只有一個GM204 核)的1.44倍,但是價格卻超過M60的2倍;M40 雲主機的計算能力約為一個 M60 雲主機(只有一個GM204 核)的1.44倍,但是價格卻超過M60的2倍;而K40 雲主機的計算能力不如M60,卻比 M60 貴。(美團雲現已停售K40)

因此,美團雲將M60作為GPU雲主機主打型號,在雙核M60的情況下,M60價格(2*1.2元/時)低於M40(2.5元/時),計算能力相比於M40卻有大幅的優勢。

為了驗證實際的計算能力,我們設計了兩個實驗:

實驗一 我們用 Google im2txt 圖像標註模型,數據集採用flickr8k,模型是 CNN + RNN,僅訓練 RNN 部分的 LSTM,進行2000次迭代訓練。

M40雲主機用的時間是 575s,M60雲主機用的時間是 892s,K40雲主機用的時間是 1253s,可見在 LSTM 訓練時 M40 的性能是 M60 的 1.55倍。M60的性能是K40的1.4倍。

實驗二 我們用 cifar10_cnn 模型,數據集採用cifar10,進行50個 epoch迭代訓練。

M40雲主機用的時間是 858s,M60雲主機用的時間是 931s,K40雲主機用的時間是1143s,可見在 CNN 訓練時 M40 的性能是 M60 的 1.08倍,M60的性能是K40的1.23倍,M60幾乎不遜色於M40。

綜上所述,在K40、M40、M60中,M60擁有最高的性價比。

推薦閱讀:

TAG:圖形處理器GPU | NVIDIA英偉達 | 雲主機 |