英偉達的 Tesla GPU 性能有多強勁,跟普通 GPU 的主要區別是什麼?

&> Run your most demanding scientific models on NVIDIA? Tesla? GPU Accelerators. Based on the NVIDIA Kepler? Architecture, Tesla GPUs are designed to deliver faster, more efficient compute performance. [...] With the introduction of Tesla K40 GPU Accelerators, you can run big scientific models on its 12GB of GPU accelerator memory, capable of processing 2x larger datasets and ideal for big data analytics. It also outperforms CPUs by up to 10x with its GPUBoost feature, converting power headroom into user-controlled performance boost.

via High Performance Computing for Servers | Tesla GPUs | NVIDIA


我不專門研究GPU硬體 如有不準確的還請各位指正

總體上講 Tesla GPU最大的突破有:

從硬體上對通用計算全面的支持和對雙精度浮點處理的更好的支持 比如Tesla C2070的雙精度浮點運算Peak Performance達到了515GFLOP/s

從軟體上講CUDA升級為Compute capability 2.0, 添加了對C++語言特性的一個子集支持 允許使用類和模版

其他的升級包括:

顯存容量的提升:Tesla C2050 3GB Tesla C2070 6GB

CUDA Cores數量的提升: 448

Shared Memory Constant Memory Size以及每個Block的寄存器數量和可運行的最大線程數量都有提升

---------------

對於普通用戶來說 Tesla GPU對通用計算的更好支持的代價是其對圖形應用性能的降低 即如果選擇玩遊戲使用的GPU 那麼選擇同時期的GTX 480/580性能會更出眾 Tesla針對的都是研究機構和需要通用計算的實驗室


根據Wikipedia GeForce 700 Series和nVidia的官方數據High Performance Computing for Servers,就CUDA核心數而言Tesla GPU沒有優勢,GTX 780Ti和GTX Titan的核心數分別為2880和2688,而Tesla K40和Tesla K20X也分別為2880和2688。

就單精度浮點運算能力而言GTX 780Ti和GTX Titan甚至超過Tesla K40和Tesla K20X (GTX 780Ti的單精度浮點運算能力達到了5Tflops)。

但是Tesla顯卡的顯存數量超過遊戲用顯卡,Tesla K40的顯存是12G,兩倍於GTX Titan的6G。

同時Tesla顯卡的雙精度浮點運算能力大大強於普通的GTX顯卡如GTX 780, 780Ti。Tesla K40的雙精度浮點運算能力是1.43Tflops,而GTX 780Ti僅為210Gflops。nVidia宣稱GTX Titan的雙精度浮點運算能力可以達到1.5Tflops,Compute Performance And Striking A Balance 這個評測給出了不同的結果,我沒有用過GTX Titan所以不知道是否能達到官方數據。

最後,Tesla作為專用計算顯卡,包括了如ECC memory等增強穩定性的措施,使得計算結果更不容易出錯。

價格上這兩種顯卡沒有比較性,Tesla K40價格超過五千美元,而GTX Titan的價格在一千美元左右。

對於結果精度要求不高或不需要進行雙精度浮點運算的計算,遊戲顯卡是一個便宜划算的選擇。


tesla是專門用於做計算的GPU,裡面用於做運算的ALU多,但是圖形顯示功能不如普通的GPU。雖然叫做GPU,但個人認為已經跟圖形沒有關係了,完全是浮點計算卡


首先,謝邀。

不太理解你說的普通GPU具體指的是哪些,我理解你大概指的是非計算顯卡。

手頭上沒有資料,我按自己記憶來寫,可能會有偏差,見諒。

tesla卡是偏重做並行計算的,對圖形應用的支持很不好,我現在用的K20,圖形顯示用的是板載集成顯卡,基本上tesla卡已經退化到只能做計算了。

如果我沒記錯的話,K20和NV的某一款旗艦圖形顯卡(GTX TITAN?)用的都是GK110的晶元,而NV會針對不同的產品,閹割掉它們莫一方面的功能。其實GTX顯卡也能做科學運算,但是一方面發熱量巨大,另一方面最關鍵的還是他們不穩定,容易計算出錯。

關於不同顯卡的屬性參數差別,你可以去NV官網對比一下。

其實現在NV出的卡都能當計算卡來用,只是專業不專業的差別。

以上。

下面是本人對NV的殘念,可以不看!

MD,這麼快就出K40了,剛買的K20啊!!!NV你敢不敢不限制顯卡晶元的內核數量啊!!


和普通用的Nvidia Geforce系列顯卡的區別是主要定位於大規模計算,主要在工作站、伺服器上應用。

一個重要的特點是: 竟然沒有圖形輸出介面,也就是不能連顯示器!!!


NVIDIA Tesla M6 應用在什麼移動設備上?


推薦閱讀:

GPU的性能參數中的單精度浮點和雙精度浮點計算,各自對應哪些應用?
目前在機器學習領域異構計算得到重視,GPU佔據主流位置,Fpga初現端倪,不知fpga在機器學習的前景如何?
GPU編程的IO瓶頸如何解決?
CPU 和 GPU 的溫度是怎麼計算的?

TAG:NVIDIA英偉達 | 圖形處理器GPU | TeslaGPU |