[轉載]達芬奇 DaVinci Resolve 14多卡效率分析(i9/至強W/雙路至強 對比測試)

本文轉自 pugetsystems.com

前言

Blackmagic的DaVinci Resolve以多GPU運行效率高著稱,但在之前的測試中([轉載] 達芬奇 DaVinci Resolve 各CPU多卡效率分析(1-4x Titan Xp)),我們看到它的多卡效率並沒有傳說中那麼高。由於那次是我們第一次測試達芬奇,測試標準並不十分合理,因此在修訂了測試流程之後,決定再測一次。

首先,我們修訂了達芬奇的測試流程,以此更符合實際的工作內容。新的測試流程中不僅添加了OpenFX,而且還大大增加了測試編碼的數量。不僅加入了ProRes 4444,還添加了CinemaDNG,ARRIRAW和不同壓縮級別的RED。此外,我們不僅在「全解析度」下測試RAW素材,同時會在「半解析度」下測試,以符合更多的工作場景。

其次,NVIDIA Titan V 12GB GPU已經發布。在上一篇文章中([轉載]達芬奇 DaVinci Resolve 如何選擇顯卡),它在達芬奇中有著強大的性能表現。但是,由於這張卡實在太貴,我們還測試了性價比較高的GTX 1080 Ti。

最後,測試中包含了三種不同的CPU及其相關平台,分別是Core i9,Xeon W和Dual Xeon SP。 這樣不僅能測出不同類型CPU在達芬奇中的表現,還能看到PCI-E通道速度對性能表現的影響。

本次測試使用軟體版本為:DaVinci Resolve 14.3.0.014

如果懶得看下面的測試數據這裡給出最終結論:結論有點複雜,自己翻下去看吧。

測試平台

測試素材

我們所有的測試素材都是從公開發布的媒體上下載或轉碼的。這樣做是為了讓任何人都可以重複我們的測試,以便驗證測試結果並將自己電腦上的硬體和最新硬體做比較。

為了測試每種類型的素材,我們使用了三個不同級別的調色設置。

  • 初級調色設置是簡單的色輪調色加上4個Power Window節點(包括運動跟蹤);
  • 中級調色設置是在初級的基礎上加上3個OpenFX節點(鏡頭光暈,傾斜移位模糊和銳化);
  • 高級調色設置是在中級設置的基礎上增加一個TNR節點。

測試方法是使用「顏色」選項卡中內置的FPS計數器。播放開始後,我們等待15秒讓FPS穩定下來,然後在接下來的15秒內記錄最低的FPS數值。這種方法使我們能夠實現高度一致和可複製的測試流程。

對於我們測試的所有RAW素材(CinemaDNG,ARRIRAW和RED),我們不僅在RAW解碼質量設置為「Full Res」的情況下進行測試,同時也會在「Half Res」下進行測試。 (對於RED素材就是「Half Res Good」)

全解析度解碼可以壓榨出不同GPU之間的最大性能差異,但同時也希望通過以不同CPU和GPU組合在較低解碼解析度下運行,以體現FPS的增加。

下載鏈接:

  • City Train Station :Blackmagic Production Camera 4K Update
  • Untitled00024199:Canon C200 Raw Footage Workflow
  • Interior Office:[Direct Download]
  • A003C025(Open Gate spherical):ALEXA Sample Footage
  • A016_C001_02073O_001:Sample R3D Files
  • A004_C186_011278_001:Sample R3D Files
  • A007_C115_07181B_001:Sample R3D Files
  • S005_L001_0220LI_001:Sample R3D Files
  • S002_C074_02065Z_001:Sample R3D Files
  • B001_C096_0902AP_001:Sample R3D Files
  • S002_C074_02065Z_001:Sample R3D Files

將來我們會減少RED的素材,用XAVC-S和AVCHD來替換。但在這次測試里我們想知道不同的解析度對軟體運行性能的影響。

4K素材-實況回放FPS測試數據

4K DNxHR HQ

4K ProRes 422 HQ

4K ProRes 4444

4K RED 11:1 (Full Res.)

4K RED 11:1 (Half Res.)

4K RED 7:1 (Full Res.)

4K RED 7:1 (Half Res.)

4K CinemaDNG (Full Res.)

4K CinemaDNG (Half Res.)

4K素材-實況回放FPS分析

由於單單4K測試就包含了超過600個數據點,我們很難按照不同的編碼以此分析。

鑒於影視工作者通常只接觸幾中編碼,建議不要只看下面的平均數據,而是根據自己工作中實際處理的素材編碼看上面的詳細數據。

從最基礎的調色+Power Windows看起,其實沒什麼好說的。在這個等級下,只要1張顯卡就能不掉幀(或者幾乎不掉幀)。

只有一點值得注意,那就是雙路至強Gold 6148在ProRes 4444測試下表現不佳,導致在平均數據里不如另外兩個平台。

在添加了3個OpenFX特效後,多卡的增益就體現出來了,而且可以看到CPU對性能表現的影響不大。

單看顯卡部分,我們發現從一張GTX 1080 Ti到兩張GTX 1080 Ti的性能提升巨大,但是增加更多的同類顯卡並不能得到很明顯的提升,這個不明顯指的是只提升了2 FPS。

有一點需要注意,我們大多數測試素材都是24-25 FPS的,除了ProRes 422 HQ。這就意味著只要兩張GTX 1080 Ti或者一張Titan V就能實現全解析度回放不掉幀。但如果處理幀率更高的素材(如59.94 FPS的ProRes 4444)那就需要4張顯卡了。因此並不是達芬奇多卡效率低,而是處理的素材不需要那麼高端的硬體。

加入TNR後,全解析度回放不掉幀就變得很困難了,顯卡的性能差異開始體現出來了。當然,不同CPU仍然沒有太大的差別。

在測試結果中可以看到,兩張、三張甚至四張GTX 1080 Ti都能得到不錯的FPS提升。但是對於Titan V,三卡就能達到全解析度回放不掉幀。雖然四卡在一些情況下確實能發揮作用,但對於大多數處理4K素材的用戶來說,用不上四卡。

6K素材-實況回放FPS測試數據

6K DNxHR HQ

6K RED 12:1 (Full Res.)

6K RED 12:1 (Half Res.)

6K RED 7:1 (Full Res.)

6K RED 7:1 (Half Res.)

6K ARRIRAW (Full Res.)

6K ARRIRAW (Half Res.)

6K素材-實況回放FPS分析

6K測試涉及的編碼沒有4K那麼廣,但也有460個數據點。

鑒於影視工作者通常只接觸幾中編碼,建議不要只看下面的平均數據,而是根據自己工作中實際處理的素材編碼看上面的詳細數據。

最基礎的調色設置仍然沒什麼可分析的,一張顯卡就能全解析度不掉幀回放。但是在處理6K RED 7:1素材時,至強 W-2175有一個奇怪的性能下降。我們反覆測了多次,確認測試數據的正確性,它的確不行,我們也不知道原因。

在加了3個OpenFX特效後,多卡的性能差異開始體現出來了,但奇怪的是這個差異沒有處理4K素材時明顯,又不像是碰到CPU瓶頸了,畢竟各CPU直接差異不大。同樣,在處理6K RED 7:1素材時,至強W-2175有一個明顯的性能下降。

對於顯卡,雙GTX 1080 Ti仍然比單GTX 1080 Ti提升巨大,但是增加更多的顯卡也就這樣了。對於Titan V,只要一張就夠了。

就像4K測試的結果,雙GTX 1080 Ti或者單Titan V已經能滿足用戶需要了。但是由於所有的6K素材都沒有超過23.976 FPS,實際上處理6K素材的硬體要求反而比4K的要低。

增加TNR後,三卡開始發揮作用,但是四卡的性能表現反而不如三卡。達芬奇的「神優化」又出現了,特別是在處理全解析度ARRIRAW和RED素材的時候。

我們不知道這個現象發生的原因。剛開始我們認為是PCI-E通道速度不夠的原因。畢竟至強W用的PEX晶元並不能保證四塊顯卡都運行在X16速度上。但是雙路至強平台是提供四條X16的顯卡通道的,性能表現依然下降。也可能是CPU瓶頸,但是雙路至強的CPU性能是明顯超過W-2175的,它們的性能表現確是一致的。

8K素材-實況回放FPS測試數據

8K DNxHR HQ

8K RED 12:1 (Full Res.)

8K RED 12:1 (Half Res.)

8K RED 9:1 (Full Res.)

8K RED 9:1 (Half Res.)

8K RED 7:1 (Full Res.)

8K RED 7:1 (Half Res.)

8K素材-實況回放FPS分析

鑒於影視工作者通常只接觸幾中編碼,建議不要只看下面的平均數據,而是根據自己工作中實際處理的素材編碼看上面的詳細數據。

在最基礎的調色里,仍然沒什麼好說的,但是有一些重要的點但看平均數據是看不出來的。

在使用DNxHR HQ素材或者RED素材(特別是9:1和12:1)的時候,結果非常奇怪。我們發現各CPU的性能表現差異很大,而且使用的顯卡越多,性能反而越弱。

比如在處理8K RED 12:1的時候,i9 7960X的表現比其他兩個平台強多了。到了8K RED 9:1,雙路至強6148變成最強的了,但這只是單卡的情況。顯卡越多,雙路至強6148反而越弱,到四卡的時候就墊底了。

增加三個OpenFX特效後,測試結果仍然很奇怪,單看平均數據是看不出的。

在大多數情況下,雙GTX 1080 Ti表現優異,三卡四卡沒有意義,和前面一樣。Titan V仍然單卡足夠,多卡沒有意義。

但是,在RED 9:1和12:1全解析度回放的時候,性能下降又出現了。在8K RED 12:1,i9 7960X是最強的,雙卡比單卡提升明顯。但到了8K RED 9:1,雙路至強Gold 6148又一次發瘋了。雙卡的時候表現正常,顯卡越多性能越強。但到了三卡,性能表現大幅下降,四卡則下降得更多。

加了TNR後,結果明朗不少。但全解析度預覽RED素材的時候,三卡、四卡導致性能下降的現象仍然存在。如果使用半解析度預覽、或者不使用RAW素材,那三卡、四卡的提升還是很明顯的。

結論

1:CPU/平台間的差異非常小

如果你使用低端CPU,這個結果當然不成立。但是當你在CPU上的花費超過10000了,不同CPU間在回放上的差異確實不大。測試中確實出現了一些奇怪的現象(特別是8K素材),但總的來看,i9 7960X, Xeon W-2175, 和雙路至強Gold 6148差異並不明顯。

i9和至強W可以解釋為它們的原始性能差不多,但雙路至強總足夠強了吧,還有更多的PCI-E通道。根據測試結果來看,雙路平台最多也就強了1-2 FPS。考慮到至強平台實在是太貴,用更高級的CPU還不如加張顯卡。

當然,不同的CPU和主板支持的顯卡數量是不同的,為了插更多的顯卡,也只有上至強平台。

2:RED素材全解析度回放的表現有點奇怪

4K RED素材沒有這個現象,但是6K,特別是8K RED素材在使用全解析度回放的時候性能表現很奇怪。在很多情況下,全解析度回放時,使用顯卡數量越多,性能表現越弱。這可能由於CPU或者儲存設備的瓶頸,但是雙路至強和高端SSD(讀取3,500 MB/s)同樣沒有改善這個問題。

3:顯卡越多並不總是越強

對於只調色和使用4個Power Windows的用戶,一張GTX 1080 Ti已經足夠全解析度不掉幀回放了,多卡也沒有作用。增加OpenFX特效後,兩張GTX 1080 Ti或者一張Titan V同樣能達到性能極限。

在使用TNR後,更多顯卡才有意義。先不說那些奇怪的RED素材,三張,有些情況下甚至四張GTX 1080 Ti都能得到明顯的性能提升。對於Titan V,相比雙卡,三卡仍然能夠得到性能提升,但是四卡就沒有明顯性能提升了。

那麼我們對於高端達芬奇工作站的推薦呢?

對於大多數調色用戶,平台(Core i9, Xeon W, Xeon SP)不是考慮的重點。因此,我們推薦使用i9。首先,i9相對於至強CPU便宜不少,省下來的錢可以放在顯卡上。其次,i9更容易買到、用的人更多,相對的軟體/硬體BUG會少一點。

顯卡方面,我們推薦雙GTX 1080 Ti或者單Titan V。雙GTX 1080 Ti確實比單Titan V便宜不少,但是有安裝更困難、對散熱/電源要求高等問題。更重要的是,並不是所有軟體對雙卡的優化都那麼好。強如達芬奇的多卡優化,在處理RED素材時多卡仍然有問題。

對於不差錢、追求性能頂峰的達芬奇用戶,可能會選擇雙或者三 Titan V。雖然兩張Titan V只比四張GTX 1080 Ti快了一點點,並且一張Titan V就能買四張GTX 1080 Ti,但是只用兩張顯卡的話能夠用更小的機箱,散熱供電壓力也沒那麼大,也能用i9。更關鍵的是,多餘的PCI-E通道可以給Blackmagic Decklink或者RAID卡留下空間。

更多文章請瀏覽文章目錄

相關閱讀:

[轉載]達芬奇 DaVinci Resolve 如何選擇顯卡

[轉載] 達芬奇 DaVinci Resolve 如何選擇CPU(新i7/i9/線程撕裂者Threadripper對比測試)


推薦閱讀:

TAG:電腦DIY | 顯卡 | 影視製作 |