[2021.06.27][Amatsukaze&コマンドライン] 在庫復活してきたね!RTX3070 vs RTX2060 エンコードフレーム&時間の比較メモ

Amatsukaze

RTX3070 vs RTX2060 エンコード速度比較の回

■ 環境

・SD ドライバー


・GPU SPEC


・NVEnc5.34をDL

旧PC[CPU:i7-6700無印 RAM:DDR3-24GB HDD5400rpm]

メモ:アニメTSソース、CPUデコード
・AmatsukazeにはEDCB録画のTSをTrim指定したソースを。
・コマンドラインにはTMSR6でカットしたTSをソースに使います。
・メモリ+1000Mhz

■ Amatsukaze + RTX2060(第6世代)

[ロゴ消し無し、CMカットのみ]
(CUDAコアを使い切るためにvpp大目に盛ってるので、画質の参考にしないでね^^;)


・Amatsukazeエンコード中(RTX2060 CUDAコア負荷上げてます 108fpsくらい出てます)


・Amatsukazeエンコード終了(RTX2060 CUDAコア負荷上げてます 108fpsくらいのまま完了。エンコード時間は8分22秒)

■ コマンドライン + RTX2060(第6世代)

・1920のCUDAコアを使い切っている場合(キャッシュに乗っている場合)
約234fpsですが、もっとCUDA負荷をかけるとさらに遅くなります。
並列化する場合はCUDAコアの使用率も参考にして頭打ちにならないようにするといいかもね。
この設定でもVEが65%なので同じ負荷のエンコードを2本動かすと速度は落ちそうだなぁと予想はできますね。


・hevcで1440×1080→1920×1080へサイズ変更のみ(約415fps)

24fps動画なので5フレームに1フレーム間引いているのでちょっといい数字が出ているような気はしますが…
想像以上のポテンシャルだったりするのがRTX20X0GPUですなぁ。
VEClock(VE:ビデオエンジン?エンコーダー?)が1840MHzなので、OCの10%UPが利いている感じで手持ちのRTX3070より1割ほど早いです。(たぶん)

NVEncCではVEのクロックが拾えているようなので、スペック表に載せてくれればいいのにと思うのですが記載は見かけませんね
(^◇^;
TuringとAmpereではTuringの方がOC耐性はありそう?RTX2060がスカスカで余裕あるだけかも
‘`,、’`,、(ノ∀`)’`,、’`,、
vpp系のフィルタやAmatsukazeのCUDAなどの使用頻度が低い&負荷が低いならRTX2060もまだまだ現役ですね!
(さすがにまだまだ現役!最高!というには苦しくなってきたけど)
上記を踏まえて新PCでテストしていきましょ。

新PC[CPU:i7-11700F、 RAM:DDR4-32GB HDD5400rpm]

RTX2060を新PCへ挿してテストです。
これが基本というか元になるのでちょっと画像を大きめに。

■ Amatsukaze + RTX2060(第11世代)

[ロゴ消し無し、CMカットのみ]
・解析処理、PCの中の小人さんが一生懸命働いてました。感謝感謝です。


・RTX2060エンコード中。CUDA使い切る感じ。


・RTX2060エンコード時間は7分5秒


CUDAコア数が頭打ちでクリティカルパスになっているので、解析時間で新CPUのパワーは見せれても、エンコードではあまり大差がない(´・ω・`)
8分22秒→7分5秒と1分以上エンコード時間が短縮されているので、Amatsukazeを使う場合はHWエンコードでも i7-6700 → i7-11700Fのアップグレードはエンコードに効果があります!
ちょっと前に、コマンドラインならまだまだいけると書いたような記憶がありますが気にしなーい
‘`,、’`,、(ノ∀`)’`,、’`,、

■ コマンドライン + RTX2060(第11世代)

と、現実逃避もいけないので、一応エンコードやっときます。
全体的に低い@@;
・1920のCUDAコアを使い切っている場合(約211fps)
少し低い。誤差かな?(キャッシュに乗ってない場合ですが)


・hevcで1440×1080→1920×1080へサイズ変更のみ(約411fps) やっぱり低い?

今のところ原因不明ですが、少し低い感じ。PCHやPCIExpressの省電力はオフになっているけれども。

新PC[CPU:i7-11700F、 RAM:DDR4-32GB HDD5400rpm]

RTX2060→RTX3070へ差し替えてテストです。

■ Amatsukaze + RTX3070(第11世代)

[ロゴ消し無し、CMカットのみ]
5分1秒!! 文句なしのエンコード速度が出てますね!


CUDAコアが多いGPUを選びましょう

■ コマンドライン + RTX3070(第11世代)

・負荷をかけてもCUDAコアに余裕がある場合(約317fps)

・hevcで1440×1080→1920×1080へサイズ変更のみ(約379fps)


軽い場合は、RTX2060 OCよりも低い結果になった。VEClockかなり大事ですね。
il||li _| ̄|● il||li

VEClockが高いGPUを選びましょう
調べ様がないけど・・・運がいいとどこかで載せてくれているかも。
゛(ノ><)ノ ヒィ

同じメディアエンコーダー(NVEnc)第7世代の比較のまとめ

・世代はこちらで確認を↓

Video Encode and Decode GPU Support Matrix
Find the related video encoding and decoding support for all NVIDIA GPU products.

エンコード内容に合わせてVEClockが高くてCUDAコアが多いGPUを選びましょう!

RTX3070でもAmatsukazeで複数並列エンコード時には解析とエンコードで使うCUDAが足りない(100%になる)場合が結構あるのでそれなりにエンコードフレームレート(速度)が落ちます(^◇^;

1本ずつエンコードするよりは高速ですが2本並列で2倍の速度が出るわけではありません。
RTX2060がほぼ順次2本エンコードもも2本並列エンコードも差が出なかった設定でもかなり速くはなっていますが・・・
インタレ解除やフィルタ次第ですが、思たように速度が出ない場合の参考にどうぞ。