Hothotレビュー
これがGeForce RTX 5090の実力だ!旧世代を圧倒するレイトレ性能を体感せよ
2025年1月23日 23:00
今回は、先日開封の様子を紹介したGeForce RTX 5090 Founders Editionのベンチマークレビューをお届けする。
従来のウルトラハイエンドGPUであるGeForce RTX 4090との比較を通して、Blackwell世代の最上位GPUがどれだけ進化したのか確かめてみよう。
Blackwell世代のウルトラハイエンド「GeForce RTX 5090」
GeForce RTX 5090は、新設計のBlackwellアーキテクチャを採用するGeForce RTX 50シリーズの最上位モデル。TSMC 4Nプロセスで製造されたGPUコア「GB202」を採用しており、21,760基のCUDAコアのほか、680基の第5世代Tensorコア、170基の第4世代RTコアなどが有効化されている。
VRAMとして28Gbps動作のGDDR7メモリを32GB搭載しており、GPUと512bitのメモリインターフェイスで接続することにより1,792GB/sのメモリ帯域幅を実現した。電力指標のTotal Graphics Power(TGP)は575Wで、バスインターフェイスはPCIe 5.0 x16。
【表1】GeForce RTX 5090の主な仕様 | ||
---|---|---|
GPU | GeForce RTX 5090 | GeForce RTX 4090 |
アーキテクチャ | Blackwell (GB202) | Ada Lovelace (AD102) |
製造プロセス | TSMC 4N | TSMC 4N |
SM | 170基 | 128基 |
CUDAコア | 21,760基 | 16,384基 |
RTコア | 170基 (第4世代) | 128基 (第3世代) |
Tensorコア | 680基 (第5世代) | 512基 (第4世代) |
テクスチャユニット | 680基 | 512基 |
ROPユニット | 176基 | 176基 |
ブーストクロック | 2,407MHz | 2,520MHz |
メモリ容量 | 32GB GDDR7 | 24GB GDDR6X |
メモリスピード | 28Gbps | 21Gbps |
メモリインターフェイス | 512bit | 384bit |
メモリ帯域幅 | 1,792GB/s | 1,008GB/s |
NVENC | 第9世代NVENC×3基 | 第8世代NVENC×2基 |
NVDEC | 第6世代NVDEC×2基 | 第5世代NVDEC×1基 |
PCI Express | PCIe 5.0 x16 | PCIe 4.0 x16 |
消費電力 (TGP) | 575W | 450W |
GeForce RTX 5090 Founders Edition
今回のテストに用いるのは、先日開封の様子を紹介したGeForce RTX 5090 Founders Editionだ。
2基の大口径ファンを備える大型GPUクーラーを搭載しており、575Wの大消費電力を支える補助電源コネクタはPCIe 16ピン(600W対応)が担っている。映像出力端子はDisplayPort 2.1b(3基)とHDMI 2.1b。
比較用GPUとテスト環境
GeForce RTX 5090の比較用には、GeForce RTX 40シリーズ最上位GPUを搭載する「GeForce RTX 4090 Founders Edition」を用意した。
【表2】各ビデオカードの動作仕様 | ||
---|---|---|
GPU | GeForce RTX 5090 | GeForce RTX 4090 |
ビデオカードベンダー | NVIDIA | NVIDIA |
製品型番 | Founders Edition | Founders Edition |
ベースクロック | 2,017MHz | 2,235MHz |
ブーストクロック | 2,407MHz | 2,520MHz |
メモリ容量 | 32GB GDDR7 | 24GB GDDR6X |
メモリスピード | 28Gbps | 21Gbps |
メモリインターフェイス | 512bit | 384bit |
メモリ帯域幅 | 1,792GB/s | 1,008GB/s |
PCI Express | PCIe 5.0 x16 | PCIe 4.0 x16 |
Power Limit | 575W | 450W |
温度リミット | 不明 | 83℃ |
Resizable BAR | 有効 | 有効 |
GPUドライバ | GRD 571.86 (32.0.15.7186) | GRD 566.36 (32.0.15.6636) |
両ビデオカードを搭載するテスト環境には、最高峰のゲーミングCPUである「Ryzen 7 9800X3D」と、AMD X870チップセットを搭載するASUSの「ROG STRIX X870-F GAMING WIFI」を用意した。そのほかの機材や条件については以下の通り。
【表3】テスト機材 | |
---|---|
CPU | Ryzen 7 9800X3D (8コア/16スレッド) |
CPUリミット設定 | PPT=162W、TDC=120A、EDC=180A、TjMax=95℃ |
CPUアンコア設定 | MCLK=UCLK=2,800MHz、FCLK=2,000MHz |
マザーボード | ASUS ROG STRIX X870-F GAMING WIFI [BIOS=1001] |
メモリ | DDR5-5600 16GB×2 (2ch、46-45-45-90、1.1V) |
システム用SSD | Samsung 970 EVO Plus (NVMe SSD/PCIe 3.0 x4) |
ゲーム用SSD | CFD CSSD-M2B2TPG3VNF 2TB (NVMe SSD/USB 10Gbps) |
CPUクーラー | ASUS TUF GAMING LC 240 ARGB (ファンスピード=100%) |
電源 | 玄人志向 KRPW-PA1200W/92+ (1,200W/80PLUS Platinum) |
ディスプレイ | 3,840×2,160ドット、60Hz |
OS | Windows 11 Pro 24H2 (build 26100.2894、VBS有効) |
電源プラン | バランス |
計測 | HWiNFO64 Pro v8.20、ラトックシステム RS-BTWATTCH2 |
室温 | 約24℃ |
ベンチマーク結果
ここからは、ベンチマークテストの結果を確認していく。今回実施したベンチマークテストは以下の通り。
- 3DMark
- ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク
- STREET FIGHTER 6 ベンチマークツール
- サイバーパンク2077
- ホグワーツ・レガシー
- フォートナイト
- オーバーウォッチ 2
- ARMORED CORE VI FIRES OF RUBICON
- エルデンリング
- Forza Horizon 5
- F1 24
- Microsoft Flight Simulator 2024
- UL Procyon
- Blender Benchmark
- Adobe Camera Raw
3DMark「Speed Way」
3DMarkのDirectX 12 Ultimateテスト「Speed Way」でGeForce RTX 5090が記録したスコアは「14,226」で、GeForce RTX 4090の「10,195」を約40%上回った。
3DMark「Steel Nomad」
3DMarkのDirectX 12テスト「Steel Nomad」では、GPU負荷の高い通常版Steel Nomadと、より軽量なSteel Nomad Lightを実行した。
高負荷テストのSteel NomadでGeForce RTX 5090が記録したスコアは「14,060」で、GeForce RTX 4090の「9,301」を約51%上回った。
負荷の軽いSteel Nomad LightでGeForce RTX 5090が記録したスコアは「53,822」で、GeForce RTX 4090の「26,193」を約24%上回った。
3DMark「Port Royal」
3DMarkのDXR(DirectX Raytracing)テスト「Port Royal」でGeForce RTX 5090が記録したスコアは「36,296」で、GeForce RTX 4090の「26,193」を約39%上回った。
3DMark「Solar Bay」
3DMarkの比較的軽量なレイトレーシングテスト「Solar Bay」でGeForce RTX 5090が記録したスコアは「209,082」で、GeForce RTX 4090の「188,370」を約11%上回った。
3DMark「Wild Life」
3DMarkのVulanテスト「Wild Life」では、通常のWild Lifeと、より高負荷なWild Life Extremeを実行した。
GPU負荷の軽い通常版はスコアが155,000前後で頭打ちとなっており、GeForce RTX 5090とGeForce RTX 4090が横並びとなっている。他方、高負荷版では「102,018」を記録したGeForce RTX 5090が、GeForce RTX 4090の「86,674」を約18%上回った。
3DMark「NVIDIA DLSS feature test」
NVIDIAから提供されたDLSS 4対応版3DMarkで、DLSS性能を計測する「NVIDIA DLSS feature test」 を実行した結果が以下の通り。なお、テストの画面解像度は4K/2160p(3,840×2,160ドット)で、DLSS超解像の設定は「Performance」となっている。
従来モデルのGeForce RTX 4090でもDLSS 4の超解像と1枚の生成フレームを挿入する「2X」は実行できており、DLSS無効時の60fps弱から3倍程度までフレームレートが向上している。
DLSS 4フル対応のGeForce RTX 5090では、新機能であるマルチフレーム生成によって生成フレームを2枚挿入する「3X」と3枚挿入する「4X」が実行可能となっており、3Xでは80.46fpsから351.57fps、4Xでは81.00fpsから435.53fpsへと大幅なフレームレート向上を達成した。
新旧GPUが対応している「2X」では、両GPUともDLSS無効時から3倍前後のフレーレートとなっているが、無効時の時点で4割ほどGeForce RTX 5090が高いフレームレートとなっているため、DLSS適用時もGeForce RTX 5090がGeForce RTX 4090を36~37%上回っている。
ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク
ファイナルファンタジーXIV: 黄金のレガシー ベンチマークでは、描画設定を「最高品質」に設定して、フルHD/1080p~4K/2160pまでの画面解像度をテストした。
GeForce RTX 5090のスコアはGeForce RTX 4090を2~28%上回った。WQHD/1440p以下ではCPUがボトルネックとなり両GPUのスコア差が縮小しているが、GPU負荷の高い4KではGPU性能の差がスコアに反映された格好だ。
STREET FIGHTER 6 ベンチマークツール
STREET FIGHTER 6 ベンチマークツールでは、グラフィックプリセットを最高の「HIGHEST」に設定して、フルHD/1080p~4K/2160pまでの画面解像度をテストした。
結果として、GeForce RTX 5090とGeForce RTX 4090は全ての条件で上限フレームレートに達しており、両GPUのパフォーマンス差は生じなかった。
サイバーパンク2077
サイバーパンク2077では、DLSS 4に先行対応したバージョンv2.2-Devを使用して、フルHD/1080p~4K/2160pまでの画面解像度でDLSSフレーム生成の設定を変更しながらベンチマークモードを実行した。なお、DLSS超解像についてはDLSS 4で導入されたTransformerモデルを使用している。
GeForce RTX 5090は、同条件でテストを実行したGeForce RTX 4090をフルHD/1080pで9~20%、WQHD/1440pで18~27%、4K/2160pでは28~32%上回った。
GeForce RTX 5090におけるDLSS 4のマルチフレーム生成による効果に注目すると、従来のフレーム生成である「2X」の効果がフレーム生成無効時比で171~183%であったのに対し、「3X」は242~261%、「4X」では306~327%となっている。実際の画質や操作性、超高フレームレートの意義など考えるべき点は少なくないが、フレームレートを増やす効果に関しては絶大だ。
ホグワーツ・レガシー
ホグワーツ・レガシーでは、DLSS 4に先行対応したテストバージョンを使用して、フルHD/1080p~4K/2160pまでの画面解像度でDLSSフレーム生成の設定を変更しながら平均フレームレートを計測したなお、フレームレートの計測はCPUボトルネックが生じにくい飼育場で実施している。
GeForce RTX 5090は、同条件でテストを実行したGeForce RTX 4090をフルHD/1080pで16~23%、WQHD/1440pで18~26%、4K/2160pでは21~31%上回った。
GeForce RTX 5090におけるDLSS 4のマルチフレーム生成による効果に注目すると、「2X」がフレーム生成無効時比で170~172%であったのに対し、「3X」は237~245%、「4X」では281~304%となっている。
フォートナイト
フォートナイトでは、グラフィックプリセット「最高」をベースに、超解像とNaniteおよびLumenを無効化したアンチエイリアス「TAA」設定と、NaniteとLumen(ハードウェアレイトレーシング)を有効化してDLSS超解像を行なう設定でフレームレートを計測した。
Nanite/Lumen無効時のGeForce RTX 5090は、GeForce RTX 4090を8~22%上回った。他方、Naniteを有効化してLumenを最高品質に設定した条件下でもGeForce RTX 4090を9~15%上回っている。
オーバーウォッチ 2
オーバーウォッチ 2では、グラフィックプリセットを最高の「エピック」に設定し、フルHD/1080p~4K/2160pまでの画面解像度で平均フレームレートを計測した。テスト時の上限フレームレートは600fps。
GeForce RTX 5090は、GeForce RTX 4090をフルHD/1080pで9%、WQHD/1440pで23%、4K/2160pで37%上回った。フルHD/1080pでの差が小さくなっているのはGPU負荷が低めであることに加え、GeForce RTX 5090が上限フレームレートの600fpsに達していることの影響が大きい。
ARMORED CORE VI FIRES OF RUBICON
ARMORED CORE VI FIRES OF RUBICONでは、グラフィックプリセットを「最高」に設定し、フルHD/1080p~4K/2160pまでの画面解像度で平均フレームレートを計測した。テスト時の上限フレームレートは120fps。
結果として、GeForce RTX 5090とGeForce RTX 4090は全ての画面解像度で上限フレームレートの120fpsに達しており、パフォーマンスの差は計測できなかった。
エルデンリング
エルデンリングでは、グラフィックプリセットを「最高」に設定し、レイトレーシングを「無効」または「最高」に設定した場合の平均フレームレートを、フルHD/1080p~4K/2160pまでの画面解像度で計測した。テスト時の上限フレームレートは60fps。
レイトレーシングを「最高」で有効にした条件において両GPUの差が生じたのは4K/2160pで、56.2fpsを記録したGeForce RTX 5090がGeForce RTX 4090を約6%上回った。他方、レイトレーシング無効時は両GPUとも上限フレームレートに達しているためパフォーマンスの差は計測されていない。
Forza Horizon 5
Forza Horizon 5では、グラフィックプリセットを最高の「エクストリーム」に設定し、フルHD/1080p~4K/2160pまでの画面解像度でベンチマークモードを実行した。
GeForce RTX 5090が記録した平均フレームレートは、GeForce RTX 4090のそれを22~23%上回った。
F1 24
F1 24では、グラフィックプリセットを最高の「超高」、DLSS超解像とフレーム生成を有効に設定し、フルHD/1080p~4K/2160pまでの画面解像度でベンチマークモードを実行した。
GeForce RTX 5090が記録した平均フレームレートは、GeForce RTX 4090のそれを24~26%上回った。
Microsoft Flight Simulator 2024
Microsoft Flight Simulator 2024では、グラフィックプリセットを「ウルトラ」、アンチエイリアスを「DLSS(DLAA)」、フレーム生成を有効に設定し、フルHD/1080p~4K/2160pまでの画面解像度で計測した。
GeForce RTX 5090は、GeForce RTX 4090をフルHD/1080pで12%、WQHD/1440pで29%、4K/2160pで48%上回った。
フルHD/1080pやWQHD/1440pでの差は4K/2160pより小さくなっているが、GeForce RTX 5090はWQHD/1440p以下においてCPUボトルネックによるものと思われるフレームレートの頭打ちが発生していることが原因だ。
UL Procyon「AI Computer Vision Benchmark」
UL Procyonの「AI Computer Vision Benchmark」では、Windows MLとTensorRTを使用した場合のパフォーマンスを計測しようと試みたが、GeForce RTX 5090はTensorRTでのテストを実行できなかった。これは、UL ProcyonのTensorRTがGeForce RTX 5090の未対応のバージョンであることが原因で、今後のアップデートでの更新が検討されているようだ。
ともあれ、Windows MLにおけるGeForce RTX 5090はGeForce RTX 4090を23%上回っている。TensorRT利用時のGeForce RTX 4090はWindows ML利用時より32%高いスコアとなっているので、GeForce RTX 5090もTensorRTが利用できればさらに高いスコアを記録できるだろう。
UL Procyon「AI Image Generation Benchmark (Stable Diffusion)」
UL Procyon「AI Image Generation Benchmark」は、画像生成AIでのパフォーマンスを計測するテスト。ここでは「Stable Diffusion 1.5 (FP16)」と「Stable Diffusion XL (FP16)」をONNX RuntimeとTensorRTで実行した。なお、GeForce RTX 5090はテスト側のTensorRTバージョンが古い影響でスコアを計測できていない。
512×512サイズの画像を生成する「Stable Diffusion 1.5 (FP16)」では、GeForce RTX 5090がONNX Runtime利用時のGeForce RTX 4090を33%上回った。なお、GeForce RTX 4090はTensorRTの利用によってONNX Runtime利用時より約36%高いスコアを記録している。
1,024×1,024サイズの画像を生成する「Stable Diffusion XL (FP16)」では、GeForce RTX 5090がONNX Runtime利用時のGeForce RTX 4090を29%上回った。こちらも、GeForce RTX 4090はTensorRTの利用によってONNX Runtime利用時より約27%高いスコアを記録している。
UL Procyon「AI Image Generation Benchmark (FLUX.1)」
今回のレビューに際してNVIDIAより提供されたのが、画像生成AI「FLUX.1」を使用して実行するUL ProcyonのAI Image Generation Benchmarkだ。テストはGeForce RTX 5090に対応したTensorRTで実行され、FP8またはFP4でのパフォーマンスを計測できる。
FP8でテストを実行した場合、GeForce RTX 5090が1枚の画像を生成するのに要した時間は6.617秒で、9.463秒を要したGeForce RTX 4090の生成速度を約43%上回った。
一方、FP4でのテストではGeForce RTX 5090が1枚当たり3.985秒で生成できたのに対し、GeForce RTX 4090は17.247秒を要した。結果として生成速度はGeForce RTX 5090が4.3倍ほど速いわけだが、これはGeForce RTX 5090が新たにFP4をサポートしたことが要因だ。
UL Procyon「AI Text Generation Benchmark」
UL Procyonの「AI Text Generation Benchmark」は、LLMを用いたテキスト生成のパフォーマンスを計測するテスト。現時点ではTensorRT非対応であるため、ONNX Runtimeでテストを実行した。
GeForce RTX 5090は、GeForce RTX 4090のスコアをPHI 3.5で約19%、MISTRAL 7Bで約29%、LLAMA 3.1で約32%、LLAMA 2で約35%上回った。
Blender Benchmark
3DCGソフト「Blender」の公式ベンチマークソフトであるBlender Benchmarkでは、3つのシーンのレンダリング速度を計測した。テストに使用したBlenderのバージョンはv4.3.0。
GeForce RTX 5090は、GeForce RTX 4090のレンダリング速度をmonsterで約33%、junkshopで約45%、classroomで約31%上回った。
システム消費電力と電力効率
ワットチェッカーを使ってシステムの消費電力を測定し、アイドル時の最小消費電力と、ベンチマーク実行中の平均消費電力および最大消費電力をグラフ化した。
アイドル時の最小消費電力はGeForce RTX 5090が90.8Wで、83.5WのGeForce RTX 4090より7W強高い数値となっている。
ベンチマークテスト実行中にGeForce RTX 5090が記録した平均消費電力は490.6~733.9Wで、380.0~576.3WだったGeForce RTX 4090より73~170Wほど高い平均消費電力となっている。
システムの平均消費電力でベンチマークスコアを割ることによって求めたワットパフォーマンスを、GeForce RTX 4090を基準に指数化したものが以下のグラフ。
平均消費電力が大きく増加していたGeForce RTX 5090だが、明確にGeForce RTX 4090のワットパフォーマンスを下回ったのはCPUボトルネックで性能を発揮しきれなかったフルHD/1080p設定のファイナルファンタジーXIVくらいで、多くのテストではGeForce RTX 4090と同程度のワットパフォーマンスを発揮し、3DMarkのSpeed WayとSteel NomadではGeForce RTX 4090を明確に上回った。
負荷テスト実行中のモニタリングデータ
モニタリングソフトのHWiNFO64 Proを使用して、3DMarkのSteel Nomad Stress Test実行中のモニタリングデータを取得した結果が以下のグラフ。
テスト中のGeForce RTX 5090は、電力リミットの575Wに張り付くほどの大電力を消費しながら動作し続けており、この時のGPU温度は平均76.2℃(最大77.9℃)、VRAM温度は平均88.5℃(最大90.0℃)、GPUクロックは平均2,501MHz(最大2,632MHz)、VRAMクロックは平均2,330MHz(最大2,334MHz)だった。
GeForce RTX 5090 Founders EditionのGPUクーラーは大型とはいえ2.1スロットサイズの薄型であり、575Wの大消費電力に伴う発熱を捌けるのか不安もあったのだが、終始リミットを一杯の電力を消費し続けている様子からサーマルスロットリングが生じていないことが確認できた。また、ファンスピードも最大1,674rpmでそこまでの騒音が生じていないことも好印象だ。
最強のゲーミング性能を実現する新世代のウルトラハイエンドGPU
Blackwell世代の最上位GeForceだけあって、GeForce RTX 5090は従来モデルを明確に上回る素晴らしいパフォーマンスを実現していた。
DLSS 4のマルチフレーム生成の有用性については実際のゲームで広く検証すべきだが、DLSS 4抜きでも最強のゲーミングGPUであることは間違いない。生成AIや3DCGレンダリングなど、ゲーム以外でのパフォーマンスもGeForce RTX 4090を凌駕しており、性能を追求するユーザーにとっては最上級の選択肢だ。
GeForce RTX 5090の国内想定価格は39万3,800円からとされている。昨今の円安も影響して一般消費者向けのPCパーツとしてはきわめて高価ではあるが、相応の価値を見出すユーザーは少なくないだろう。買い時を逃して後悔したくないのであれば、少なくとも1月30日とされる発売日までには覚悟を決めておきたいところだ。