画像は実際の製品と異なる場合があります。

AMD Instinct 最大8基搭載

VCAE-4U24LA003-GA

2 基

32 枚

8 基

24 ベイ

冗長電源

1GbE

主な仕様

AMD EPYC™ 7003 シリーズ・プロセッサー 2基搭載 ( Milan / Socket SP3 )
DDR4-3200 メモリ 32スロット
2スロット PCIe GPU 最大8基搭載可能
NVIDIA H100 PCIe 搭載可能
NVIDIA L40S/L40 搭載可能
AMD Instinct™ アクセラレーター搭載可能
2.5 インチホットスワップ 24ベイ
M.2 SSD 最大2枚搭載可能
1 ギガビットイーサネット 2ポート標準搭載
4U ラックマウントサーバー
リダンダント電源搭載

製品特長

4UラックマウントシャーシにAMD Instinct シリーズを最大8基搭載する超高密度GPGPUモデルです。

本製品は、特にパターン認識や画像認識を必要とするディープラーニングや、あらゆるHPC分野の計算やシミュレーションに高い生産性を実現するハイスケーラブルなGPGPUモデルです。

AMD EPYC™ 7003 シリーズ・プロセッサー搭載

「AMD EPYC プロセッサー」はデータセンター向けプロセッサーとして第1世代である「EPYC 7001 シリーズ」が2017年にリリースされました。第1世代 EPYCでは複数のダイを単一のパッケージに統合したマルチダイ化によりコストを抑え、性能向上のためのアプローチとしてMCM（Multi Chip Module：マルチ・チップ・モジュール）構成を採用、「Infinity Fabric」と呼ばれるインターコネクト技術により4つのダイが接続されています。
これにより第1世代 EPYCでは8個のZEN CPUコアを搭載したダイを4個使うことで最大32コアのCPUを実現しています。

2019年にリリースされた第2世代 EPYC プロセッサー「EPYC 7002 シリーズ」は、第1世代 EPYCのMCM構成を継承。8個のZEN2 CPUコアを搭載したダイを最大8個搭載し、新たにPCI Express Gen4のコントローラ、8チャネルのメモリコントローラなどを一つに集約したI/Oダイを接続。8コア×8ダイで最大64個のCPUコアを単一のCPUパッケージに搭載しています。

第3世代であるEPYC 7003シリーズ（Milan）はアーキテクチャを「Zen3」に刷新、メモリチャネルがこれまでの4，8チャネルに加え、6チャネルの動作もサポート。32MBのL3キャッシュを8コアで共有することでレイテンシが大幅に軽減するよう変更され、IPCは前世代との比較で最大19%向上しています。また、セキュリティ機能も拡張され安全性も強化されています。
プラットフォームは第2世代とソケット互換のため、既存システムのファームウェアをアップデートすることで第3世代にアップグレードすることが可能となっています。

世代別比較
	第3世代 EPYC 7003	第2世代 EPYC 7002	第1世代 EPYC 7001
リリース年	2021年	2019年	2017年
コードネーム	Milan	Rome	Naples
アーキテクチャ	Zen3	Zen2	Zen
製造プロセスルール	7nm	7nm	14nm
最大CPUコア	64	64	32
CPUソケット	SP3	SP3	SP3
Infinity Fabric	18GT/秒	18GT/秒	10.7GT/秒
ソケット数	1 / 2	1 / 2	1 / 2
メモリ	DDR4-3200	DDR4-3200	DDR4-2666
メモリチャネル	8	8	8
最大メモリ	4TB	4TB	2TB
PCI Express	Gen4 128レーン	Gen4 128レーン	Gen3 128レーン

8コアから64コアまでの幅広いラインナップ

AMD 第3世代 EPYC プロセッサーは1ソケットで最大64コアのメニーコアをもち、優れた価格性能比を実現します。パフォーマンスと消費電力のバランスが良くコストパフォーマンスに優れるBalanced & Optimizedのほか、コアあたりのシングルスレッド性能を重視したCore Performance、メニーコアでのマルチスレッド性能を重視したCore Densityの3つのセグメントからニーズに合わせた幅広い選択が可能です。

進化した「ZEN3」アーキテクチャ

第3世代 EPYCは前世代より製造プロセス、最大コア数などに大きな変化はないものの、新しいアーキテクチャ「ZEN3」に刷新されており、第2世代 EPYCに採用されていた「Zen2」と比較すると、IPC（Instruction Per Clock-cycle）が最大19％ほど改善されています。
アーキテクチャが新しくなったことにより、8つのCPUコアが32MBのL3キャッシュを共有し1コアあたりが使えるL3キャッシュが増加しているほか、6チャンネルのメモリチャネルをサポート。これによりメモリ構成が柔軟に選択でき、導入におけるコスト削減に貢献しています。

このほか、セキュリティ面も強化されており「AMD Infinity Guard」と呼ばれるセキュリティ機能を搭載、新たに「SEV-SNP」「Shadow Stack」機能が追加され仮想マシン環境の安全性を引き上げています。

AMD EPYC™ 7003 シリーズ・プロセッサー一覧

CPU	コア/スレッド	基本周波数	最大周波数	最大ソケット数	メモリ	L3 キャッシュ	TDP
EPYC 7773X	64C/128TH	2.2GHz	3.5GHz	2S	DDR4-3200MHz	768MB	280W
EPYC 7763	64C/128TH	2.45GHz	3.5GHz	2S	DDR4-3200MHz	256MB	280W
EPYC 7713P	64C/128TH	2.GHz	3.675GHz	1S	DDR4-3200MHz	256MB	225W
EPYC 7713	64C/128TH	2.GHz	3.675GHz	2S	DDR4-3200MHz	256MB	225W
EPYC 7663	56C/112TH	2.GHz	3.5GHz	2S	DDR4-3200MHz	256MB	240W
EPYC 7643	48C/96TH	2.3GHz	3.6GHz	2S	DDR4-3200MHz	256MB	225W
EPYC 7573X	32C/64TH	2.8GHz	3.6GHz	2S	DDR4-3200MHz	768MB	280W
EPYC 75F3	32C/64TH	2.95GHz	4.0GHz	2S	DDR4-3200MHz	256MB	280W
EPYC 7543P	32C/64TH	2.8GHz	3.7GHz	1S	DDR4-3200MHz	256MB	225W
EPYC 7543	32C/64TH	2.8GHz	3.7GHz	2S	DDR4-3200MHz	256MB	225W
EPYC 7513	32C/64TH	2.6GHz	3.65GHz	2S	DDR4-3200MHz	128MB	200W
EPYC 7473X	24C/48TH	2.8GHz	3.7GHz	2S	DDR4-3200MHz	768MB	240W
EPYC 7453	28C/56TH	2.75GHz	3.45GHz	2S	DDR4-3200MHz	64MB	225W
EPYC 74F3	24C/48TH	3.2GHz	4.0GHz	2S	DDR4-3200MHz	256MB	240W
EPYC 7443P	24C/48TH	2.85GHz	4.0GHz	1S	DDR4-3200MHz	128MB	200W
EPYC 7443	24C/48TH	2.85GHz	4.0GHz	2S	DDR4-3200MHz	128MB	200W
EPYC 7413	24C/48TH	2.65GHz	3.6GHz	2S	DDR4-3200MHz	128MB	180W
EPYC 7373X	16C/32TH	3.05GHz	3.8GHz	2S	DDR4-3200MHz	768MB	240W
EPYC 73F3	16C/32TH	3.5GHz	4.0GHz	2S	DDR4-3200MHz	256MB	240W
EPYC 7343	16C/32TH	3.2GHz	3.9GHz	2S	DDR4-3200MHz	128MB	190W
EPYC 7313P	16C/32TH	3.0GHz	3.7GHz	1S	DDR4-3200MHz	128MB	155W
EPYC 7313	16C/32TH	3.0GHz	3.7GHz	2S	DDR4-3200MHz	128MB	155W
EPYC 72F3	8C/16TH	3.7GHz	4.1GHz	2S	DDR4-3200MHz	256MB	180W

NVIDIA H100 PCIe 仕様
	NVIDIA H100 PCIe
FP64(TFLOPS)	26
FP64 Tensor コア(TFLOPS)	51
FP32(TFLOPS)	51
TF32 Tensor コア(TFLOPS)	756
BFLOAT16 Tensorコア(TFLOPS)	1,513
FP16 Tensorコア(TFLOPS)	1,513
FP8 Tensorコア(TFLOPS)	3,026
INT8 Tensorコア(TOPS)	3,026
GPUメモリ	80GB HBM3
GPUメモリー帯域幅	2TB/s
デコーダー	7 NVDEC 7 JPEG
最大消費電力	300-350W
マルチインスタンスGPU	最大7GPU MIG@10GB
フォームファクター	PCIe 2スロット
相互接続	NVIDIA NVLink 600 GB/s PCIe Gen5 128 GB/s
NVIDIA AI Enterprise	含む
排熱機構	パッシブ（冷却ファンなし）

NVIDIA Hopper™ アーキテクチャ

最新の TSMC 4N プロセスを利用し、800 億個以上のトランジスタで作られた Hopper は、NVIDIA H100 Tensor コア GPU の中核をなす 5 つの画期的なイノベーションを持ち、それにより世界最大の言語生成モデルである NVIDIA の Megatron 530B チャットボットの AI 推論で、前世代と比較して 30 倍という驚異的なスピードアップを実現します。

NVIDIA Hopper™ アーキテクチャのイノベーション

Transformer Engine

NVIDIA Hopper™ アーキテクチャは、AI モデルのトレーニングを高速化するように設計された Transformer Engine との組み合わせで Tensor コアテクノロジを前進させます。Hopper Tensor コアでは FP8 と FP16 の精度を混在させることができます。トランスフォーマーの AI 計算が劇的に速くなります。Hopper はまた、TF32、FP64、FP16、INT8 の精度の浮動小数点演算 (FLOPS) を前世代の 3 倍にします。Transformer Engine と第 4 世代 NVIDIA® NVLink® と組み合わせることで Hopper Tensor コアは HPC と AI のワークロードを桁違いに高速化します。

NVLink Switch システム

ビジネスの最先端では、エクサスケール HPC と兆パラメーター AI モデルを大規模にスケールするために、サーバークラスター内の各 GPU 間に高速でシームレスな通信が必要です。第 4 世代 NVLink は、スケールアップ相互接続です。新しい外部 NVLink Switch と組み合わせると、NVLink Switch システムは、PCIe Gen5 の 7 倍以上の帯域幅である、GPU あたり 900 ギガバイト/秒 (GB/s) の双方向で複数のサーバーにわたるマルチ GPU IO (入出力) を拡張することが可能になりました。NVLink Switch システムは、最大 256 基の H100 を接続したクラスターをサポートし、Ampere で InfiniBand HDRの 9 倍高い帯域幅を実現します。

さらに、NVLink は、これまで InfiniBand でしか利用できなかった SHARP と呼ばれる In-network Computing をサポートし、57.6 テラバイト/秒 (TB/s) の All-to-All の帯域幅を実現しながら、FP8 スパース AI コンピューティングで 1 exaFLOPS という驚くべき性能を提供することができるようになりました。

NVIDIA コンフィデンシャルコンピューティング

データはストレージに保存されているときと、ネットワーク間を転送されるときは暗号化されますが、処理中は保護が解除されます。この保護のない時間に対処するのが NVIDIA コンフィデンシャルコンピューティングです。使用中のデータとアプリケーションを保護します。NVIDIA Hopper™ アーキテクチャは、コンフィデンシャルコンピューティング機能を持った世界初のアクセラレーテッドコンピューティングプラットフォームを導入するものです。

ハードウェアベースの強力なセキュリティを持ち、ユーザーはオンプレミス、クラウド、エッジでアプリケーションを実行できます。許可のないエンティティは使用中のアプリケーションコードやデータを表示することも、変更することもできません。データとアプリケーションの機密性と完全性が守られ、AI トレーニング、AI 推論、HPC ワークロードのかつてない高速化を利用できます。

第 2 世代 MIG

マルチインスタンス GPU (MIG) という機能では GPU を、完全に分離された複数の小さなインスタンスに分割できます。それぞれにメモリ、キャッシュ、コンピューティングコアが与えられます。Hopper アーキテクチャは MIG の機能をさらに強化するものです。最大 7 個の GPU インスタンスで仮想環境のマルチテナント/マルチユーザー構成をサポートします。コンフィデンシャルコンピューティングによってハードウェアおよびハイパーバイザーレベルで各インスタンスが分離されるため、安全です。MIG インスタンスごとに専用のビデオデコーダーが与えられ、共有インフラストラクチャで安定したハイスループットのインテリジェントビデオ解析 (IVA) が実現します。そして、Hopper の同時実行 MIG プロファイリングを利用すると、管理者はユーザーのために正しいサイズの GPU 高速化を監視し、リソース割り当てを最適化できます。

研究者のワークロードが比較的少ない場合、完全な CSP インスタンスを借りる代わりに、MIG を利用して GPU の一部を安全に分離することを選択できます。保存中、移動中、処理中のデータが安全なため、安心です。

DPX 命令

動的プログラミングは、複雑な再帰的問題を単純な小問題に分割して解決するアルゴリズム手法です。小問題の結果を格納しておけば、後で再計算する必要がありません。幾何級数的問題の解決にかかる時間が短縮され、その複雑性が緩和されます。動的プログラミングは幅広い使用例で一般的に使用されています。

たとえば、Floyd-Warshall は、出荷車両と配送車両のための最短経路を地図に表示する経路最適化アルゴリズムです。Smith-Waterman アルゴリズムは DNA 配列とタンパク質フォールディングの応用に使用されます。 Hopper の DPX 命令は、従来のデュアルソケット CPU のみのサーバーと比較して 40 倍、NVIDIA Ampere アーキテクチャ GPU と比較して 7 倍の速さで、動的プログラミングアルゴリズムを加速します。これにより、病気の診断、ルーティングの最適化、さらにはグラフ分析を飛躍的に高速化します。

NVIDIA Ada Lovelace 仕様
	NVIDIA L40S	NVIDIA L40 販売終了	NVIDIA L4
GPUメモリ	48GB GDDR6 ECC付き	48GB GDDR6 ECC付き	24GB GDDR6 ECC付き
メモリー帯域幅	864GB/s	864GB/s	300GB/s
インターコネクトインタフェース	PCIe Gen4x16: 64GB/s 双方向	PCIe Gen4x16: 64GB/s 双方向	PCIe Gen4x16: 64GB/s
CUDA コア数	18,176	18,176	7,424
NVIDIA 第3世代 RT コア	142	142	58
NVIDIA 第4世代 Tensor コア	568	568	232
RT コア性能 TFLOPS	212	209	–
FP32 TFLOPS	91.6	90.5	30.3
TF32 Tensor コア TFLOPS	183 \| 366	90.5 \| 181	120
BFLOAT16 Tensor コア TFLOPS	362.05 \| 733	181.05 \| 362.1	242
FP16 Tensor コア	362.05 \| 733	181.05 \| 362.1	242
FP8 Tensor コア	733 \| 1466	362 \| 724	485
ピーク INT8 Tensor TOPS	733 \| 1466	362 \| 724	485
ピーク INT4 Tensor TOPS	733 \| 1466	724 \| 1448	–
最大消費電力	350W	300W	72W
フォームファクター	4.4” (H) x 10.5” (L) 2スロット	4.4” (H) x 10.5” (L) 2スロット	ロープロファイル 1スロット
排熱機構	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）
ディスプレイポート	4 x DisplayPort 1.4a	4 x DisplayPort 1.4a	N/A
マルチインスタンスGPU	N/A	N/A	N/A
NVLink	N/A	N/A	N/A

NVIDIA Ada Lovelace アーキテクチャ

Ada GPU アーキテクチャは、レイトレーシングと AI ベースのニューラルグラフィックスに革新的な性能を実現できるように設計されています。GPU 性能のベースラインが劇的に上がり、レイトレーシングとニューラルグラフィックスの転換点となります。

CUDA® コア

Transformer Engine

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット数学機能 (BF16) をサポート。

第 3 世代 RT コア

スループットとコンカレントレイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品の設計/アーキテクチャ、エンジニアリング、建設のワークフローのレンダリングが高速化します。ハードウェアでモーションブラーを高速化し、驚異的なリアルタイムアニメーションを実現する実物のようなデザインをご覧ください。

第 4 世代 Tensor コア

構造的なスパース性と最適化された TF32 形式のハードウェアサポートにより、すぐにパフォーマンスが向上し、AI とデータサイエンスのモデルトレーニングが高速化します。DLSS を含む AI により強化されたグラフィックス機能を加速させ、選ばれたアプリケーションで優れたパフォーマンスで高解像度を実現します。

48GB の GPU メモリ

48GB の超高速 GDDR6 メモリで、データサイエンス、シミュレーション、3D モデリング、レンダリングなどの、メモリ負荷の高いアプリケーションやワークロードに対応します。vGPU ソフトウェアを使用して複数のユーザーにメモリを割り当て、クリエイティブチーム、データサイエンスチーム、デザインチーム間で大規模なワークロードを分散します。

仮想化対応

NVIDIA 仮想 GPU (vGPU) ソフトウェアを活用した次世代の改善により、リモートユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。

PCI Express Gen 4

PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。

データセンターの効率性とセキュリティ

NVIDIA L40 は、24 時間 365 日稼動のエンタープライズデータセンター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、広範囲にテスト、サポートされています。受動冷却、フルハイトフルレングス (FHFL)、デュアルスロットデザイン、最大 300W のボード電力などの特徴を備え、主要な OEM ベンダーのさまざまな筐体構成に収まります。最新のデータセンター標準を満たし、NEBS レベル 3 に対応し、Root of Trust 技術によるセキュアブートを備え、データセンターにさらなるセキュリティ層を提供します。

NVIDIA Ampere 仕様
	NVIDIA A100 PCIe 販売終了	NVIDIA A40 販売終了	NVIDIA A30 販売終了	NVIDIA A16	NVIDIA A10	NVIDIA A2
GPUメモリ	80GB HBM2e	48GB GDDR6	24GB HBM2	4x 16GB GDDR6	24GB GDDR6	16GB GDDR6
メモリー帯域幅	1,935GB/s	696GB/s	933GB/s	200GB/s	600GB/s	200GB/s
最大消費電力	300W	300W	165W	250W	150W	40W-60W（初期設定60W）
マルチインスタンスGPU	最大7GPU	N/A	4GPU 6GB 2GPU 12GB 1GPU 24GB	N/A	N/A	N/A
フォームファクター	PCIe 2スロット	2スロット FHFL	2スロット FHFL	2スロット FHFL	1スロット FHFL	1スロット LP
NVLink	NVIDIA NVLink 600 GB/s PCIe Gen4 64 GB/s	2 ウェイロープロファイル (2 スロット)	NVIDIA NVLink 200 GB/s PCIe Gen4 64 GB/s	N/A	N/A	N/A
排熱機構	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）	パッシブ（冷却ファンなし）
FP64(TFLOPS)	9.7	0.58464	5.2	4x 0.00702	–	0.11702
FP64 Tensorコア(TFLOPS)	19.5	–	10.3	–	–	–
Tensor Float 32(TFLOPS)	156 / 312	74.8 / 149.6	82 / 165	4×9 / 4x 18	62.5 / 125	9 / 18
BFLOAT16 Tensorコア(TFLOPS)	312 / 624	149.7 / 299.4	165 / 330	4x 17.9 / 4x 35.9	125 / 250	18 / 36
FP16 Tensorコア(TFLOPS)	312 / 624	149.7 / 299.4	165 / 330	4x 17.9 / 4x 35.9	125 / 250	18 / 36
INT8 Tensorコア(TOPS)	624 / 1248	299.3 / 598.6	330 / 661	4×35.9 / 4x 71.8	250 / 500	36 / 72
実アプリ性能	90%	–	–	–	–	–

NVIDIA Ampere アーキテクチャ

NVIDIA A100 Tensorコア GPUはあらゆる規模で前例のない高速化を実現し、世界最高のパフォーマンスを誇るエラスティックデータセンターにAI、データ分析、HPCのためのパワーを与えます。NVIDIA Ampereアーキテクチャで設計されたNVIDIA A100は、NVIDIA データセンタープラットフォームのエンジンです。A100は、前世代と比較して最大20倍のパフォーマンスを発揮し、7つのGPUインスタンスに分割して、変化する需要に合わせて動的に調整できます。40GBと80GB のメモリバージョンで利用可能なA100 80GBは、毎秒2テラバイト (TB/秒)超えの世界最速メモリ帯域幅を実現し、最大級のモデルやデータセットを解決します。

NVIDIA Ampere アーキテクチャのイノベーション

第3世代 Tensorコア

NVIDIA Volta™ アーキテクチャで最初に導入されたNVIDIA Tensorコアテクノロジは、AIに劇的な高速化をもたらしました。トレーニング時間を数週間から数時間に短縮し、推論を大幅に加速します。NVIDIA Ampereアーキテクチャはこのイノベーションを基盤としており、新しい精度である Tensor Float 32 (TF32) と64ビット浮動小数点 (FP64) を導入することで、AI の導入を加速して簡素化し、Tensor コアのパワーを HPC にもたらします。

TF32はFP32と同じように動作しますが、コードを変更しなくても、AIを最大20倍スピードアップします。 NVIDIA Automatic Mixed Precisionを使用すると、研究者はわずか数行のコードを追加するだけで、自動混合精度とFP16でさらに2倍のパフォーマンスを得られます。また、bfloat16、INT8、INT4に対応しているので、NVIDIA Ampere アーキテクチャのTensorコア GPUのTensorコアは、AIのトレーニングと推論の両方に対する、非常に汎用性の高いアクセラレータです。また、TensorコアのパワーをHPCにもたらすA100およびA30 GPUでは、完全なIEEE準拠のFP64精度での行列演算を実行できます。

Multi-Instance GPU (MIG)

あらゆるAIとHPC アプリケーションがアクセラレーションの恩恵を受けることができますが、すべてのアプリケーションがGPUのフルパフォーマンスを必要とするわけではありません。Multi-Instance GPU (MIG) は、 A100とA30 GPU PU でサポートされている機能であり、ワークロードがGPUを共有することを可能にします。MIGを利用すると、各GPUを複数のGPUインスタンスに分割できます。各インスタンスは完全に分離され、ハードウェアレベルで保護され、専用の高帯域幅メモリ、キャッシュ、コンピューティングコアを与えられます。これにより開発者は、大小を問わずあらゆるアプリケーションに対して画期的な高速化を利用できるようになり、サービス品質も保証されます。また、IT管理者は、適切なサイズのGPUアクセラレーションを提供することで利用率を最適化し、ベアメタル環境と仮想化環境の両方ですべてのユーザーとアプリケーションにアクセスを拡張できます。

第3世代の NVLink

アプリケーションをマルチGPUでスケールさせるには、非常に高速にデータを移動させる必要があります。NVIDIA Ampere アーキテクチャの第3世代 NVIDIA® NVLink® は、GPU 間の直接帯域幅を2倍の毎秒600ギガバイト (GB/s) にします。これは、PCIe Gen4の約10倍です。最新世代の NVIDIA NVSwitch™と組み合わせることで、サーバー内のすべてのGPUが完全なNVLinkの速度で相互に通信し、驚くほど高速なデータ転送が可能になります。 NVIDIA DGX™A100と他の主要なコンピューターメーカーのサーバーは、 NVIDIA HGX™ A100ベースボードを介してNVLinkとNVSwitchのテクノロジを活用し、HPCおよびAIのワークロードに優れたスケーラビリティを提供します。

スパース構造

現代のAIネットワークは大きく、数百万、場合によっては数十億のパラメーターを持ち、ますますその規模は拡大しています。これらのパラメーターのすべてが正確な予測や推論に必要なわけではなく、一部のパラメーターをゼロに変換することで、精度を下げることなくモデルを「スパース」にできます。Tensorコアでは、スパースなモデルのパフォーマンスを最大2倍にできます。スパース機能はAI推論で特に効果を発揮しますが、モデルトレーニングのパフォーマンス向上にも利用できます。

第2世代 RTコア

NVIDIA A40のNVIDIA Ampereアーキテクチャの第2世代RTコアは、映画コンテンツのフォトリアルなレンダリング、建築デザインの評価、製品デザインのバーチャル試作品などのワークロードを大幅にスピードアップします。RTコアはまた、レイトレーシングされたモーションブラーのレンダリングをスピードアップし、短時間で結果が得られ、ビジュアルの精度が上がります。さらに、レイトレーシングをシェーディング機能またはノイズ除去機能と共に同時に実行できます。

よりスマートで高速なメモリ

A100は、データセンターでの膨大な量のコンピューティングを可能にします。コンピューティングエンジンを常に完全に活用するために、A100はこのクラスで最大となる毎秒2テラバイト (TB/s) のメモリ帯域幅を備えています。前世代の2倍以上です。さらに、A100は前世代の7倍となる40メガバイト (MB) のレベル2キャッシュを含む、より大きなオンチップメモリを搭載しており、コンピューティングパフォーマンスを最大限まで引き上げます。

NVIDIA RTX ada世代仕様
	NVIDIA RTX 6000 Ada	NVIDIA RTX 5000 Ada	NVIDIA RTX 4500 Ada	NVIDIA RTX 4000 Ada	NVIDIA RTX 4000 SFF Ada	NVIDIA RTX 2000 Ada
GPUメモリ	48GB GDDR6	32GB GDDR6	24GB GDDR6	20GB GDDR6	20GB GDDR6	16GB GDDR6
メモリー帯域幅	960GB/s	576GB/s	432GB/s	360GB/s	280GB/s	224GB/s
ECC	Yes	Yes	Yes	Yes	Yes	Yes
CUDAコア	18,176	12,800	7,680	6,144	6,144	2816
Tensorコア	568	400	240	192	192	88
RTコア	142	100	60	48	48	22
単精度性能(TFLOPS)	91.1	65.3	39.6	26.7	19.2	12.0
RTコア性能(TFLOPS)	210.6	151.0	91.6	61.8	44.3	27.7
Tensor性能(TFLOPS)	1,457.0	1,044.4	634.0	327.6	306.8	191.9
NVLink	N / A	N / A	N / A	N / A	N / A	N / A
NVLink帯域幅	N / A	N / A	N / A	N / A	N / A	N / A
システムインターフェイス	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x8
最大消費電力	300W	250W	210W	130W	70W	70W
排熱機構	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ
フォームファクター	4.4″ H x 10.5″ L 2スロット	4.4″ H x 10.5″ L 2スロット	4.4″ H x 10.5″ L 2スロット	4.4″ H x 9.5″ L 1スロット	2.7″ H x 6.6″ L 2スロット	2.7″ H x 6.6″ L 2スロット
画面出力	DisplayPort 1.4a x4	DisplayPort 1.4a x4	DisplayPort 1.4a x4	DisplayPort 1.4a x4	Mini DisplayPort 1.4a x4	Mini DisplayPort 1.4a x4

NVIDIA Ada Lovelace アーキテクチャ

NVIDIA RTX™ Ada 世代は、現代のプロフェッショナルワークフローの課題に対応する特徴、機能、パフォーマンスを提供します。NVIDIA Ada Lovelace アーキテクチャで構築された RTX 6000 は、第 3 世代の RT コア、第 4 世代の Tensor コア、次世代 CUDA® コアを 48GB のグラフィックスメモリを組み合わせ、かつてないレンダリング、AI グラフィックス、コンピューティングパフォーマンスを実現します。NVIDIA RTX 6000 搭載ワークステーションは、今日の非常に困難なビジネス環境で成功するために必要なものを提供します。

中心となるテクノロジ

NVIDIA CUDA コア

単精度浮動小数点 (FP32) 演算の倍速処理により、デスクトップにおける複雑な 3D のコンピューター支援設計 (CAD) とコンピューター支援エンジニアリング (CAE) などのグラフィックスやシミュレーションのワークフローに適した驚異的なパフォーマンス向上を実現します。

第 3 世代 RT コア

前世代と比較して最大 2 倍のスループットを備えた第 3 世代 RT コアにより、動画コンテンツのフォトリアルなレンダリング、建築デザインの評価、製品デザインの仮想プロトタイプなどのワークロードのための圧倒的な高速化を実現します。このテクノロジにより、レイトレーシングによるモーションブラーレンダリングをより高いビジュアル精度で高速化することができます。

第 4 世代 Tensor コア

第 4 世代の Tensor コアは、より高速な AI コンピューティングパフォーマンスを提供し、前世代の 2 倍以上のパフォーマンスを実現します。これらの新しい Tensor コアは、FP8 精度データ型の高速化をサポートし、独立した浮動小数点と整数のデータパスを提供し、浮動小数点と整数を混合した計算の実行を高速化します。

48GB GPU メモリ

48GB GDDR6 メモリを搭載した RTX 6000 は、データサイエンティスト、エンジニア、クリエイティブなプロフェッショナル向けに、レンダリング、データサイエンス、シミュレーションなどの膨大なデータセットやワークロードを使用する作業に必要な大容量メモリを提供します。

仮想化対応

NVIDIA RTX 仮想ワークステーション (vWS) ソフトウェアをサポートすることで、個人のワークステーションを複数のハイパフォーマンスな仮想ワークステーションインスタンスとして使用できるため、リモートのユーザーがリソースを共有して、ハイエンドのデザイン、AI、コンピューティングのワークロードを進めることができます。

PCIe Gen 4

NVIDIA RTX 仕様
	NVIDIA A800 40GB Active	RTX A6000 販売終了	RTX A5500 販売終了	RTX A5000 販売終了	RTX A4500 販売終了	RTX A4000 販売終了	RTX A2000 販売終了	RTX A1000	RTX A400
GPUメモリ	40GB HBM2	48GB GDDR6	24GB GDDR6	24GB GDDR6	20GB GDDR6	16GB GDDR6	12GB GDDR6	8GB GDDR6	4GB GDDR6
メモリー帯域幅	1,555GB/s	768GB/s	768GB/s	768GB/s	640GB/s	448GB/s	288GB/s	192GB/s	96GB/s
ECC	Yes	Yes	Yes	Yes	Yes	Yes	Yes	–	–
CUDAコア	6,912	10,752	10,240	8,192	7,168	6,144	3,328	2,304	768
Tensorコア	432	336	320	256	224	192	104	72	24
RTコア	N / A	84	80	64	56	48	26	18	6
単精度性能(TFLOPS)	19.5	38.7	34.1	27.8	23.7	19.2	8.0	6.7	2.7
RTコア性能(TFLOPS)	N / A	75.6	66.6	54.2	46.2	37.4	15.6	13.2	5.4
Tensor性能(TFLOPS)	623.8	309.7	272.8	222.2	189.2	153.4	63.9	53.8	21.7
NVLink	Yes	Yes	Yes	Yes	Yes	N / A	N / A	N / A	N / A
NVLink帯域幅	400GB/s	112.5GB/s (双方向)	112.5GB/s (双方向)	112.5GB/s (双方向)	112.5GB/s (双方向)	N / A	N / A	N / A	N / A
システムインターフェイス	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x8	PCIe 4.0 x8
最大消費電力	240W	300W	230W	230W	200W	140W	70W	50W	50W
排熱機構	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ	アクティブ
フォームファクター	4.4″ H x 10.5″ L 2スロット	4.4″ H x 10.5″ L 2スロットフルハイト	4.4″ H x 10.5″ L 2スロットフルハイト	4.4″ H x 10.5″ L 2スロットフルハイト	4.4″ H x 10.5″ L 2スロットフルハイト	4.4″ H x 9.5″ L 1スロット	2.7″ H x 6.6″ L 2スロット	2.7″ H x 6.4″ L 1スロット	2.7″ H x 6.4″ L 1スロット
画面出力	N / A	DisplayPort 1.4a x4	DisplayPort 1.4a x4	DisplayPort 1.4a x4	DisplayPort 1.4a x4	DisplayPort 1.4a x4	mDP 1.4a x4	mDP 1.4a x4	mDP 1.4a x4
電源コネクタ	16ピン PCIe CEM5 x1	8ピン CPU x1	8ピン PCIe x1	8ピン PCIe x1	8ピン PCIe x1	6ピン PCIe x1	N / A	N / A	N / A

NVIDIA RTX テクノロジ

NVIDIA RTX™ テクノロジは、コンピューターグラフィックスにおけるNVIDIAの最も重要な進歩の1つであり、かつてないスピードで実世界をシミュレートする新世代アプリケーションをもたらします。AI、レイトレーシング、シミュレーションにおける最新技術が盛り込まれたRTXテクノロジによって驚異的な3Dデザイン、フォトリアルなシミュレーション、圧倒的なビジュアルエフェクトが、かつてないほど高速で実現します。

中心となるテクノロジ

レイトレーシング

RTXテクノロジはNVIDIA OptiX™、Microsoft DXR、Vulkanといった、最適化されたレイトレーシングAPIにより、映画品質の映像をリアルタイムでレンダリングするという夢を叶えるものです。極めて正確な影、反射、屈折の描写で、フォトリアルなオブジェクトと環境をリアルタイムでレンダリングできるため、アーティストやデザイナーは驚異的な作品をこれまでにない速さで作り出せるようになりました。

人工知能 (AI)

NVIDIA RTXテクノロジはAIのパワーをビジュアルコンピューティングにもたらします。かつてないワークフローの高速化をエンドユーザーにもたらすAI強化アプリケーションを開発できます。インテリジェントな画像の編集、繰り返しタスクの自動化、コンピューティング負荷の高いプロセスの最適化により、時間とリソースを節約し、アーティストやデザイナーの創作を劇的に加速します。

ラスタライゼーション

RTXテクノロジには、可変レートシェーディング、テクスチャスペースシェーディング、マルチビューレンダリングなどのプログラミング可能シェーディングにおける最新技術が盛り込まれています。より豊かなビジュアルの制作と大規模なモデルやシーンとのよりスムーズなインタラクティブ性を実現しVR体験が改善されます

シミュレーション

現実感あふれるビジュアルを生み出すには、外観だけでなく、その挙動も重要です。CUDA® コアのパワーと、NVIDIA PhysX®、Flow、FleX、CUDAなどのAPIによりRTXテクノロジではゲーム、仮想環境、特殊効果といったあらゆるケースで、実世界の物体の挙動を正確にモデリングできます。

AMD Instinct™ MI200 シリーズ・アクセラレーターの仕様
	Instinct MI210
GPU アーキテクチャ	CDNA2
演算ユニット	104
ストリーミングプロセッサ	6,656
倍精度演算性能(FP64)	22.6 TFLOPS
単精度演算性能(FP32)	22.6 TFLOPs
半精度演算性能(FP16)	181 TFLOPs
GPUメモリ	64 GB HBM2e
メモリ帯域幅	1638.4 GB/sec
ECC	対応
システム接続	PCI Express 4.0 x16
フォームファクタ	PCIe Full Height / Length:10.5″ 2スロット
最大消費電力	300 W
冷却方式	パッシブ（冷却ファンなし）
プログラミング環境	ISO C++, OpenCL™, ROCm™ Open Ecosystem Python5 (via Anaconda’s NUMBA)

製品仕様

仕様は改良の為、予告なく変更する場合があります。

CPU

AMD EPYC 7003 シリーズ・プロセッサー x 2

チップセット

System on Chip ( SoC )

メモリ

DDR4-3200MHz ECC RDIMM / LRDIMM x 32

ドライブベイ

2.5インチホットスワップ ( SATA / SAS 対応 ) x 20
2.5インチホットスワップ ( SATA / SAS / NVMe 対応 ) x 4

オプティカルドライブ

USB接続外付けDVDマルチドライブオプション

グラフィックス

オンボード

GPU

2スロット GPU 最大 x 8

ネットワークI/F

1ギガビットイーサネット ( RJ45 ) x 2

管理I/F

BMC / IPMI 2.0

I/Oポート背面

シリアルポート x 1
VGA x 1
USB3.0 x 2
IPMI用 MLAN ( RJ45 ) x 1

拡張スロット

PCI Express 4.0 x16 ( FHFL ) x 9

ケース

4Uラックマウントケース : W 437mm x H 178mm x D 737mm

電源

100V 1000W / 200V 1800W リダンダント電源 80-plus Titanium

Ubuntu ( Server / Desktop )
AlmaLinux
Rocky Linux
RedHat Enterprise Linux Server
SUSE Linux Enterprise Server
Microsoft Windows Server 2025
Microsoft Windows Server 2022
その他のOSやLinuxディストリビューションについてはご相談ください。

保守

1年間全国出張オンサイトサービス
3年間全国出張オンサイトオプション

動作推奨環境

温度 : 10 ℃ ～ 25 ℃
湿度 : 20 % ～ 80 % (結露なきこと)

カタログ

弊社ウェブサイト（本サイト）に表示・記載されている会社名、製品名およびロゴ等は、各社の登録商標または商標です。

TOPに戻る製品特長製品仕様カタログ

株式会社日本コンピューティングシステム

日本コンピューティングシステム（JCS）は、企業・各省庁・大学へサーバ、GPGPU等の数多くの納入実績を誇るITサプライヤーです

AMD Instinct 最大8基搭載

VCAE-4U24LA003-GA

主な仕様

製品特長

AMD EPYC™ 7003 シリーズ・プロセッサー搭載

NVIDIA データセンターGPU Hopper™世代搭載可能

NVIDIA データセンターGPU Ada Lovelace世代搭載可能

NVIDIA データセンターGPU Ampere世代搭載可能

NVIDIA RTX™ Ada Lovelace世代搭載可能

NVIDIA RTX™ Ampere世代搭載可能

AMD Instinct™ アクセラレーター搭載可能

製品仕様

カタログ

個人情報保護方針について

AMD Instinct 最大8基搭載

VCAE-4U24LA003-GA

主な仕様

製品特長

AMD EPYC™ 7003 シリーズ・プロセッサー 搭載

NVIDIA データセンターGPU Hopper™世代 搭載可能

NVIDIA データセンターGPU Ada Lovelace世代 搭載可能

NVIDIA データセンターGPU Ampere世代 搭載可能

NVIDIA RTX™ Ada Lovelace世代 搭載可能

NVIDIA RTX™ Ampere世代 搭載可能

AMD Instinct™ アクセラレーター 搭載可能

製品仕様

カタログ

AMD EPYC™ 7003 シリーズ・プロセッサー搭載

NVIDIA データセンターGPU Hopper™世代搭載可能

NVIDIA データセンターGPU Ada Lovelace世代搭載可能

NVIDIA データセンターGPU Ampere世代搭載可能

NVIDIA RTX™ Ada Lovelace世代搭載可能

NVIDIA RTX™ Ampere世代搭載可能

AMD Instinct™ アクセラレーター搭載可能