NVIDIA logo
NVIDIA Ada Lovelace 仕様
 
NVIDIA L40
NVIDIA L40S
NVIDIA L40
NVIDIA L40
GPUメモリ 48GB GDDR6 ECC付き 48GB GDDR6 ECC付き
メモリー帯域幅 864GB/s 864GB/s
インターコネクト インタフェース PCIe Gen4x16: 64GB/s 双方向 PCIe Gen4x16: 64GB/s 双方向
CUDA コア数 18,176 18,176
NVIDIA 第3世代 RT コア 142 142
NVIDIA 第4世代 Tensor コア 568 568
RT コア 性能 TFLOPS 212 209
FP32 TFLOPS 91.6 90.5
TF32 Tensor コア TFLOPS 183 | 366 90.5 | 181
BFLOAT16 Tensor コア TFLOPS 362.05 | 733 181.05 | 362.1
FP16 Tensor コア 362.05 | 733 181.05 | 362.1
FP8 Tensor コア 733 | 1466 362 | 724
ピーク INT8 Tensor TOPS 733 | 1466 362 | 724
ピーク INT4 Tensor TOPS 733 | 1466 724 | 1448
最大消費電力 350W 300W
フォームファクター 4.4” (H) x 10.5” (L)
2スロット
4.4” (H) x 10.5” (L)
2スロット
排熱機構 パッシブ(冷却ファンなし) パッシブ(冷却ファンなし)
ディスプレイポート 4 x DisplayPort 1.4a 4 x DisplayPort 1.4a
マルチインスタンスGPU N/A N/A
NVLink N/A N/A

NVIDIA Ada Lovelace アーキテクチャ

NVIDIA Ada Lovelace
NVIDIA Ada Lovelace アーキテクチャ

Ada GPU アーキテクチャは、レイ トレーシングと AI ベースのニューラル グラフィックスに革新的な性能を実現できるように設計されています。GPU 性能のベースラインが劇的に上がり、レイ トレーシングとニューラル グラフィックスの転換点となります。

CUDA® コア

Transformer Engine

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット数学機能 (BF16) をサポート。

第 3 世代 RT コア

スループットとコンカレント レイ トレーシングとシェーディング機能が強化され、レイ トレーシングのパフォーマンスが向上し、製品の設計/アーキテクチャ、エンジニアリング、建設のワークフローのレンダリングが高速化します。ハードウェアでモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現する実物のようなデザインをご覧ください。

第 4 世代 Tensor コア

構造的なスパース性と最適化された TF32 形式のハードウェア サポートにより、すぐにパフォーマンスが向上し、AI とデータ サイエンス のモデル トレーニングが高速化します。DLSS を含む AI により強化されたグラフィックス機能を加速させ、選ばれたアプリケーションで優れたパフォーマンスで高解像度を実現します。

48GB の GPU メモリ

48GB の超高速 GDDR6 メモリで、データ サイエンス、シミュレーション、3D モデリング、レンダリングなどの、メモリ負荷の高いアプリケーションやワークロードに対応します。vGPU ソフトウェアを使用して複数のユーザーにメモリを割り当て、クリエイティブ チーム、データ サイエンス チーム、デザイン チーム間で大規模なワークロードを分散します。

仮想化対応

NVIDIA 仮想 GPU (vGPU) ソフトウェア を活用した次世代の改善により、リモート ユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。

PCI Express Gen 4

PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。

データ センターの効率性とセキュリティ

NVIDIA L40 は、24 時間 365 日稼動のエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、広範囲にテスト、サポートされています。受動冷却、フルハイト フルレングス (FHFL)、デュアルスロット デザイン、最大 300W のボード電力などの特徴を備え、主要な OEM ベンダーのさまざまな筐体構成に収まります。最新のデータ センター標準を満たし、NEBS レベル 3 に対応し、Root of Trust 技術によるセキュア ブートを備え、データ センターにさらなるセキュリティ層を提供します。

関連製品