日本コンピューティングシステム(JCS) 日本コンピューティングシステム(JCS)は機械学習用途のGPGPU、研究用途のHPCを多くの企業、各省庁・各大学へ数多く納入した実績を誇るITサプライヤーです
03-3821-3200
製品情報 Teslanvidia TeslaAMD Radeon Serverラックマウントサーバーサーバー+RAID ブレードサーバーストレージDASNASRAIDシステムワークステーションタワー型ワークステーションキューブ型デスクトップPCミッドタワーモデルスリム&コンパクトモデルHPC SolutionsHPCOEM/ODM オプション catalog

Supermicro カスタムオーダー
 

General-Purpose computing on Graphics Processing UnitsNVIDIA GPGPU ソリューション

2UラックマウントGPGPUモデル NVIDIA HGX A100 4基搭載

amd epyc
VCAE-2U04LA001-G.jpg

画像は実際の製品と異なる場合があります。

VCAE-2U04LA001-G 新製品

2Uラックマウントシャーシに、4基のHGX A100を搭載可能な高密度ラックマウントGPGPUモデルです。GPU間を相互接続するNVLink、NVSwtichをサポートし、4基のA100 GPUは高速に相互接続されます。これによりボトルネックであった帯域幅の遅延を減らしディープラーニングのパフォーマンスを劇的に向上させます。

主な仕様
GPU NVIDIA HGX A100 x 4
CPU AMD 第2世代 EPYC プロセッサー x 2
最大CPUコア数   128
最大メモリ   8TB
ドライブベイ   2.5" x 4
ケース   2U

NVIDIA A100 Tensor Core GPU搭載

NVIDIA A100 Tensor Core GPUはAIとHPC用途のためにデータセンター向けGPUとして開発されたVolta世代の後継として製造プロセスルール7nmのAmpereアーキテクチャを採用。第3世代のTensorコアを実装し、BFloat16、Tensor Float 32を新たにサポート、前世代のVoltaと比較しFP32演算、INT8のディープラーニング推論処理において20倍の性能を実現し、トレーニングと推論の両方が強化されています。
また、Multi-instance GPU(MIG)機能により単一のA100を最大7個のGPUとして扱うことが可能で複数のユーザーが独立したインスタンスとして利用できます。

  • Ampereアーキテクチャ
  • 世界最大のトランジスタ数540億の7nmプロセス チップ

  • 第3世代Tensorコア
  • TF32を導入しAI性能が20倍に向上

  • 第3世代NVLinkとNVSwitch
  • GPU間を相互に接続するNVLinkは前世代比で2倍のスループレットに向上し600GB/sで接続可能。

  • 構造的疎性による推論の高速化
  • 「疎行列」(Sparse Matrix)演算への対応と最適化によりAI性能を2倍高速化

  • Multi-instance GPU(MIG)機能
  • 単体のA100を最大7つの独立したインスタンスに分割し、複数ユーザーが互いに影響させることなく各自のワークロードを同時に実行できます。

  • PCI Express Gen 4対応
  • 汎用性を高めストレージ、ネットワークを高速化。

NVIDIA A100 Tensor Core GPU の仕様
 
NVIDIA HGX A100
NVIDIA HGX A100
NVIDIA A100 PCIe
NVIDIA A100 PCIe
GPU アーキテクチャ NVIDIA Ampere
フォームファクタ SXM4 PCIe Gen4
FP64 CUDA コア 3,456
FP32 CUDA コア 6,912
Tensorコア 432
倍精度演算性能 FP64 : 9.7TFLOPS
FP64 Tensor コア : 19.5TFLOPS
単精度演算性能 FP32 : 19.5 TFLOPS
TF32 Tensor コア : 156TFLOPS / 312TFLOPS
半精度演算性能(FP16) 312TFLOPS / 624TFLOPS
BFLOAT16 312TFLOPS / 624TFLOPS
整数性能 INT8 : 624TOPS / 1,248TOPS
INT4 : 1,248TOPS / 2,496TOPS
GPUメモリ 40GB HBM2
メモリ帯域幅 1,555 GB/sec
ECC 対応
GPU間接続帯域 600 GB/sec
システム接続 NVIDIA NVLink
PCIe Gen4
マルチインスタンスGPU 最大7分割
最大消費電力 400 W 250 W
主要アプリケーション実行性能 100% 90%
冷却方式 パッシブ(冷却ファンなし)
API CUDA、DirectCompute、OpenCL、OpenACC

AMD EPYC プロセッサー搭載

「AMD EPYC プロセッサー」はデータセンター向けプロセッサーとして第1世代である「EPYC 7001 シリーズ」が2017年にリリースされました。第1世代 EPYCでは複数のダイを単一のパッケージに統合したマルチダイ化によりコストを抑え、性能向上のためのアプローチとしてMCM(Multi Chip Module:マルチ・チップ・モジュール)構成を採用、「Infinity Fabric」と呼ばれるインターコネクト技術により4つのダイが接続されています。
これにより第1世代 EPYCでは8個のZEN CPUコアを搭載したダイを4個使うことで最大32コアのCPUを実現しています。

2019年にリリースされた第2世代 EPYC プロセッサー「EPYC 7002 シリーズ」は、第1世代 EPYCのMCM構成を継承。8個のZEN2 CPUコアを搭載したダイを最大8個搭載し、新たにPCI Express Gen4のコントローラ、8チャネルのメモリコントローラなどを一つに集約したI/Oダイを接続。8コア×8ダイで最大64個のCPUコアを単一のCPUパッケージに搭載しています。

第2世代 EPYCは7nmプロセスの「ZEN2」アーキテクチャで製造され、分岐予測などの改良、FPユニットの強化、L3キャッシュの増加によりシングルスレッド、マルチコア性能が向上。
CPUダイ、ソケット間を接続する「Infinity Fabric」の速度も改良されており、第1世代 EPYCの10.76GT/sから、第2世代 EPYCでは18GT/sに向上しています。
これにより第1世代 EPYCと比較してIPCが15%改善されています。

9ダイ構成のマルチ・チップ・モジュール

AMD 第2世代 EPYC プロセッサーの主な特長

  • 7nmプロセスの「ZEN2」アーキテクチャ
  • 1つのパッケージ上に8つのプロセッサダイと単一のIOD(I/O Die)を集約
  • 1パッケージあたり最大64コア128スレッド
  • CPUダイ、ソケット間を接続する「Infinity Fabric」を10.7GT/秒から18GT/秒に引き上げ
  • DDR4-3200メモリに対応 1パッケージあたり最大4TB
  • PCI Express 4.0対応
  • 専用のセキュアチップを搭載しセキュリティを強化
世代別比較
  第1世代 EPYC 7001 第2世代 EPYC 7002
リリース年 2017年 2019年
コードネーム Naples Rome
アーキテクチャ Zen Zen2
製造プロセスルール 14nm 7nm
最大CPUコア 32 64
CPUソケット SP3 SP3
Infinity Fabric 10.7GT/秒 18GT/秒
ソケット数 1 / 2 1 / 2
メモリ DDR4-2666 DDR4-3200
メモリチャネル 8 8
最大メモリ 2TB 4TB
PCI Express Gen3 128レーン Gen4 128レーン

8コアから64コアまでの幅広いラインナップ

AMD EPYC プロセッサーはシングルソケット、デュアルソケットに対応しそれぞれ8コアから64コアまでの幅広いラインナップをもちます。いずれのSKUも8チャネルのDDR4メモリと128レーンのPCI Expressを備え、ソケットあたりでの広い帯域と大容量のメモリ、高いI/O性能、マルチスレッド性能を持つのが特長であり、1ノードで高密度なGPUコンピュートノードを構築することが可能です。

AMD 第2世代 EPYC™ 7002 (Rome)
CPU コア/スレッド 動作クロック
基本クロック/最大ブースト
ソケット数 最大メモリー速度 L3 キャッシュ デフォルトTDP/TDP
7742 64C/128TH 2.25GHz / 3.40GHz 2 / 1 3200MHz 256MB 225W
7702 64C/128TH 2.00GHz / 3.35GHz 2 / 1 3200MHz 256MB 200W
7702P 64C/128TH 2.00GHz / 3.35GHz 1 3200MHz 256MB 200W
7642 48C/96TH 2.30GHz / 3.30GHz 2 / 1 3200MHz 256MB 225W
7552 48C/96TH 2.20GHz / 3.30GHz 2 / 1 3200MHz 192MB 200W
7542 32C/64TH 2.90GHz / 3.40GHz 2 / 1 3200MHz 128MB 225W
7502 32C/64TH 2.50GHz / 3.35GHz 2 / 1 3200MHz 128MB 180W
7502P 32C/64TH 2.50GHz / 3.35GHz 1 3200MHz 128MB 180W
7452 32C/64TH 2.35GHz / 3.35GHz 2 / 1 3200MHz 128MB 155W
7402 24C/48TH 2.80GHz / 3.35GHz 2 / 1 3200MHz 128MB 180W
7402P 24C/48TH 2.80GHz / 3.35GHz 1 3200MHz 128MB 180W
7352 24C/48TH 2.30GHz / 3.20GHz 2 / 1 3200MHz 128MB 155W
7302 16C/32TH 3.00GHz / 3.30GHz 2 / 1 3200MHz 128MB 155W
7302P 16C/32TH 3.00GHz / 3.30GHz 1 3200MHz 128MB 155W
7282 16C/32TH 2.80GHz / 3.20GHz 2 / 1 3200MHz 64MB 120W
7272 12C/24TH 2.90GHz / 3.20GHz 2 / 1 3200MHz 64MB 120W
7262 8C/16TH 3.20GHz / 3.40GHz 2 / 1 3200MHz 128MB 155W
7252 8C/16TH 3.10GHz / 3.20GHz 2 / 1 3200MHz 64MB 120W
7232P 8C/16TH 3.10GHz / 3.20GHz 1 3200MHz 32MB 120W

7nmプロセスの「ZEN2」アーキテクチャ

第2世代 EPYCは7nmプロセスの「ZEN2」アーキテクチャで構成されており、第1世代 EPYCに採用されていた「Zen」と比較すると、IPC(Instruction Per Clock-cycle)が15%ほど改善され、特に浮動小数点演算時の実行効率は「Zen」に比べて2倍に向上している。
製造プロセスルールを微細化したことにより、より小さな底面積で製造することが可能となり1つのパッケージに実装できるCPUダイの数が最大8つに増加。これにより性能/消費電力比が大幅に改善、導入におけるコストとメンテナンス費用削減に貢献しています。

このほか、セキュリティ面も強化されており「AMD Secure Processor」と呼ばれるセキュリティチップを内蔵、Arm Cortex-A5をベースとしたマイクロコントローラで独自にセキュアOSが動作している。
暗号化鍵の管理機能も備えておりメモリの暗号化(SME:AMD Secure Memory Encryption)、仮想マシンの暗号化(SEV:AMD Secure Encrypted Virtualization)機能により仮想マシン環境全体の安全性を引き上げている。

Gen2 EPYC
第2世代 EPYC プロセッサー

業界初のPCI-Express 4.0対応

AMD 第2世代 EPYC™はサーバープロセッサーとして初めてPCIe 4.0をサポートしています。PCIe 4.0は、PCIe 3.0の2倍のI / Oパフォーマンスを提供、HPCクラスターを結び付けるネットワーク帯域幅を2倍にします。1ソケット時のPCIeレーン数は128レーン。2ソケット時は既存プラットフォームでは同じ128レーン、新プラットフォームにより162レーンのPCIe 4.0がサポートされます。GPUアクセラレーター、NVMeドライブに高速で接続でき、統合ディスクコントローラーを使用することでPCIe RAIDコントローラーのボトルネックなしにストレージにアクセスすることが可能です。

PCI Express 4.0
帯域が2倍に向上
仕様は改良の為、予告なく変更する場合があります。
プロセッサー x 2基
チップセット System on Chip
メモリ DDR4-3200 SDRAM ECC
メモリスロット 32スロット(最大8TB)
ストレージ 2.5インチ
ドライブベイ 4(ホットスワップ対応) SATA/NVMe/SAS
オプティカルドライブ USB接続 外付けDVDマルチドライブ(オプション)
GPU NVIDIA HGX A100 40GB x4基
グラフィックス onboard
ネットワークI/F 10GBase-T 2port (RJ45)
IPMI 1port (RJ45)
管理I/F IPMI 2.0, KVM-over-LAN
I/Oポート VGA x1(背面)
USB 3.0 x2(背面)
拡張スロット PCI-Express 4.0 x16(4スロット Low Profile )
PCI-Express 4.0 x8(1スロット Low Profile )
ケース 2U ラックマウント (外形寸法:W437mm x H89mm x D823mm)
電源 200V 1800W リダンダント電源 (80-plus Titanium 高効率電源)
対応OS(別売)
  • Ubuntu 64bit
  • ※その他Linuxディストリビューションについてはご相談ください。
ソフトウェア NVIDIA CUDA(デバイスドライバ、ツールキット、CUDA SDK開発環境、コンパイラ等)
* Deep Learning各種フレームワークのインストールにつきましてはお問い合わせください。
Deep Learning用
フレームワーク
DIGITS、TensorFlow、Chainer、Caffe、Pytorch、Docker
保守 1年間全国出張オンサイトサービス(標準)
3年間全国出張オンサイト(オプション)
CPU 税別価格

※上記価格は標準構成(CPUx2、メモリ32GB)での参考価格です。お見積り、お問い合わせ(販売価格、構成を変更した場合の価格、ご質問等)はお見積りフォームよりお願いいたします。

Xeon Platinum 8180 (2.50GHz 28C/56TH) ¥,000~
Xeon Platinum 8168 (2.70GHz 24C/48TH) ¥,000~
Xeon Gold 6154 (3.00GHz 18C/36TH) ¥,000~
Xeon Gold 6136 (3.00GHz 12C/24TH) ¥,000~
Xeon Gold 6134 (3.20GHz 8C/16TH) ¥,000~

■システム標準

CPU x 2基
チップセット System on Chip
メモリ
ストレージ 2.5インチ x
オプティカルドライブ
グラフィックス Onboard
GPU
ネットワークI/F 10Gigabit Ethernet 2port onboard
管理I/F IPMI 2.0, KVM-over-LAN
ケース 2Uラックマウント(外形寸法:W437mm x H89mm x D823mm)
スライドレール 専用スライドレール
電源 200V 1800W リダンダント電源 (80-plus Titanium 高効率電源)
電源ケーブル 200V専用ケーブル
保守
HDD返却不要サービス

■システム拡張

OS
その他のOS
使用予定OS
コンパイラ
ご指定のコンパイラをご記入ください。
フレームワーク
(複数選択可)
キーボード
マウス
LCDモニタ
ドロワー
UPS
UPS管理ソフト
Ubuntu使用の場合、APC PowerChute Business Editionでは動作しません。apcupsdでのご利用となります。

■見積り台数・その他のご要望

見積り台数 選択肢以上の台数も承ります。ご希望台数を下記「その他のご要望」欄にご記入ください。
その他のご要望

■お見積送付先

お名前(ご担当者様氏名) 必須
法人名・組織名・個人 必須
種別
部署名
E-Mail Address 必須
お電話番号
FAX番号
都道府県
支払方法
再見積りをご希望の方は
弊社担当者名をご記入ください。
■個人情報保護方針について
必須