かつてないパフォーマンス
2022年9月19日-22日開催のNVIDIA GTC 2022 秋において、データセンター、サーバー向けGPU「NVIDIA L40」が発表されました。
NVIDIA L40 は、最新のAda Lovelaceアーキテクチャが採用されており、RTコアが唯一搭載されているサーバー向けのGPUです。
NVIDIA L40 は、NVIDIA A40 Tensor Core GPUの後継モデルとなり、GPUメモリはA40 GPUと同じ 48 GB GDDR6の大容量GPUメモリを搭載。
NVIDIA Ada Lovelaceアーキテクチャを採用することにより、NVIDIA L40は、A40 GPUの2倍の性能向上を実現しました。
また、NVIDIA L40 は、AIやデータサイエンスの計算時間を短縮するだけでなく、これからのデジタルツインの発展を見据えて、仮想空間におけるテクノロジー技術(メタバース、3Dグラフィックスや、3Dコラボレーションなど)の大規模な作成や運用、データセンターでも使えるよう設計されています。
NVIDIA L40 特徴
Ada Lovelace アーキテクチャ搭載
Ada Lovelace アーキテクチャは、グラフィックス処理の性能向上が図られており、前世代のAmpereアーキテクチャと比べて、シェーダーを扱うStreaming Multiprocessorを刷新し、レイトレーシング処理を担うRTコアを第3世代に進化させました。
さらに、Hopperアーキテクチャで採用した第4世代Tensorコアを採用することでディープラーニングの処理性能も向上しています。
CUDA® コア
単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット数学機能 (BF16) をサポート。
第 3 世代 RT コア
スループットとコンカレント レイ トレーシングとシェーディング機能が強化され、レイ トレーシングのパフォーマンスが向上し、製品の設計/アーキテクチャ、エンジニアリング、建設のワークフローのレンダリングが高速化します。
ハードウェアでモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現する実物のようなデザインをご覧ください。
第 4 世代 Tensor コア
構造的なスパース性と最適化された TF32 形式のハードウェア サポートにより、すぐにパフォーマンスが向上し、AI とデータ サイエンス のモデル トレーニングが高速化します。DLSS を含む AI により強化されたグラフィックス機能を加速させ、選ばれたアプリケーションで優れたパフォーマンスで高解像度を実現します。
48GB の GPUメモリ
超高速 GDDR6 メモリは、NVIDIA 第 3 世代 NVLink で最大 96GB まで拡張して、データ サイエンス、シミュレーション、3D モデリング、レンダリングなど、メモリ負荷の高いアプリケーションやワークロードに対応できます。vGPU ソフトウェアを使用して複数のユーザーにメモリを割り当て、クリエイティブ チーム、データ サイエンス チーム、デザイン チーム間で大規模なワークロードを分散します。
仮想化対応
NVIDIA virtual GPU (vGPU) ソフトウェア* を活用した次世代の改善により、リモート ユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。*NVIDIA 仮想 GPU ソフトウェアのサポートは、2023 年初めに登場予定です。
PCI Express Gen 4
PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。
データ センターの効率性とセキュリティ
デュアルスロット、パッシブ冷却、電力効率に優れた設計は、世界中の OEM ベンダーが提供する幅広いサーバー シャーシ構成に適合します。
GPU 内の Hardware Root of Trust テクノロジを利用した Secure Boot および Measured Boot により、データ センターのセキュリティ層がさらに厚くなります。
NVIDIA L40 は、24 時間 365 日稼動のエンタープライズ データ センター運用に最適化されており、最大限のアップタイムを確保するために、NVIDIA によって設計、構築、広範囲にテスト、サポートされています。
GPU 内の Root of Trust テクノロジを利用した Secure Boot および Measured Boot により、データ センターのセキュリティ層がさらに厚くなります。NVIDIA L40 は最新のデータ センター規格を満たし、NEBS レベル 3 に準拠しています。
受動冷却、フルハイト、フルレングス (FHFL)、デュアルスロット デザインなど、業界をリードする OEM ベンダーのさまざまなシャーシ構成に適合します。
NVIDIA L40 は 300W の最大ボード電力に対応し、電力効率に優れたハードウェアとコンポーネントによって駆動され、最適なパフォーマンス、堅牢性、耐久性を実現します。
参考販売価格: 1,370,000円(税込 1,507,000円)
短期レンタル価格:218,000円/月(税込 239,800円/月)
長期1年レンタル価格:87,000円/月(税込 95,700円/月)
発売時期:2023年3月
レンタルの詳細はこちら
NVIDIA L40
拡張性に優れたマルチワークロード
次世代グラフィックス
NVIDIA L40 は、データ センターのビジュアル コンピューティング ワークロードに最高レベルのパワーとパフォーマンスをもたらします。
第 3 世代 RT コアと業界をリードする 48 GB の GDDR6 メモリは、前世代の最大 2 倍のリアルタイム レイ トレーシング パフォーマンスを実現し、リアルタイム、完全忠実度、インタラクティブ レンダリング、3D デザイン、ビデオ ストリーミング、仮想制作など、忠実度の高いクリエイティブ ワークフローを加速します。
パワフルなコンピューティングと AI
NVIDIA L40 には、トレーニング、推論、データ サイエンス、グラフィックス アプリケーションなど、データ センターで実行されている幅広い計算負荷の高いワークロードを高速化する画期的な機能が含まれています。
最新の第 4 世代 Tensor コアは、強化された AI 機能を提供し、ビジュアル コンピューティングのワークロードを高速化し、ディープラーニングや推論アプリケーションに画期的なパフォーマンスを提供します。
NVIDIA L40
様々な要求に応じてパフォーマンスを発揮する設計
NVIDIA Omniverse Enterprise
データ センターの NVIDIA Omniverse™ のエンジンとなる NVIDIA L40 は、エクステンデッド リアリティ (XR) アプリケーションや仮想現実 (VR) アプリケーション、デザイン コラボレーション、デジタル ツインなどのワークロードにパワーを与えるパワフルな RTX および AI の機能を提供します。きわめて複雑な Omniverse ワークロードのために、NVIDIA L40 は、マテリアルのレイ トレーシングとパス トレースによるレンダリングの高速化、物理的に正確なシミュレーション、フォトリアルな 3D 合成データの生成を可能にします。
レンダリングと 3Dグラフィックス
NVIDIA L40 でプロフェッショナル 3D ビジュアライゼーション アプリケーションを実行することで、クリエイティブ プロフェッショナルはより多くのイテレーションを行い、より速くレンダリングし、驚異的なパフォーマンス上の利点を引き出し、生産性を上げ、プロジェクトの完了をスピードアップできます。
アーティストやデザイナーは複雑なジオメトリと高解像度のテクスチャを使用してリアルタイムで作業し、フォトリアルなデザインとシミュレーションを生成し、忠実度の高いクリエイティブ ワークフローを強化することができます。
高性能仮想ワークステーション
NVIDIA L40 を NVIDIA RTX™ 仮想ワークステーション (vWS) ソフトウェア* と組み合わせることで、データ センターやクラウドからあらゆるデバイスまで、最もパワフルな仮想ワークステーションを提供します。多くのクリエイティブやテクニカルのプロフェッショナルが、より強力なセキュリティのニーズを満たしながら、物理的ワークステーションに匹敵する堂々たるパフォーマンスをもって、きわめて要求の高いアプリケーションにどこからでもアクセスできます。
*NVIDIA 仮想 GPU ソフトウェアのサポートは、2023 年初めに登場予定です。
AIトレーニングとデータサイエンス
パワフルなトレーニングと推論のパフォーマンスをエンタープライズ クラスの安定性および信頼性と組み合わせることで、NVIDIA L40 はシングル GPU AI のトレーニングと開発に最適なプラットフォームとなります。NVIDIA L40 は、FP8 を含むあらゆる精度のより高いスループットとサポートを提供することで、モデルのトレーニングと開発、データ サイエンスのデータ準備、シミュレーション ワークフローの完了までの時間を短縮します。
ストリーミングとビデオコンテンツ
NVIDIA L40 は、3 つのビデオ エンコード エンジンと 3 つのビデオ デコード エンジンにより、ストリーミングとビデオ コンテンツのワークロードを一段上のレベルに引き上げます。AV1 エンコーディングの追加により、L40 はブロードキャスト ストリーミング、ビデオ制作、文字起こしのワークフローにおいて画期的なパフォーマンスと TCO の改善をもたらします。
NVIDIA L40 スペック
NVIDIA L40と、前世代 NVIDIA A40 GPUのスペックを比較しています。
参考価格となりますので、価格についてはお問い合わせください。
NVIDIA L40 [PCIe] | NVIDIA A40 [PCIe] | |
参考販売価格 | 1,370,000円 (税込 1,507,000 円) | 870,000 円 (税込 957,000 円) |
発売時期 | 2023年3月 | 2021年1月 |
GPUアーキテクチャ | Ada Lovelace | Ampere |
GPUメモリ | 48 GB GDDR6 | 48 GB GDDR6 |
ECC機能 | 対応 | 対応 |
メモリバンド幅 | 864 GB/s | 696 GB/s |
メモリバス | 384 bit | 384 bit |
Compute Capability | 8.9 | 8.6 |
CUDAコア | 18,176 | 10,752 |
RTコア | 142 | 84 |
Tensorコア | 568 | 336 |
NVLink | 非対応 | 対応 |
ベースクロック | 735 MHz | 1,305 MHz |
GPU Boost クロック | 2,490 MHz | 1,740 MHz |
最大消費電力 | 300 W | 300 W |
補助電源 | PCIe CEM5 16 pin | CPU(EPS) 8 pin |
バスインターフェース | PCIe 4.0 × 16 | PCIe 4.0 × 16 |
トランジスタ数 | 76.3 | 28.3 |
マルチインスタンスGPU | 非対応 | 非対応 |
NVIDIA L40 性能
NVIDIA L40と、前世代 NVIDIA A40 GPUの性能を比較しています。
NVIDIA L40 [PCIe] | NVIDIA A40 [PCIe] | |
FP64 | N/A | N/A |
FP64 Tensor Core | N/A | N/A |
FP32 | 90.5 TFLOPS | 37.4 TFLOPS |
TF32 Tensor Core (スパース性機能) | 90.5 TFLOPS (181 TFLOPS) | 74.8 TFLOPS (149.6 TFLOPS) |
RTコア性能 | 209 TFLOPS | 73.1 TFLOPS |
BFLOAT16 Tensor Core (スパース性機能) | 181.0 TFLOPS (362.1 TFLOPS) | 149.7 TFLOPS (299.4 TFLOPS) |
FP16 Tensor Core (スパース性機能) | 181.0 TFLOPS (362.1 TFLOPS) | 149.7 TFLOPS (299.4 TFLOPS) |
FP8 Tensor Core (スパース性機能) | 362 TFLOPS (724 TFLOPS) | 299.3 TFLOPS (598.6 TFLOPS) |
ピーク INT8 Tensor TOPS (スパース性機能) | 362 TOPS (724 TOPS) | 299.3 TOPS (598.6 TOPS) |
ピーク INT4 Tensor TOPS (スパース性機能) | 724 TOPS (1,448 TOPS) | 598.7 TOPS (1,197.4 TOPS) |
* スパース性機能を使用した場合の TFLOPS/TOPS 実効値
NVIDIA GPU 一覧表PDF
弊社で取り扱っているNVIDIA GPUの性能・スペックを一覧にしました。PDFファイルをダウンロードすることができます。
NVIDIA L40 搭載可能なサーバーも取り扱っていますので、お問い合わせください。
お気軽にご相談ください!
製品に関するご質問・ご相談など、お気軽にお問い合わせください。
NVIDIA認定のエリートパートナー「GDEPソリューションズ」は、
お客様の用途に最適な製品のご提案から導入までサポートします。