NVIDIA L40

かつてないパフォーマンス

2022年9月19日-22日開催のNVIDIA GTC 2022 秋において、データセンター、サーバー向けGPU「NVIDIA L40」が発表されました。

NVIDIA L40 は、最新のAda Lovelaceアーキテクチャが採用されており、RTコアが唯一搭載されているサーバー向けのGPUです。

NVIDIA L40 は、NVIDIA A40 Tensor Core GPUの後継モデルとなり、GPUメモリはA40 GPUと同じ 48 GB GDDR6の大容量GPUメモリを搭載。
NVIDIA Ada Lovelaceアーキテクチャを採用することにより、NVIDIA L40は、A40 GPUの2倍の性能向上を実現しました。

また、NVIDIA L40 は、AIやデータサイエンスの計算時間を短縮するだけでなく、これからのデジタルツインの発展を見据えて、仮想空間におけるテクノロジー技術（メタバース、3Dグラフィックスや、3Dコラボレーションなど）の大規模な作成や運用、データセンターでも使えるよう設計されています。

※ 販売終了のため、レンタルのみの取扱いとなります。

NVIDIA L40 特徴

Ada Lovelace アーキテクチャ搭載

Ada Lovelace アーキテクチャは、グラフィックス処理の性能向上が図られており、前世代のAmpereアーキテクチャと比べて、シェーダーを扱うStreaming Multiprocessorを刷新し、レイトレーシング処理を担うRTコアを第3世代に進化させました。
さらに、Hopperアーキテクチャで採用した第4世代Tensorコアを採用することでディープラーニングの処理性能も向上しています。

CUDA^® コア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット数学機能 (BF16) をサポート。

第 3 世代 RT コア

スループットとコンカレントレイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品の設計/アーキテクチャ、エンジニアリング、建設のワークフローのレンダリングが高速化します。
ハードウェアでモーションブラーを高速化し、驚異的なリアルタイムアニメーションを実現する実物のようなデザインをご覧ください。

第 4 世代 Tensor コア

構造的なスパース性と最適化された TF32 形式のハードウェアサポートにより、すぐにパフォーマンスが向上し、AI とデータサイエンスのモデルトレーニングが高速化します。DLSS を含む AI により強化されたグラフィックス機能を加速させ、選ばれたアプリケーションで優れたパフォーマンスで高解像度を実現します。

48GB の GPUメモリ

超高速 GDDR6 メモリは、NVIDIA 第 3 世代 NVLink で最大 96GB まで拡張して、データサイエンス、シミュレーション、3D モデリング、レンダリングなど、メモリ負荷の高いアプリケーションやワークロードに対応できます。vGPU ソフトウェアを使用して複数のユーザーにメモリを割り当て、クリエイティブチーム、データサイエンスチーム、デザインチーム間で大規模なワークロードを分散します。

仮想化対応

NVIDIA virtual GPU (vGPU) ソフトウェア* を活用した次世代の改善により、リモートユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。*NVIDIA 仮想 GPU ソフトウェアのサポートは、2023 年初めに登場予定です。

PCI Express Gen 4

PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。

データセンターの効率性とセキュリティ

デュアルスロット、パッシブ冷却、電力効率に優れた設計は、世界中の OEM ベンダーが提供する幅広いサーバーシャーシ構成に適合します。

GPU 内の Hardware Root of Trust テクノロジを利用した Secure Boot および Measured Boot により、データセンターのセキュリティ層がさらに厚くなります。

NVIDIA L40 は、24 時間 365 日稼動のエンタープライズデータセンター運用に最適化されており、最大限のアップタイムを確保するために、NVIDIA によって設計、構築、広範囲にテスト、サポートされています。
GPU 内の Root of Trust テクノロジを利用した Secure Boot および Measured Boot により、データセンターのセキュリティ層がさらに厚くなります。NVIDIA L40 は最新のデータセンター規格を満たし、NEBS レベル 3 に準拠しています。

受動冷却、フルハイト、フルレングス (FHFL)、デュアルスロットデザインなど、業界をリードする OEM ベンダーのさまざまなシャーシ構成に適合します。
NVIDIA L40 は 300W の最大ボード電力に対応し、電力効率に優れたハードウェアとコンポーネントによって駆動され、最適なパフォーマンス、堅牢性、耐久性を実現します。

参考販売価格： 1,370,000円（税込 1,507,000円）
短期レンタル価格：218,000円/月（税込 239,800円/月）
長期1年レンタル価格：87,000円/月（税込 95,700円/月）
発売時期：2023年3月
レンタルの詳細はこちら

NVIDIA L40
拡張性に優れたマルチワークロード

次世代グラフィックス

NVIDIA L40 は、データセンターのビジュアルコンピューティングワークロードに最高レベルのパワーとパフォーマンスをもたらします。

第 3 世代 RT コアと業界をリードする 48 GB の GDDR6 メモリは、前世代の最大 2 倍のリアルタイムレイトレーシングパフォーマンスを実現し、リアルタイム、完全忠実度、インタラクティブレンダリング、3D デザイン、ビデオストリーミング、仮想制作など、忠実度の高いクリエイティブワークフローを加速します。

パワフルなコンピューティングと AI

NVIDIA L40 には、トレーニング、推論、データサイエンス、グラフィックスアプリケーションなど、データセンターで実行されている幅広い計算負荷の高いワークロードを高速化する画期的な機能が含まれています。

最新の第 4 世代 Tensor コアは、強化された AI 機能を提供し、ビジュアルコンピューティングのワークロードを高速化し、ディープラーニングや推論アプリケーションに画期的なパフォーマンスを提供します。

NVIDIA L40
様々な要求に応じてパフォーマンスを発揮する設計

NVIDIA Omniverse Enterprise

データセンターの NVIDIA Omniverse^™ のエンジンとなる NVIDIA L40 は、エクステンデッドリアリティ (XR) アプリケーションや仮想現実 (VR) アプリケーション、デザインコラボレーション、デジタルツインなどのワークロードにパワーを与えるパワフルな RTX および AI の機能を提供します。きわめて複雑な Omniverse ワークロードのために、NVIDIA L40 は、マテリアルのレイトレーシングとパストレースによるレンダリングの高速化、物理的に正確なシミュレーション、フォトリアルな 3D 合成データの生成を可能にします。

レンダリングと 3Dグラフィックス

NVIDIA L40 でプロフェッショナル 3D ビジュアライゼーションアプリケーションを実行することで、クリエイティブプロフェッショナルはより多くのイテレーションを行い、より速くレンダリングし、驚異的なパフォーマンス上の利点を引き出し、生産性を上げ、プロジェクトの完了をスピードアップできます。
アーティストやデザイナーは複雑なジオメトリと高解像度のテクスチャを使用してリアルタイムで作業し、フォトリアルなデザインとシミュレーションを生成し、忠実度の高いクリエイティブワークフローを強化することができます。

高性能仮想ワークステーション

NVIDIA L40 を NVIDIA RTX™ 仮想ワークステーション (vWS) ソフトウェア* と組み合わせることで、データセンターやクラウドからあらゆるデバイスまで、最もパワフルな仮想ワークステーションを提供します。多くのクリエイティブやテクニカルのプロフェッショナルが、より強力なセキュリティのニーズを満たしながら、物理的ワークステーションに匹敵する堂々たるパフォーマンスをもって、きわめて要求の高いアプリケーションにどこからでもアクセスできます。

*NVIDIA 仮想 GPU ソフトウェアのサポートは、2023 年初めに登場予定です。

AIトレーニングとデータサイエンス

パワフルなトレーニングと推論のパフォーマンスをエンタープライズクラスの安定性および信頼性と組み合わせることで、NVIDIA L40 はシングル GPU AI のトレーニングと開発に最適なプラットフォームとなります。NVIDIA L40 は、FP8 を含むあらゆる精度のより高いスループットとサポートを提供することで、モデルのトレーニングと開発、データサイエンスのデータ準備、シミュレーションワークフローの完了までの時間を短縮します。

ストリーミングとビデオコンテンツ

NVIDIA L40 は、3 つのビデオエンコードエンジンと 3 つのビデオデコードエンジンにより、ストリーミングとビデオコンテンツのワークロードを一段上のレベルに引き上げます。AV1 エンコーディングの追加により、L40 はブロードキャストストリーミング、ビデオ制作、文字起こしのワークフローにおいて画期的なパフォーマンスと TCO の改善をもたらします。

NVIDIA L40 スペック

NVIDIA L40と、前世代 NVIDIA A40 GPUのスペックを比較しています。
参考価格となりますので、価格についてはお問い合わせください。

	NVIDIA L40 [PCIe]	NVIDIA A40 [PCIe]
参考販売価格	1,370,000円（税込 1,507,000 円）	870,000 円（税込 957,000 円）
発売時期	2023年3月	2021年1月
GPUアーキテクチャ	Ada Lovelace	Ampere
GPUメモリ	48 GB GDDR6	48 GB GDDR6
ECC機能	対応	対応
メモリバンド幅	864 GB/s	696 GB/s
メモリバス	384 bit	384 bit
Compute Capability	8.9	8.6
CUDAコア	18,176	10,752
RTコア	142	84
Tensorコア	568	336
NVLink	非対応	対応
ベースクロック	735 MHz	1,305 MHz
GPU Boost クロック	2,490 MHz	1,740 MHz
最大消費電力	300 W	300 W
補助電源	PCIe CEM5 16 pin	CPU(EPS) 8 pin
バスインターフェース	PCIe 4.0 × 16	PCIe 4.0 × 16
トランジスタ数	76.3	28.3
マルチインスタンスGPU	非対応	非対応

NVIDIA L40 性能

NVIDIA L40と、前世代 NVIDIA A40 GPUの性能を比較しています。

	NVIDIA L40 [PCIe]	NVIDIA A40 [PCIe]
FP64	N/A	N/A
FP64 Tensor Core	N/A	N/A
FP32	90.5 TFLOPS	37.4 TFLOPS
TF32 Tensor Core (スパース性機能)	90.5 TFLOPS (181 TFLOPS)	74.8 TFLOPS (149.6 TFLOPS)
RTコア性能	209 TFLOPS	73.1 TFLOPS
BFLOAT16 Tensor Core (スパース性機能）	181.0 TFLOPS (362.1 TFLOPS)	149.7 TFLOPS (299.4 TFLOPS)
FP16 Tensor Core (スパース性機能）	181.0 TFLOPS (362.1 TFLOPS)	149.7 TFLOPS (299.4 TFLOPS)
FP8 Tensor Core (スパース性機能）	362 TFLOPS (724 TFLOPS)	299.3 TFLOPS (598.6 TFLOPS)
ピーク INT8 Tensor TOPS (スパース性機能）	362 TOPS (724 TOPS)	299.3 TOPS (598.6 TOPS)
ピーク INT4 Tensor TOPS (スパース性機能）	724 TOPS (1,448 TOPS)	598.7 TOPS (1,197.4 TOPS)