AI・グラフィックスおすすめ!サーバー向けGPU

NVIDIA L40Sは、2023年8月に発表されました。

NVIDIA L40S GPUは、48GB のGPUメモリを搭載し、第4世代TensorコアとTransformer Engine、新しい半精度性能(FP8)により、NVIDIA A100 Tensor Core GPUの推論性能を最大1.5倍上回ります。

また、18,176個のNVIDIA Ada Lovelace GPUアーキテクチャーCUDA® コアを搭載しており、NVIDIA A100(80GBメモリ)の約5倍の単精度性能 (FP32)を実現しました。

NVIDIA L40Sは、 142基の第3世代RTコア、GPUメモリ48GB GDDR6の搭載により、NVIDIA Ampereアーキテクチャー世代の最大2倍のリアルタイムレイトレーシング性能を実現。
美しく詳細なモデルやシーンの作成など、より忠実なグラフィックスを可能にします。

生成AIの爆発的な普及により、あらゆる業界で大規模なコンピューティングリソースを導入する必要性が高まっています。
パフォーマンス、効率、ROI向上のため、現代のデータセンターには、複雑なワークロード、高速コンピューティング、グラフィックス、ビデオ処理機能を提供する技術が必要です。

NVIDIA L40Sは、生成 AI や LLM (大規模言語モデル) の推論、3D グラフィックス、レンダリングやビデオまで、次世代のマルチワークロードを高速化します。

NVIDIA L40S 特徴

l40s-social-siggraph-23

ユニバーサルな性能

単精度演算性能

91.6 
TFLOPS

RTコア性能

212.0 
TFLOPS

Tensor性能

1,466.0
TFLOPS

NVIDIA Ada Lovelace アーキテクチャ搭載

NVIDIA Ada Lovelace アーキテクチャは、プロ向けのグラフィックス、動画、AI、およびコンピューティングにおいて驚異的な性能を発揮するように設計されています。 GPU 性能のベースラインの劇的な向上は、AI、レイ トレーシング、ニューラル グラフィックスの転換点になりました。

第 3 世代 RTコア

ループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。

実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。

第 4 世代 Tensorコア

構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。

AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。

CUDA コア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。
混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。

Transformer Engine

Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。

Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。

DLSS 3

NVIDIA L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。

参考販売価格:1,500,000(税込 1,650,000円)
短期レンタル価格:300,000円/月(税込 330,000円/月)
長期1年レンタル価格:140,000円/月(税込 154,000円/月)
発売時期:2023年9月
レンタルの詳細はこちら

NVIDIA L40S おすすめ用途

✓生成AI

NVIDIA L40Sは、NVIDIA A40と比較して最大5倍の推論性能を実現!
48GBのメモリ容量を備え、マルチモーダルの生成AIワークロードを高速化します。

✓LLMのトレーニングと推論

NVIDIA L40Sは、 AIのトレーニングと推論のワークロードを高速化します。

✓レンダリングと3Dグラフィックス

NVIDIA L40Sは、グラフィックスで忠実度の高いクリエイティブ ワークフローにパワーを与えます。

✓NVIDIA Omniverse

NVIDIA L40Sは、3Dワークフローとシミュレーションワークフローに優れたパフォーマンスを提供します。

NVIDIA L40S 性能比較

NVIDIA L40SNVIDIA L40NVIDIA A40NVIDIA A100
GPUアーキテクチャNVIDIA Ada LovelaceNVIDIA Ampere
GPUメモリ48 GB GDDR648 GB GDDR648 GB GDDR680 GB HBM2e
FP64N/AN/AN/A9.7 TFLOPS
FP3291.6
TFLOPS
90.5
TFLOPS
37.4
TFLOPS
19.5
TFLOPS
RTコア性能212
TFLOPS
209
TFLOPS
73.1
TFLOPS
N/A
TF32 Tensor Core*366
TFLOPS
181
TFLOPS
150
TFLOPS
312
TFLOP
FP16/BF16 Tensor Core*733
TFLOPS
362
TFLOPS
299
TFLOPS
624 TFLOPS
FP8 Tensor Core*1,466
TFLOPS
744
TFLOPS
N/AN/A
INT8 Tensor Core*1,466
TFLOPS
744
TFLOPS
598
TOPS
1,248
TOPS

* Specifications with sparsity

NVIDIA GPU 一覧表PDF

弊社で取り扱っているNVIDIA GPUの性能・スペックを一覧にしました。PDFファイルをダウンロードすることができます。

List_NVIDIA-GPUs_202402
2024年2月版
(2024年3月6日掲載)

NVIDIA L40S スペック

NVIDIA L40S
GPUアーキテクチャNVIDIA Ada Lovelace
GPUメモリ48 GB GDDR6
メモリバンド幅864 GB/s
CUDAコア18,176
Tensorコア568
RTコア142
NVLink非対応
冷却方式パッシブ
MIGサポートなし
補助電源コネクタPCI Express CEM5 16pin電源コネクタ×1
最大消費電力350 W
サイズ高さ 111.15 mm
長さ 267.70 mm
2スロットサイズ​(* ブラケット含まず)
保証期間3年間 センドバック方式
発売時期2023年11月

お気軽にご相談ください!

製品に関するご質問・ご相談など、お気軽にお問い合わせください。

NVIDIA認定のエリートパートナー「GDEPソリューションズ」は、
​ お客様の用途に最適な製品のご提案から導入までサポートします。