AI・グラフィックスおすすめGPU
NVIDIA L40Sは、2023年8月に発表されました。
NVIDIA L40S GPUは、48GB のGPUメモリを搭載し、第4世代TensorコアとTransformer Engine、新しい半精度性能(FP8)により、NVIDIA A100 Tensor Core GPUの推論性能を最大1.5倍上回ります。
また、18,176個のNVIDIA Ada Lovelace GPUアーキテクチャーCUDA® コアを搭載しており、NVIDIA A100(80GBメモリ)の約5倍の単精度性能 (FP32)を実現しました。
NVIDIA L40Sは、 142基の第3世代RTコア、GPUメモリ48GB GDDR6の搭載により、NVIDIA Ampereアーキテクチャー世代の最大2倍のリアルタイムレイトレーシング性能を実現。
美しく詳細なモデルやシーンの作成など、より忠実なグラフィックスを可能にします。
生成AIの爆発的な普及により、あらゆる業界で大規模なコンピューティングリソースを導入する必要性が高まっています。
パフォーマンス、効率、ROI向上のため、現代のデータセンターには、複雑なワークロード、高速コンピューティング、グラフィックス、ビデオ処理機能を提供する技術が必要です。
NVIDIA L40Sは、生成 AI や LLM (大規模言語モデル) の推論、3D グラフィックス、レンダリングやビデオまで、次世代のマルチワークロードを高速化します。
NVIDIA L40S 特徴
ユニバーサルな性能
単精度演算性能
91.6
TFLOPS
RTコア性能
212.0
TFLOPS
Tensor性能
1,466.0
TFLOPS
NVIDIA Ada Lovelace アーキテクチャ搭載
NVIDIA Ada Lovelace アーキテクチャは、プロ向けのグラフィックス、動画、AI、およびコンピューティングにおいて驚異的な性能を発揮するように設計されています。 GPU 性能のベースラインの劇的な向上は、AI、レイ トレーシング、ニューラル グラフィックスの転換点になりました。
第 3 世代 RTコア
ループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。
実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。
第 4 世代 Tensorコア
構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。
AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。
CUDA コア
単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。
混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。
Transformer Engine
Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。
Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。
DLSS 3
NVIDIA L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。
参考販売価格:1,500,000円(税込 1,650,000円)
短期レンタル価格:300,000円/月(税込 330,000円/月)
長期1年レンタル価格:140,000円/月(税込 154,000円/月)
発売時期:2023年9月
レンタルの詳細はこちら
NVIDIA L40S おすすめ用途
✓生成AI
NVIDIA L40Sは、NVIDIA A40と比較して最大5倍の推論性能を実現!
48GBのメモリ容量を備え、マルチモーダルの生成AIワークロードを高速化します。
✓LLMのトレーニングと推論
NVIDIA L40Sは、 AIのトレーニングと推論のワークロードを高速化します。
✓レンダリングと3Dグラフィックス
NVIDIA L40Sは、グラフィックスで忠実度の高いクリエイティブ ワークフローにパワーを与えます。
✓NVIDIA Omniverse
NVIDIA L40Sは、3Dワークフローとシミュレーションワークフローに優れたパフォーマンスを提供します。
NVIDIA L40S 性能比較
NVIDIA L40S | NVIDIA L40 | NVIDIA A40 | NVIDIA A100 | |
GPUアーキテクチャ | NVIDIA Ada Lovelace | NVIDIA Ampere | ||
GPUメモリ | 48 GB GDDR6 | 48 GB GDDR6 | 48 GB GDDR6 | 80 GB HBM2e |
FP64 | N/A | N/A | N/A | 9.7 TFLOPS |
FP32 | 91.6 TFLOPS | 90.5 TFLOPS | 37.4 TFLOPS | 19.5 TFLOPS |
RTコア性能 | 212 TFLOPS | 209 TFLOPS | 73.1 TFLOPS | N/A |
TF32 Tensor Core* | 366 TFLOPS | 181 TFLOPS | 150 TFLOPS | 312 TFLOP |
FP16/BF16 Tensor Core* | 733 TFLOPS | 362 TFLOPS | 299 TFLOPS | 624 TFLOPS |
FP8 Tensor Core* | 1,466 TFLOPS | 744 TFLOPS | N/A | N/A |
INT8 Tensor Core* | 1,466 TFLOPS | 744 TFLOPS | 598 TOPS | 1,248 TOPS |
* Specifications with sparsity
NVIDIA L40S スペック
NVIDIA L40S | ||
GPUアーキテクチャ | NVIDIA Ada Lovelace | |
GPUメモリ | 48 GB GDDR6 | |
メモリバンド幅 | 864 GB/s | |
CUDAコア | 18,176 | |
Tensorコア | 568 | |
RTコア | 142 | |
NVLink | 非対応 | |
冷却方式 | パッシブ | |
MIGサポート | なし | |
補助電源コネクタ | PCI Express CEM5 16pin電源コネクタ×1 | |
最大消費電力 | 350 W | |
サイズ | 高さ 111.15 mm 長さ 267.70 mm 2スロットサイズ(* ブラケット含まず) | |
保証期間 | 3年間 センドバック方式 | |
発売時期 | 2023年11月 |
NVIDIA GPU 一覧表PDF
弊社で取り扱っているNVIDIA GPUの性能・スペックを一覧にしました。PDFファイルをダウンロードすることができます。
お気軽にご相談ください!
製品に関するご質問・ご相談など、お気軽にお問い合わせください。
NVIDIA認定のエリートパートナー「GDEPソリューションズ」は、
お客様の用途に最適な製品のご提案から導入までサポートします。