NVIDIA L40为数据中心提供出色视觉计算性能。
从虚拟工作站应用到大规模建模和仿真,现代视觉计算和科学工作流处理的任务数量不断增长,复杂程度不断提高。企业需要可提供超强性能并借助多种功能实现扩展的数据中心技术,以便在处理日益复杂的工作负载时,满足其多样化的计算需求。
NVIDIA? L40 GPU 为数据中心带来出色的视觉计算性能,提供新一代图形、计算和 AI 功能。NVIDIA L40 基于革命性的 NVIDIA Ada Lovelace 架构构建,利用新一代 RT、Tensor 和 CUDA Core 核心的强大功能,为要求严苛的数据中心工作负载提供突破性的可视化和计算性能。
加速新一代工作负载
NVIDIA Omniverse? Enterprise
渲染和 3D 图形
搭载 NVIDIA RTX 虚拟工作站 (RTX? vWS) 软件的高性能虚拟工作站
AI 训练和数据科学
串流和视频内容
NVIDIA L40技术规格:
外形规格 | L40 | L40S |
GPU Architecture | Ada Lovelace | Ada Lovelace |
GPU 显存 | 48GB | 48GB |
GPU 显存带宽 | 864GB/s | 864GB/s |
CUDA Cores | 18176 | 18176 |
RT Cores | 142 | 142 |
RT Cores Performance TFLOPS | 209 | 209 |
Tensor Cores | 568 | 568 |
FP32 TFLOPS | 90.5 | 91.6 |
FP32 Tensor Core TFLOPS | 90.5 | 183 |
BFLOAT16 Tensor Core TFLOPS | 181.05 | 362.05 |
FP16 Tensor Core TFLOPS | 181.05 | 362.05 |
FP8 Tensor Core TFLOPS | 362 | 733 |
Peak INT8 TOPS | 362 | 733 |
Peak INT4 TOPS | 724 | 733 |
显示端口 | 4×DP 1.4a | 4×DP 1.4a |
PCIe Generation | PCIe Gen4×16 | PCIe Gen4×16 |
最大热设计功率 (TDP) | 300 | 350 |
由 NVIDIA Ada Lovelace 架构提供支持
第三代 RT Core
增强的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,加速产品设计和架构、工程和施工工作流的渲染。借助硬件加速的动态模糊技术,提供令人惊叹的实时动画效果,从而了解逼真设计的实际应用情况。
第四代 Tensor Core
硬件支持面向结构化稀疏和优化的 TF32 格式,为更快的 AI 和数据科学模型训练提供开箱即用的性能提升。加速 AI 增强型图形功能(包括 DLSS),在选定应用中提供更高分辨率和更出色的性能。
大容量显存
超快 GDDR6 显存容量高达 48GB,可处理显存密集型应用和工作负载,例如数据科学、仿真、3D 建模和渲染。使用 vGPU 软件为多个用户分配显存,以便在创意、数据科学和设计团队中分配大型工作负载。
数据中心就绪型
NVIDIA L40 专为全天候企业数据中心运营而设计,配备节能高效的硬件和组件,经过优化后,可大规模部署,并为各种数据中心工作负载提供卓越性能。L40 包括搭载硬件信任根技术的安全启动,可提供额外的安全层,并且 L40 已达到 NEBS 3 级标准,符合新的数据中心标准。L40 采用被动冷却、节能高效的双插槽设计,适用于知名 OEM 供应商的各种 NVIDIA 认证系统?。