产品中心
Product
首页 > 产品中心 > NVIDIA产品
返回

NVIDIA A40

全球功能极其强大的视觉计算数据中心 GPU


NVIDIA  A40(图1)


【配置及亮点】


NVIDIA Ampere 架构 CUDA® 核心

能将单精度浮点(FP32)吞吐量最高提升一倍,可以显著提高图形和模拟工作流程的性能,例如复杂的 3D 计算机辅助设计(CAD)和计算机辅助工程(CAE)。


第二代 RT Core

第二代 RT Core 的吞吐量是上一代的 2 倍,并能同时运行光线追踪和着色或降噪功能,从而大幅加快工作负载的运行速度,例如电影内容的逼真渲染、建筑设计评估和产品设计的虚拟原型创建。这项技术还可加速渲染具有光线追踪效果的动态模糊画面,从而更快更准确的获得视觉呈现。


第三代 Tensor Core

新的 Tensor Float 32(TF32)精度提供的训练吞吐量达到上一代的 5 倍,而且无需更改代码即可加速 AI 和数据科学模型的训练。从硬件上支持结构稀疏度使推理吞吐量提升一倍。 Tensor Core 还通过 DLSS、AI 降噪等功能将 AI 引入到图形处理中,并增强了特定应用程序的编辑功能。


48 GB 的 GPU 显存

A40 具有 48 GB 的 GPU 显存,并可通过 NVLink 扩展到高达 96 GB,满足数据科学家、工程师和创意专业人士的大容量显存需求,让他们能够处理大型数据集以及数据科学和模拟等工作负载。

超高速 GDDR6 显存,更先进,频率更高,更有利于提升显卡性能。


第三代 NVIDIA NVLink®

可连接两块 A40  GPU,从而将总显存扩展至 96 GB,以 112 GB/s(总带宽)的速度在 GPU 之间传输数据,实现应用性能的扩展。


虚拟化就绪

A40 与 vGPU 软件强强联手,带来的新一代改进能为远程用户提供更大、功能更强的虚拟工作站实例,从而提升高端远程设计、AI 和计算工作负载(如数据科学、深度学习和机器学习)的性能。


PCIe 第 4 代

PCI Express 第 4 代将 PCIe 第 3 代的带宽增加了一倍,因而提升了从 CPU 内存传输数据的速度,能更好地支持 AI、数据科学和 3D 设计等数据密集型任务。更快的 PCIe 性能还能加速 GPU 直接显存访问(DMA)传输,这在 GPU 与支持 GPUDirect® for Video 的设备之间提供了更快的视频数据 I/O 通信速度,从而带来强大的直播解决方案。A40 也兼容 PCIe 第 3 代,实施部署更具灵活性。


数据中心效率和安全性

NVIDIA A40 采用双插槽、高能效设计,与上一代相比能效提升 2 倍,可兼容全球 OEM 供应商生产的各式服务器。


【规格】


NVIDIA  A40(图2)

默认情况下,A40 配置为用于虚拟化而禁用物理显示连接器。 可以通过管理软件工具启用显示输出。




上一篇:暂无