产品中心
Product
首页 > 产品中心 > NVIDIA产品
返回

NVIDIA A10

NVIDIA A10 GPU 小型的单插槽 150W GPU 与 NVIDIA 虚拟化 GPU (vGPU) 软件结合使用,易于管理、安全且有弹性(可依照各种需求进行调整),范围涵盖绘图丰富的虚拟桌面基础架构 (VDI) 以及人工智能,为设计师、工程师、艺术家和科学家提供高效能。


配置及亮点


1. 第三代 Tensor 核心

NVIDIA Tensor 核心技术最先运用在 NVIDIA Volta™ 架构上,不只大幅加速人工智能,也将训练时间从数周降至数小时,同时显著提升推论速度。NVIDIA Ampere 架构以这些创新技术为基础,采用全新精度标准 Tensor Float 32 (TF32))与 64 位浮点 (FP64),以加速并简化人工智能应用,同时将 Tensor 核心效能拓展至高效能运算。


TF32 与 FP32 运作方式相同,无需更改任何程序代码即可将人工智能速度提升至最高 20 倍。透过 NVIDIA 自动混合精度,研究人员只要多加几行程序代码,就可以利用自动混合精度和 FP16 将效能提升 2 倍。通过支持 bfloat16、INT8 与 INT4,更能为人工智能训练和推论创造极致多元的加速器。


2. 第三代 NVLink

第三代 NVIDIA® NVLink® 可将 GPU 到 GPU 的直接带宽翻倍,达到每秒 600 GB (GB/秒),比第二代 PCIe 速度快近 10 倍。搭配最新一代 NVIDIA NVSwitch™ 使用时,服务器中的所有 GPU 都能透过 NVLink 全速相互交流,执行极高速的数据传输。


3. 结构化稀疏

现代人工智能网络相当庞大且越来越大,有数百万、甚至数十亿个参数。精准预测与推论不需要用到所有参数,而有些参数可以转换为零,以确保模型变「稀疏」的同时不会牺牲准确性。Tensor 核心最高可以将稀疏模型的效能提高 2 倍。将模型稀疏化对于人工智能推论有益,同时也能改善模型训练效能。


4. 第二代 RT 核心

NVIDIA Ampere 架构的第二代 RT 核心可大幅提升电影作品的拟真渲染、建筑设计评估,以及产品设计的虚拟原型制作等工作负载的速度。RT 核心还能加速光线追踪于动态模糊的渲染效果,以更快的速度获得更高的视觉准确度。在执行着色或噪声消除功能的同时,还能执行光线追踪。


专业功能及应用


NVIDIA A10 集高性能与低功耗于一身,可成为企业在 AI 推理、训练、图形和传统企业级计算工作负载等诸多方面的主流选择。


1. 远程协作


专为虚拟协作打造的开放式平台 NVIDIA OmniverseTM,使用人员连接设计工具、资源和项目,在虚拟世界中进行协作式迭代,以往复杂的创作、设计和工程视觉工作流程也随之改变。


2. 企业级


采用 NVIDIA RTX 虚拟化工作站软件,达到与实体工作站无异的优化效能与稳定性。虚拟化工作站采用的是 RTX 企业级驱动程序,经过 100 多个独立软件供应商 (ISV)的多种产业应用程序和认证的广泛测试。


3. 3D 可视化


运用 NVIDIA RTX™ 虚拟化工作站 (vWS)软件 来执行专业 3D 可视化。RTX 能以前所未有的速度完成无与伦比的 3D 设计、拟真模拟和令人惊艳的视觉效果。


4. 人工智能加速应用程序


运用 NVIDIA RTX. 将人工智能的强大功能运用于视觉运算。RTX 让开发人员能够创造人工智能应用程序,为终端用户带来前所未有的工作流程加速能力。如此一来就能透过智能操控影像、自动执行重复工作,以及优化需要高度运算的程序,来释出时间和资源,大幅加速艺术家和设计师的创作过程。


5. 交互式渲染技术


通过连结一个或多个服务器来提升虚拟桌面效能,进而在应用程序检视区中达到完整的互动与拟真可视化成果。运用共享的 GPU 加速数据中心资源集来执行虚拟化工作站和渲染节点,可提升生产力并更快速地完成项目。


规格


NVIDIA A10 Tensor Core GPU 采用单槽全长尺寸,被动式散热设计,核心基于 GA102-890 SKU,拥有 72 组 SM 单元,9216 个 CUDA 核心,其基础频率为 855 MHz,可加速至 1695 MHz,384-bit 位宽,24 GB GDDR6 显存、带宽 600 GB/s,兼容 PCIe 4.0。显卡的 TDP 为 150W,单 8-pin 供电接口。

NVIDIA A10(图1)


上一篇:NVIDIA A40