新闻动态
News
首页 > 新闻动态 > 最新动态
返回

NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍


2017-5-11


    老黄又曝核弹了!就在 GTC 2017 的演讲上,黄仁勋正式宣布了基于下一代的 Volta 架构的 Tesla V100,拥有 5120 个 CUDA 核心,16GB HBM2 以及 15 TFLOPS 的单精度性能,就连老黄自己都用了难以置信作为形容词。


2-210Q01620113D.jpg


    这块 Tesla V100 拥有 12nm 工艺,芯片面积为 815 平方毫米,高达 210 亿颗晶体管,内存带宽 900GB/s。而 Tesla V100 的任务与 P100 相似,主要负责高性能运算和深度学习。在相同条件和数量下,Tesla V100 能将性能提升 1 倍甚至更多,P100 上原本需要 20 个小时完成的任务量放到 Tesla V100 只需要不到 10 小时。


2-210Q01621064c.jpg


    现场老黄制止不住自己的兴奋劲,一连演示了三个不同的 DEMO。这块基于 Volta 的 GV100 核心现场怒怼 Maxwell 的 Titan X,一点不给老显卡任何一点面子。于此同时,塞满 Tesla V100 的 NVIDIA DGX-1 主机也被同时发布,内置 8 张 Tesla V100 显卡,原本 TITAN X 需要 8 天完成的运算量在这个盒子面前被压缩到了 8 小时。


2-210Q01622134K.jpg


    同时基于 Tesla V100 推出的还有 DGX 工作站,采用 4 张 Tesla V100,1500W 功耗,自带水冷,售价 69000 刀,重点是面向深度学习工程师。在现场老黄甚至忍不住调戏了一下 SkyLake,在大规模运算上的表现,Tesla V100 比 Intel 的 SkyLake 快上 15 到 25 倍。


NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍(图4)


NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍(图5)


NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍(图6)


    更重要的是上述的所有产品不会只停留在 PPT,产品会在今年第三季度问世,并在第四季度开始出货 OEM 产品。如果与 Pascal 时代相同,GV10x 系列的 GPU 将有机会登陆消费级显卡,并且性能表现不俗。不知道现在还在考虑如何降价的 A 卡们,现在是个什么心情。


2-210Q0162413S5.jpg


    与此同时,NVIDIA Drive PX 平台也获得了更新,丰田正式加入 NVIDIA 的自动驾驶阵营,而车载 Xavier SoC 则已经开始部署 Volta GPU。Volta 虽然距离正式发布还有一个季度,但 NVIDIA 已经为其设计好了工作站、计算中心、云计算、车载系统等多个场景,显然 NVIDIA 并没有打算留给任何对手任何喘气的机会。


NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍(图8)


NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍(图9)


NVIDIA Tesla V100 正式发布 5120 个 CUDA 性能再翻 1 倍(图10)




上一篇:干货 | 不懂 linux,不会 shell?如何快速玩转深