您当前的位置: 首页 > 诗人故事

英伟达公布世界上第22快的超级计算机 DGX SuperPOD

2019-11-16 18:19:51
英伟达公布世界上第22快的超级计算机 DGX SuperPOD

6月18日消息,Nvidia 今天公布了世界上第22快的超级计算机 DGX SuperPOD,该超级计算机提供了人工智能基础设施,满足了该公司无人驾驶车辆部署计划的大量需求。这个系统是用96台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术在短短三周内建成的。 提供9.4千兆次的处理能力,它有能力训练安全自动驾驶汽车所需的大量深层神经网络,客户可以从任何 DGX-2合作伙伴购买本系统的全部或部分设计。自动驾驶汽车的人工智能训练是计算机密集型的终极挑战。

自动驾驶汽车一般来说都需要有一整套十分强大的硬件和软件来支持其在道路上的安全行驶。我们熟知的自动驾驶汽车开发的相关技术包括机器人技术、深度学习技术、计算机视觉技术和人工智能技术等,而这些技术产生的所有数据是都需要融合、分析和处理的,所以这就需要有非常高水平的计算能力。

NVIDIA表示,该系统的部署仅用了三周时间,使用了96台NVIDIA DGX-2H超级计算机和Mellanox互连技术。该系统提供了令人难以置信的9.4 PetaFLOPS(每秒9.4千万亿次浮点运算,peta:10的15次方,FLOPS:每秒浮点运算次数)的处理能力,以保证有足够的计算能力来训练安全自动驾驶所需的大量的深度神经网络。目前该系统被设计用于数据中心运行。DGX-2H服务器基本上是NVIDIA的DGX-2的增强版,具有16个Tesla V100 GPU,每个GPU运行450瓦,以及为提供最高性能而构建的更高频率的CPU。

处理自动驾驶汽车生成的大量数据对开发人员来说是一个挑战,例如,一个单独的数据收集工具每小时生成大约1兆字节的数据,但将其乘以整个车队行驶的时间(数年),它可以迅速地累积到数千兆字节的数据。

自动驾驶汽车收集的大量数据被用来训练算法,使其更像人(或者比人更好)驾驶,并在车辆中运行的深度神经网络中发现潜在故障,然后在连续循环中重新训练。DGX SuperPOD能够优化自动驾驶软件,并以比以前更快的周转时间来重新训练神经网络。深度学习对于自动驾驶汽车起着至关重要的作用,使软件根据经验变得越来越智能。

NVIDIA人工智能基础设施副总裁克莱门特·法拉贝特(Clement Farabet)表示:“人工智能在计算基础设施方面发挥着领导作用。几乎没有人工智能的挑战像训练自动驾驶汽车那样苛刻,它需要对神经网络进行数万次再训练,以满足极端的精确性需求,像DGX SuperPOD这样的大规模处理能力是无法替代的。”

NVIDIA说,DGX的硬件和软件DGX SuperPOD平台只需不到两分钟的时间就可以训练卷积神经网络ResNet-50。ResNet-50最常用于图像分类。

据英伟达官方网站报导,英伟达新发布的DGX SuperPOD超级计算机仅耗时3周就完成,采用了92台英伟达DGX-2H超级计算机与1536个V100 Tensor Core GPU,并利用其NVSwitch技术及Mellanox网络架构相互串连,拥有每秒9.4千万亿次浮点运算的处理能力,可让汽车业者、新创公司或研究机构用于训练自驾车应用所需的深度神经网络。

英伟达先前就已为全自驾应用推出了DRIVE Pegasus车用电脑及Drive Constellation自驾车模拟平台。不过自驾车人工智能(AI)系统的训练对市场而言一直是项终极挑战,毕竟一部自驾车每小时就可产生出约1TB的数据,若以每天8小时、一周5天来计算,再扩大到整个自驾车队经年累月所产生的数据便已达到PB等级,不难想象其规模之惊人,因此英伟达仍持续扩充相关解决方案的阵容。

SuperPOD可日以继夜不停运作以优化自动驾驶软件,用较过往更快的转回时间(turnaround time)重新训练神经网络。DGX SuperPOD软、硬件平台可在2分钟内完成ResNet-50神经网络模型的训练,该模型于2015年推出,而当时最先进的单台英伟达K80 GPU系统则花了25天才完成训练,如今DGX SuperPOD将训练速度提升了1.8 万倍。

除此之外,拥有类似效能水平的TOP500系统通常是采用数千台服务器来打造,SuperPOD与排名接近的超级计算机相比,体积缩小了约400倍。DGX SuperPOD除了能以超高速运行深度学习模型,其模块化的设计还能快速、有弹性地部署在企业级应用中。

英伟达 AI基础架构副总裁Clement Farabet表示,很少有AI方面的挑战像训练自驾车这般艰辛,为达到自驾车对精确度极严苛的要求,必须要对神经网络进行成千上万次的训练,而DGX SuperPOD超级计算机强大的处理能力堪称当今市场之最。

英伟达在汽车业本就有数百家合作伙伴,近期更进一步扩大与丰田汽车及奔驰母公司戴姆勒(Daimler)等业者的合作关系,如今DGX SuperPOD的推出将可望为英伟达在此领域的发展增添新助力。

一个单独的数据收集工具每小时产生1太字节的数据,这些数据被用来训练有关道路规则的算法ーー以及在车辆中运行的深层神经网络中发现潜在的故障,然后在一个连续的循环中重新训练这些神经网络。

据Nvidia 负责人工智能基础设施的副总裁提到,人工智能的领导力需要计算机基础设施的领导力。几乎没有人工智能的挑战比训练自动驾驶车辆更为艰巨,这需要对神经网络进行成千上万次的再训练,以满足极端精确性的需求。

通过1536 NVIDIA V100张量核心 gpu 与 NVIDIA NVSwitch 和 Mellanox 网络结构相互连接,DGX SuperPOD 可以处理数据,其性能堪比同等规模的超级计算机。该系统全天候工作,优化自动驾驶软件,重新训练神经网络,使其周转时间比以前快得多。

Nvidia DGX 系统已经被其他有着大量计算需求的组织所采用,从宝马(BMW)、大陆(Continental)、福特(Ford)和 Zenuity 等汽车公司,到 Facebook、微软(Microsoft)和Fujifilm等企业,以及理研(Riken)和美国能源部(Department of Energy)等国家实验室的研究领导者。这种规模的系统通常需要6-9个月才能部署完毕,但是 DGX SuperPOD 只需要3个星期,工程师们遵循一种规范的、经过验证的方法。

文章来源:DIGITIMES

生物谷药业
生物谷
生物谷
生物谷药业
生物谷药业
推荐阅读
图文聚焦