新闻动态
全球最小AI超级计算机诞生!功耗仅为10瓦、尺寸不及一张信用卡
2019-11-13

英伟达Jetson Xavier NX可提供高达14 TOPS(功耗为10W时)或21 TOPS(功耗为15W时)的性能,能够并行运行多个神经网络,并在与Nano同样尺寸(70x45mm)的小巧外形中同时处理来自多个高分辨率传感器的数据。

文丨AutoR智驾 明阳

AI超级计算机体积正在变小,性能正在变强。

刚刚,在加利福尼亚州圣克拉拉英伟达宣布推出外观小巧,但功能强大的AI超级计算机Jetson Xavier TM NX,用于机器人和边缘嵌入式计算设备。

Jetson Xavier NX是Jetson家族的最新成员,该家族还包括Jetson Nano TM、Jetson AGX Xavie TM系列和Jetson TX2系列。

Jetson Xavier NX拥有比信用卡还小的紧凑外形(尺寸:70x45mm),节能型Jetson Xavier NX模块可在运行现代AI工作负载时,提供高达21 TOPS的服务器级性能,且功耗仅为10瓦,同时,提供了一套丰富的IO(输入/输出),从高速CSI和PCIe到低速I2C和GPIO。

此外,Jetson Xavier NX与Jetson Nano引脚兼容,支持共享硬件设计,用户利用Jetson Nano载板和系统即可升级到Jetson Xavier NX。

它还支持所有主要的AI框架,包括TensorFlow、PyTorch、MxNet、Caffe等。

更为惊喜的Jetson Xavier NX模块售价只要399美元,现在,开发者可以通过下载软件补丁,利用Jetson AGX Xavier 开发套件模拟Jetson Xavier NX进行开发。

英伟达副总裁兼边缘计算总经理Deepu Talla表示,“AI正在赋能现代机器人和嵌入式设备,将改变整个行业。在这其中,许多设备都受限于小尺寸和低功耗,而无法添加AI功能。有了Jetson Xavier NX,我们的客户和合作伙伴能够在不增加设备尺寸或功耗的情况下,大幅提高AI性能。”

Jetson Xavier NX靠什么大幅提高AI性能?

英伟达给出这样一组数据,Jetson Xavier NX可提供高达14 TOPS(功耗为10W时)或21 TOPS(功耗为15W时)的性能,能够并行运行多个神经网络,并在与Nano同样尺寸(70x45mm)的小巧外形中同时处理来自多个高分辨率传感器的数据。

Jetson Xavier NX GPU由384个NVIDIA CUDA core和48 个Tensor core的 NVIDIA Volta,外加2个NVDLA组成。

CPU层面则是配置6-core Carmel Arm 64位CPU, 6MB L2 + 4MB L3。

内存也表现的非常亮眼,8GB 128位LPDDR4x,具备51.2GB/秒读写速度。

在视频解码能力上支持2x 4K30 编码和2x 4K60,最多6个 CSI摄像头(通过虚拟通道最多36个),12路(3x4或6x2) MIPI CSI-2。

可以说,在AI超级计算机来临之际,Jetson Xavier NX为许多嵌入式边缘计算设备敞开了大门。

对于已经开始打造嵌入式计算机的公司,Jetson Xavier NX与所有Jetson系列产品一样都可以在相同的CUDA-X AI TM软件架构上运行,从而保证了快速推向市场的时间和较低的开发成本。

作为英伟达软件架构方法的一部分,Jetson Xavier NX由NVIDIA JetPack SDK TM提供支持。

JetPack SD TM是一个完整的AI软件堆栈,可以运行现代复杂的AI网络,并用于深度学习的加速库以及计算机视觉、计算机图形、 多媒体等。

Moor Insights & Strategy总裁兼首席分析师Patrick Moorhead这样评价,“在这个AI芯片发展日新月异的世界,我相信NVIDIA通过Jetson Xavier NX提升了行业水准。小尺寸、低功率的Jetson Xavier NX拥有卓越性能,并具备统一且强大的软件架构,对于嵌入式边缘计算来说至关重要。”

目前,Jetson Xavier NX已获得了机器人和嵌入式设备生态系统的强大支持。

Lockheed Martin公司应用AI总监兼首席架构师Lee Ritholtz表示,“NVIDIA嵌入式系列产品Jetson加速了嵌入式AI解决方案在Lockheed Martin公司平台上的研究、开发和部署,凭借Jetson Xavier NX的卓越性能、小巧外观和低功耗,我们将能够在边缘进行比以往更多的实时处理。”

Musashi Seimitsu首席执行官Otsuka Hiroshi表示,“我们的目标是大幅提高光学检测系统的质量和准确性,并加快向工业4.0迈进的步伐,”“NVIDIA Jetson Xavier NX为我们提供了计算能力,这可以在不增加光学检测系统的尺寸和功率的情况下,提高我们的视觉检测能力。”

伴随着新品发布,英伟达还宣布其在最新测定数据中心与边缘AI推理工作负载性能的基准测试中取得最快成绩。

这表示,英伟达在取得近期AI训练基准测试领先地位的同时又更进一步。

MLPerf Inference 0.5是业内首个独立AI推理基测套件,其测试结果证明了NVIDIA Turin TM数据中心GPU以及 NVIDIA Xavier TM边缘计算芯片系统的性能。

MLPerf的五项推理基准适用于一系列形式因素和四种推理场景,涵盖了图像分类、目标检测和翻译等已有的AI应用。

凭借Turing GPU所提供的目前市面上单处理器最高的性能,英伟达在全部五项针对于两种数据中心关注的场景(服务器和离线)的基准测试中均排在首位1。

Xavier是市面上针对两种边缘场景(单流和多流)性能最高的边缘和移动芯片系统2。

英伟达副总裁兼加速计算总经理Ian Buck表示:“AI正处于从研究阶段迅速转向大规模实际应用部署的临界点。AI推理是一项巨大的计算挑战。NVIDIA将业内最先进的可编程加速器CUDA-X AI算法套件与我们在AI计算领域的深厚知识相结合,能够帮助数据中心部署庞大且正在不断增长的复杂AI模型。”

由于重视其计算平台在各种AI工作负载中的可编程性与性能,因此英伟达是唯一一家提交了全部五项MLPerf基准测试结果的AI计算平台公司。

此前七月,英伟达就曾在多项MLPerf 0.6 AI训练基准测试结果中胜出,在训练性能方面创造了八项纪录。

英伟达 GPU在全球最大的云基础设施中为大型推理工作负载提供加速,这些云基础设施包括阿里云、AWS、谷歌云平台、微软Azure和腾讯等。

目前,AI正在朝操作和数据生成点的边缘移动。

沃尔玛、宝洁等全球首屈一指的企业和机构正使用NVIDIA EGX边缘计算平台与AI推理能力在边缘运行复杂的AI工作负载。

英伟达的所有MLPerf测试结果均采用NVIDIA TensorR TM 6 高性能深度学习推理软件获得。该软件能够在生产中轻松优化和部署数据中心、边缘等位置的AI应用。

此外,GitHub库还以开源形式提供新的TensorRT优化。

让我们期待接下来的纪录。

来源: AutoR智驾

赤同网络 技术支持&Powered by eLooie.com