自动驾驶算法与芯片设计
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4.1 GPU

NVIDIA PX2平台是当前领先的基于GPU的自动驾驶解决方案。每个PX2都包含两个Tegra SoC和两个Pascal图形处理器。每个GPU都有专用的内存,以及用于DNN加速的专用指令。为了提供高吞吐量,每个Tegra都使用PCI-E Gen 2×4总线直接连接到Pascal GPU(总带宽为4.0GB/s)。此外,双CPU-GPU集群通过千兆以太网连接,可提供70GB/s的速度。通过优化的I/O架构和DNN加速,每个PX2每秒可以执行24万亿次深度学习计算。在运行AlexNet深度学习工作负载时,每秒可以转换2800张图像。