Imagination发布PowerVR NNA神经网络加速器
2017-09-23
第一款具备支持从16位到4位高灵活度位宽的专用硬件解决方案
带宽最低的神经网络(NN)解决方案
其架构可支持多种操作系统,包括 Linux和 Android
2017年9月21日 ─ Imagination Technologies 宣布推出完整、独立式的硬件IP神经网络加速器,通过神经网络(NN)专用的PowerVR架构实现,可提供业界领先的面积效率。为移动、监控、汽车与消费系统开发SoC的公司将能以非常低的功耗,在最小的芯片面积中集成新款 PowerVR Series2NX NNA神经网络加速器,以实现神经网络的高性能运算。
包括卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)在内的神经网络正推动各个产业的爆发性技术进展。NNA是一种基本类型的处理器,预计会跟CPU和GPU一样重要,而这两类处理器Imagination均已能供应。NNA的潜在应用不计其数,其中包括AR/VR头戴设备中的特征检测与眼球追踪;汽车安全系统中的行人检测与驾驶员警觉性监控;智能监控系统中的脸部辨识与人群行为分析;网络诈欺检测、内容建议(content advice)、以及预测性UX;虚拟助理应用中的语音识别与回应;以及无人机中的防撞与对象追踪等。
根据嵌入式视觉联盟(https://www.embedded-vision.com)于2017年1月进行的嵌入式视觉开发人员调查显示,79%的受访者表示他们已经利用或正计划利用神经网络来执行其产品或服务中的计算机视觉功能。随着科技持续的快速进展,更多的公司都将能够利用神经网络来开发产品与服务。Imagination的客户已为安全、移动、汽车与机顶盒等多个市场开发与部署基于NN的系统。
嵌入式视觉联盟创始人Jeff Bier表示:“很多系统与应用程序开发人员正采用深度神经网络算法把新的感知功能带到他们的产品之中。在许多案例中,主要的挑战在于能为这些要求严苛的算法提供足够的处理性能,同时满足严格的产品成本与功耗限制。像PowerVR 2NX NNA 这类的专用处理器,是专为神经网络算法所设计,将能在许多新应用中推动这些强大算法的部署。”
随着神经网络日益普及,2NX NNA 这样的专用硬件解决方案 —— 与单纯的DSP解决方案相比,它可提供8倍的性能密度提升 —— 将能以最低的功耗与成本达到最高的性能。此外,一直以来,神经网络非常耗费带宽,因此内存的带宽需求会随着神经网络模型规模的增长而增加。这会为SoC设计人员和OEM公司在设计系统时,因为要提供NNA所需的带宽而带来重大的挑战。PowerVR 2NX能最小化外部DDR内存的带宽需求,确保系统的性能不会受到带宽的限制。PowerVR 2NX NNA专用硬件的普及应用,将能推动各种基于神经网络技术的应用程序进一步发展。
PowerVR 2NX NNA可实现最高效率的解决方案
PowerVR 2NX是从头开始全新设计的架构,可提供:
?业界最高的单位毫瓦推理 (inference/mW) IP内核,以提供最低的功耗*
?业界最高的单位面积推理 (inference/mm2) IP内核,可实现最具成本效益的解决方案*
?业界最低带宽的解决方案*——支持权重与数据的高灵活性位宽,包括低至4位的低带宽模式
?业界领先的性能,单一内核为每周期2048 MAC,并可采用多核设计进一步提升性能
?在硬件架构的基础上提供了最全面的系统级的神经网络解决方案
Imagination公司 PowerVR 产品与技术营销资深总监 Chris Longstaff 表示:“神经网络加速的专用硬件将成为未来SoC的标准IP模块,就如同CPU和GPU一样。我们很高兴率先向市场推出完整的硬件加速器,能完全支持高精准度的灵活方式,使神经网络能以最低的功耗与带宽运作,并提供优于竞争对手方案的绝对性能与单位面积性能。我们提供的工具将能让开发人员非常快速地启用并执行其神经网络,因此能快速增加营收。”
2NX包括硬件IP、软件与工具,可为SoC提供完整的神经网络解决方案。它能有效地执行所有常见的神经网络运算层。依据推理任务的运算需求,它能独立使用 ─ 无须额外的硬件 ─ 或是与CPU和GPU等其它的处理器结合运用。
神经网络无所不在
PowerVR 2NX NNA是专为适应多种市场的推理引擎所设计,其高度可扩展架构适用于未来的更多应用市场。
移动:随着Tensorflow Lite以及 Android API的即将发布,再加上Caffe2Go架构的快速进展,我们将看到智能手机AI应用程序数量的快速爆发。公司需要高效率的方式来执行包括影像辨识、语音辨识、计算摄影等在内各种的推理任务。PowerVR 2NX是现今唯一的一套IP解决方案,能以低功耗、小面积、MMU和对Android的支持,来满足移动解决方案部署的所有需求。在GPU不可或缺的移动设备中,公司能把新的 PowerVR Series9XE或 9XM GPU与 2NX NNA在相同的芯片中搭配运用,以作为独立式GPU。其优异的性能足以和业界的独立式GPU竞争。
智能监控:家庭与商业场所安装的监控摄影机数量正大量增加,将推动神经网络视觉处理的需求。基于这些技术的智能型摄影机能被用来根据安全警示、零售分析、人口统计与互动数据来制定决策。考虑带宽需求、数据机密性与其他因素,摄影机的设计必须加入一定程度的“网络边缘”(edge) 视频信息分析处理的能力。由于这些摄影机通常没有GPU或是仅有非常小的GPU,以及较低性能的CPU,因此它们需要一个高效率、高性能的独立式神经网络加速器。2NX NNA是理想的选择,并且具备高度可扩展性,能同时满足消费性与商用的需求。
汽车:汽车的神经网络应用包括驾驶员警觉性监测、驾驶员视线追踪、座位使用、路标检测、驾驶路线分析、道路使用者检测、驾驶员辨识以及其他。随着未来几年自动驾驶汽车与智能型运输系统的数量将日益增加,这些应用将持续扩展。在汽车系统中,需要2NX NNA 这样的完整硬件解决方案,才能满足相关的性能需求。
家庭娱乐:机顶盒和电视将逐渐提供基于神经网络的解决方案,例如能够适应特定使用者偏好的能力,提供自动的儿童锁,以及根据使用者行为自动暂停与录制节目。凭借这些特性,公司能提升其差异性并增加营收。要在这些设备上构建神经网络的关键是高效率的带宽与低成本,以及支持NN API ─ 这些都是2NX NNA的重要特性。此外,还有许多新兴的NNA娱乐应用,包括AR/VR。
睿悦信息Nibiru是一家移动VR与AR的技术与服务供应商,该公司的共同创始人兼副总裁 Tony Chia表示:“来自合作伙伴Imagination的创新技术是确保VR解决方案可为消费者提供高度沉浸式游戏与视觉体验的重要关键。我们对神经网络在VR/AR的潜在应用感到非常振奋,包括追踪、控制、姿势辨识、语音辨识、以及能增加更多的互动体验。内置 PowerVR 2NX NNA的芯片组可提供所需的处理能力与功耗效率,把VR/AR体验推升到全新的境界。”
简化开发人员的工作
Imagination可为开发人员提供所有必要的工具,让他们能快速、轻松地启用和执行其神经网络,并确保运算带宽能与准确度完美平衡。PowerVR 2NX的开发资源包括映射 (mapping) 和微调工具、样本网络、评估工具与文件。完整的 PowerVR NX Mapping Tool 能从业界标准的机器学习框架,包括Caffe 和 Tensorflow,轻松进行转换。高级的网络设计人员将能在2NX NNA 上设计与构建神经网络,以充分发挥其硬件特性。
Imagination也可提供通用的Imagination DNN (深度神经网络) API,能在CPU、GPU与NNA之间轻松转换。此单一的API能够跨多种SoC配置执行,因此能在现有设备上轻松开发原型。c