中兴通讯采用英特尔FPGA 在深度学习上取得性能突破
2017-02-07
英特尔和技术领先的电信设备和系统公司中兴通讯携手奠定深度学习和卷积神经网络 (CNN) 新基准。互联网搜索和人工智能领域众多公司都致力于提升该技术,例如图片搜索和匹配。
“拥有识别图像中的人脸等感知能力是中兴通讯 5G 系统的基本目标之一”,中兴通讯无线研究院副院长段向阳表示,“深度学习技术非常重要,因为移动边缘计算系统可凭借这项技术实现此类感知能力,进而提升中兴通讯 5G 系统的智能化水平。”
中兴通讯在中国南京的一批工程师利用英特尔的中端 Arria 10 FPGA 产品,对一款采用 CNN 算法的云推理应用进行了测试。
中兴通讯创造了一项新纪录---人脸识别速度超过每秒一千张图像---并达到其特定拓扑的理论精确度。英特尔 Arria 10 FPGA 使原始设计性能提速十倍以上同时保持算法精确度。
Arria 10 FPGA 拥有高达 1.5 TFLOP(1.5 万亿次浮点运算)的单精度浮点运算性能,115 万个逻辑元件,以及超过 1 Tb/秒的高速连接性。 此类深度学习设计可以从 Arria 10 FPGA 系列无缝迁移至高端英特尔 Stratix 10 FPGA 系列,用户可以期望得到多达 9 倍的性能提升。
除了性能的大幅提升之外,中兴通讯无线研究院的研究小组还能够利用 OpenCL 编程语言缩短设计时间。
“借助英特尔参考设计,并利用面向 OpenCL 的英特尔 SDK 编程 FPGA,大大缩短了我们的开发时间。”中兴通讯无线研究院总工程师熊先奎表示,“我们非常高兴基准测试取得了好成绩,并且非常感谢英特尔可编程解决方案事业部对我们项目的大力支持。”
来源:
计算及存储解决方案 - https://www.altera.com/solutions/industry/computer-and-storage/overview.html
英特尔Arria 10 FPGA – https://www.altera.com/products/fpga/arria-series/arria-10/overview.html
使用FPGA进行机器学习 - https://www.altera.com/solutions/industry/computer-and-storage/applications/machine-learning/machine-learning.html
测试配置:
本次基准测试使用的是一台搭载 4S 英特尔至强 E5-2670v3 处理器(运行频率 2.30GHz)和 128GB DDR4 内存的服务器;测试还使用了包含一块 10AGX115 FPGA、4GB DDR4 SODIMM、Intel Quartus Prime 软件以及 OpenCL SDK v16.1 的英特尔 PSG Arria 10 FPGA 开发套件。