算力大爆炸时代,加速云的FPGA有啥妙招在手?
2018-05-11
AlphaGo在围棋上对人类的“肆虐”让人工智能火了,这个1956年就诞生的词汇为什么在近两年再次被推到了风口浪尖之上?这背后离不开三大要素:算法、数据、算力。而算力是附着于芯片之上,没有芯片,人工智能就是一纸空谈。
那么问题来了,怎样的芯片才是人工智能的最佳助推器?
众所周知,GPU 最早是为生成基于多边形网络的计算机图形而设计的。在最近几年,由于计算机游戏和图形引擎领域的需求和复杂度需要,GPU积累了强大的处理性能。英伟达是 GPU领域的领军者,能生产有数千个内核的处理器,这些内核的设计工作效率可以达到 100%。实际上这些处理器也非常适用于运行神经网络和矩阵乘法方面的计算。
那素有“芯片皇冠上的明珠”之称的FPGA又处于什么地位呢?
加速云创始人兼CEO邬刚,拥有15年以上FPGA领域经验,在接受与非网记者采访时也只能表示:“在深度学习领域,FPGA并不是全部能够搞定。”但是FPGA也拥有让这个领域无法拒绝的理由。
加速云创始人兼CEO 邬刚
“对低延时要求很高的场景,只能选择FPGA;在做LSTM方面,GPU很烂,FPGA很强;虽说FPGA不能做训练,但所有ASIC的前提都是FPGA的战场,因为它是可配置的处理器。与专用神经网络处理器相比,FPGA的优势就是开发周期短。”为FPGA站台的这份自信,不仅得益于技术本身,还有加速云存在的意义让邬刚感怀良多。
在2018年4月27日,加速云推出了四大产品:两个系列硬件加速产品(SC-OPS, SC-VPX)、两个IP库 (FDNN, FBLAS)、三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案)。
工控是一个绝佳选择
2014年10月英特尔在IDF大会上宣布X86+FPGA处理器,本就有用FPGA来做异构计算的邬刚开始“心动”了。这个时代对高效计算系统的贪婪,让异构计算被推到了时代的前沿。而加速云选择了工控领域来展现X86+FPGA的实力,为什么做出这个选择呢?
邬刚表示:“一方面传统工控机就是PC,采用的是比笔记本低两代的芯片,无法满足日益复杂的控制算法。其次,工控领域是一个强实时的领域,而FPGA具有纳秒级的反应。并且,随着工业领域传感器不断增多,人工智能概念的不断渗透,传统PC是扛不住的。”
据资料显示,加速云的基于FPGA的智能工控加速方案采用Intel Arria GX660器件,单颗芯片集成1.5TFLOPS单精度浮点处理能力,提供PCLe3.0高速接口与X86系统互联,支持40Gbps的传输带宽,根据客户需求定制PCIE3.0/USB3.0/SATA3.0/HDMI/DVI/MIPI/CSI多种高速IO接口,也支持CAN/UART/SPI/TTL等低速扩展接口。支持高性能计算FBLAS库和深度学习FDNN库,支持OPenCL开发支持包。
在谈及FPGA的短板,邬刚毫不避讳的谈到FPGA的生态与GPU比,可以用烂来形容。GPU的生态靠英伟达常年积累而成,而现在的FPGA生态只处于GPU做库达的阶段。邬刚表示:“虽然FPGA的设计思想不一样,但还是希望干出一个类似CUDN库的东西。未来FPGA也越来越不像FPGA,我们也在发展上层语言,来弥补生态,这需要时间,这也是我们这种公司存在的理由。”
参会嘉宾参观展台