Achronix的FPGA技术可优化用于工业4.0及5.0的人工智能(WP027)
2022-02-16
来源:Achronix
简介
在过去三百年间,工业领域取得了长足的进步。机器设备最初于18世纪问世,主要以水和蒸汽为动力,并引发了18世纪末的工业革命(通常被称为工业1.0)。尽管流水组装线的概念可以追溯到中国古代的青花瓷制作,但直到19世纪末,亨利·福特才设立了第一条电动流水线,形成了工业2.0的框架。
自动化和计算机技术于1960年代末期开始崭露头角,并构成了工业3.0的雏形,为如今驱动着工业4.0的自动化、人工智能(AI)和网络化解决方案铺平了道路。虽然这幅图景中似乎已经看不见人类的身影,但工业5.0将带领我们返璞归真,利用AI驱动的机器人系统所具有的精准和高效,与人类大脑的奇思妙想和实时思考有机结合,创造出更理想的制造环境。
图1:工业技术的演进
人工智能
人工智能(AI)是计算机科学的一个分支,主要专注于开发能够模拟人类行为的机器。这类设备的范畴林林总总,从可以简单地执行算法,到可以自主从周边环境中学习、无需人类介入便自行调节算法。机器学习(ML)是人工智能的子集,它通过运用数据集衍生的统计模型来改进特定任务。作为机器学习的子集,深度学习(DL)运用了多层神经网络,不仅能执行基础的机器学习推理,还能学习新的数据,从而获得更高层的认知能力(见下图)。在本篇白皮书中,所有机器学习和深度学习都将被简称为ML。
图2:人工智能/机器学习/深度学习谱图
人工智能(AI)的常见用例包括先进驾驶辅助系统(ADAS),即自动驾驶汽车的支柱;语音识别及合成(例如华为的Celia);医疗诊断;数据与网络安全;金融服务预测性模型(例如电子化交易),或电商与流媒体服务推荐;当然还有工业制造。
随着工业4.0在2010年代早期进一步演进,使得AI在制造环境中的重要性与日俱增。如今,许多应用都会利用AI来促进制造和业务经营、流程、安保和供应链等更加流畅高效。通过运用预测性算法,AI可以监控设备状况,优化维护日程,最终还能预报机械故障。
与制造相关的物料供应链管理也可以充分发挥预测算法的优势,保障流程能够顺利、高效地持续运作。AI算法还可以参考过往和现在的商业需求,从而协助预测未来的业务。这些AI系统可以与供应链和库存管理系统结合,加快获利时效,降低间接成本。机器人早在工业3.0就成为了其中重要的组成部分。而在我们即将迎来工业5.0之际,这些机器人系统必须拥有适应性的AI算法(主要为DL算法)。它们不仅需要自主学习,还必需能够解读人类的实时输入。低时延的实时适应能力也将成为不可或缺的要素。
AI之外的生态系统组件
在持续兴旺发展的工业4.0和正在演进的工业5.0中,AI依然是一个重要的组成部分。然而,AI算法的蓬勃发展离不开实时数据。物联网(IoT)是由互联的电子设备组成的系统,可以从模拟和数字世界中获取与接收数据。时间、压力、温度、速度、角度及视听数据源必须经过采集,随后转换成结构化数据,各类基于AI的系统才能对其进行分析和控制。和4G网络相比,自2019年起部署的5G网络(在韩国率先部署)可提供100倍的带宽(最高可达10 Gbps)和500倍的信道数量。5G网络与IoT结合之后,海量的输入数据在计算机领域中引出了一种新范式,即对数据加速器的需求。
数据加速器
在海量的数据面前,数据中心处理数据的负担以及发现数据背后的意义这些工作,已经令传统的计算服务器模式不堪重负。过去应对数据激增的方法就是在数据中心增添服务器。服务器安装规模的提升不仅提高了资本性支出,再加上设备的运行和冷却需要消耗更多能源,营运性支出也随之水涨船高。
取决于数据加速器的类型与负载,服务器中单个数据加速器的运算能力可以与15台服务器匹敌,从而大幅削减了资本性支出和营运性支出。基于硬件的数据加速器还带来了更多效益,例如较低的时延和更高的稳定性,这在车辆自动驾驶、工业4.0/5.0、金融服务和其他对时延要求较高的用例中效果尤为突出。优秀的数据加速器还有最后一项特征,它具备了出色的灵活性,能够适应ML/DL算法的变化,包括算法本身的调整、负载的变化和/或ML/DL算法数据集的更新。
数据加速的赛场上有三种各异的硬件方式,即GPU、FPGA和定制ASIC。如下图所示。CPU的灵活性始终是最出色的,但与其他专用数据加速器相比,在能耗、性能和成本方面存在一定的劣势。其它选项便是GPU、ASIC和FPGA。ASIC的效率与性能最为出色,但功能完全固定,缺乏必需的灵活性,无法适应AI算法的变化、新兴技术的参数改动、供应商要求和负载优化。GPU是传统核心数据中心的主力,仅限于纯粹运算这样的使用场景,而不能提供大多数场景中需要利用到的联网与存储加速的能力,并且能耗和成本较高。FPGA可以加速联网、运算和存储,速度与ASIC相仿,也具备了必需的灵活性,能够为如今的核心与边缘数据中心提供理想的数据加速。除了数据加速之外,FPGA还将在传感器融合和传入数据流合并等领域发挥关键作用,为数据消费打下了坚实的基础。
图3:CPU、GPU、FPGA和ASIC的对比
Achronix提供的精选产品
Achronix为AI/ML运算、联网和存储应用开发了基于FPGA的数据加速产品。与其他高性能FPGA企业不同,Achronix可同时提供独立FPGA芯片和嵌入式FPGA半导体知识产权(IP)解决方案。除了独立的FPGA芯片和eFPGA IP之外,Achronix还提供基于PCIe的加速卡,可用于开发、实地测试或生产等应用场景。
采用台积电7纳米工艺打造的Speedster®7t系列FPGA拥有业界最快的输入/输出速度,可支持400 GbE、PCIe Gen5和双存储接口:标准DDR4和GDDR6存储接口可以带来的惊人速度,相较于DDR4提高了600%。如果数据无法轻松通达FPGA逻辑阵列,高速接口便无法发挥太多作用。
为了避免遇到这一瓶颈,Achronix从架构增加了二维片上网络(2D NoC),能够有效充当所有外部输入/输出数据的高速通道,增强了FPGA内部的功能单元块和FPGA逻辑阵列本身。这种2D NoC实现了超过20 Tbps的双向带宽,远远超过了输入/输出和功能块的总带宽需求,消除了片内通信的时延问题。
在对成本、性能与能耗有较高敏感度的大批量应用场景中,用户通常会采用ASIC,但这时又该如何满足对灵活性的需求呢?无论是算法的演变、需求变化、供应商和经营者的具体要求、协议适配,还是功能系统单元块的多样接口,它们都对灵活性提出了一定程度的要求。
Speedcore™ eFPGA IP便是这一问题的最终答案,它可令ASIC能够具备“恰到好处”的灵活性。其中查找表(LUT)、内存、DSP/MLP和2D NoC的资源量与组合方式可由ASIC开发者决定,Achronix则会为他们的ASIC或SoC设计提供集成在芯片上的定制IP。
VectorPath™加速卡是采用PCIe外形结构的硬件加速平台,可以考虑用作评估、开发与现场测试工具,或也可以用于量产应用。该解决方案也可以根据用户的具体要求量身定制。
结语
AI、ML和DL将继续推动工业4.0和5.0的发展,使生产力与效率更上层楼。在IoT和5G技术的协助下,自动化和机器人将与人类的奇思妙想和创造力融为一体,孕育出人类在10年前未曾想象的制造环境。FPGA促成了传感器融合,能够与众多物联网设备连接,充分把握制造环境下人工智能系统所需的高性能与灵活性之间的平衡。