大数据分析价值凸显,FPGA加速在数据中心应用前途大好
2018-05-11
数据在源源不断产生,数据中心需要越来越多的存储设备承载数据,同时也要通过大量计算将无序的数据加以提取,形成有用信息,从而服务于人们的生活。面对海量的数据分析,只凭借CPU来进行大数据计算远远无法满足需求,因此设计人员想到为数据中心加速。一般加速分为两种,第一是基于ASIC的可以针对特定应用进行加速的专用加速器,另一种是可以降低用户运营和数据分析成本的通用加速器,FPGA适用于多种场景。
作为全球最大的数据中心供应商,如今英特尔在从PC公司转向以数据为中心的企业。为了更好地服务于数据中心业务,英特尔早在2015年就收购了Altera公司,让FPGA与CPU结合为客户提供更好的解决方案,在2017年英特尔大力推动了FPGA易用性。据英特尔公司可编程解决方案事业部亚太区市场拓展经理刘斌介绍,“体现在三方面:第一,推出基于英特尔 Arria 10 GX FPGA的英特尔可编程加速卡;第二,推出面向英特尔至强CPU和FPGA的加速堆栈;第三,加速器功能的生态系系统。”
加速堆栈:增强性能,化繁为简
如今的数据中心支持虚拟机,在云数据中心迁移时,考虑到基于FPGA的云储机和隔离问题,非常有必要和通用加速卡做成软件栈,支持云化卡。刘斌表示,“这样的软件堆栈的价值有三点:第一,为开发人员节省时间,比如像数学家、金融分析师等用户,不需要了解FPGA如何使用就可以完成自己的需求,可以专注于提高解决方案的独特价值;第二,因为FPGA是通用接口,从一个公有云到另一种公有云移植时,可以通过通用接口快速迁移,不需要做两套方案,用户可以复用代码;第三,支持开发商和生态系统更轻松地开发和部署英特尔 FPGA以优化工作负载。”
这套平台开发工具OPAE(开放可编程加速引擎)是开源的,开源的优势在于合作伙伴可以基于OPAE继续开发产品,就像苹果iOS生态系统一样,很多客户可以基于iOS开发自己的APP。另外,加速软件堆栈是免费的,客户可以从网上直接下载。总之,加速堆栈提供了一种软件开发环境,确保庞大的开发人员社区能够受益于 FPGA 的卓越性能和灵活性。未来这些软件平台会统一,在英特尔的软件平台上可以访问所有的软件平台。
英特尔的加速卡更有质量保证
关于数据中心加速,早在几年前就已经有人提出了异构形式,英特尔的FPGA和处理器的发展相一致,可编程加速卡堆栈和至强处理器相整合,加速卡会不断在英特尔工艺上进行升级。另外,加速卡是FPGA进入计算领域的一种形态,未来也有其它方式的产品。”
刘斌指出,“我们和加速卡厂商是合作伙伴,市场需要不停加热,客户需求会有差异性,我们不指望一种加速卡解决所有问题,但是我们给加速卡厂商优先的支持。目前看,市场上没有哪家公司在做堆栈能实现真正质量级的保证,我们将加速器和软件整合到一起,未来英特尔出加速卡会自己适配起来。”
现在,采用英特尔PAC的戴尔服务器已经大量上市,其中富士通支持重点客户使用;在常见的软件开发环境中提供通用硬件加速性能;面向财务风险分析和数据库加速的高性能解决方案。
英特尔给出两个案例:财务风险分析和加强数据库性能
财务风险分析
财务风险分析的主要挑战在于:数据量高达若干TB,计算密集型;模型持续演进,纯软件实现存在性能限制。通过PAC方案及加速软件堆栈,使Levyx公司的效率大幅度提升,相比传统spark实施,每符号算法加速提升850%,端到端期权交易模拟加速是过去的2倍以上。
数据库加速
以前的方案,ETL环节耗时,不能达到实时效果,从分析数据仓库到业务分析无法执行复杂的实时分析。通过FPGA加速可以完成两项关键计算:FPGA加速转换ETL和FPGA加速分析。结果显示,实时数据分析加速20倍,传统数据仓储加速2倍,存储压缩3倍,给最终用户数据库部署2-3倍。
除了这两种应用,FPGA加速还可以应用于人工智能、视频转码、网络安全、基因研究等领域,未来会继续探索。