ßFA:一种基于向量指令集的高性能数据处理算法
所属分类:技术论文
上传者:wwei
文档大小:3357 K
标签: 正则表达式匹配 向量指令集 高性能数据处理
所需积分:0分积分不够怎么办?
文档介绍:正则表达式匹配技术在数据清洗、解析提取等数据处理任务方面发挥重大作用。然而,由于匹配过程中存在数据强依赖关系和内存访问不可预测等问题,造成匹配性能较低。针对此问题,提出一种基于向量指令集的高性能正则表达式数据处理算法,称之为ßFA:通过向量指令一次性从内存读出若干连续字符,并与最常被访问状态对应的非信任字符集进行向量匹配,利用内置函数定位首个非信任字符的位置,获得可直接跳过的字符数,从而实现匹配性能的加速。实验结果表明,ßFA算法的吞吐率优于原始DFA算法和αFA算法,是原始DFA算法的4.67~60倍以及ɑFA算法的4.37~7.82倍。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。