ɑFA:一种基于非信任字符比较的高性能正则表达式匹配算法
所属分类:技术论文
上传者:wwei
文档大小:891 K
标签: 正则表达式匹配 确定型有限自动机 高性能数据处理
所需积分:0分积分不够怎么办?
文档介绍:正则表达式匹配技术在数据治理、解析提取和深度包检测方面有着重大应用价值。然而,由于其在通用平台上的匹配性能较低,无法满足实际环境下数据实时处理的应用需求,限制了其在高性能数据处理领域的应用范围。针对当前正则表达式匹配性能较低的问题,提出一种基于非信任字符比较的高性能正则表达式匹配算法,称之为ɑFA。该算法通过每次判断连续的若干个字符是否属于最常被访问状态的非信任字符集,获取无需通过DFA匹配可直接跳过的字符数,减少字符匹配过程中访问内存DFA状态转移表的次数,从而实现字符匹配的加速处理。实验结果表明,ɑFA算法可获得相比于原始DFA匹配算法约为1.05~7.58倍的性能加速比。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。