一种基于状态预测的多线程数据过滤算法
所属分类:技术论文
上传者:wwei
文档大小:3605 K
标签: 正则表达式匹配 状态预测 数据过滤
所需积分:0分积分不够怎么办?
文档介绍:数据过滤算法在大数据处理领域有着重要的作用。基于正则表达式匹配技术的数据过滤算法凭借强大的特征表达能力适合于处理大规模复杂数据。然而,传统的正则表达式匹配过程为串行匹配,造成性能低,无法满足现代数据处理的需求。针对传统正则表达式匹配性能低的问题,提出一种基于多线程和状态预测的正则表达式加速匹配算法,称之为μFA:基于向量指令执行字符值比较,获取可直接跳过的信任字符数。同时,基于多线程加速和状态猜测技术,实现字符串的分段匹配处理,通过圈定字符危险区域,研判各分段最终匹配结果的正确性。实验结果表明,μFA算法的吞吐率是原始DFA算法的10.12~91.36倍、ßFA算法的1.08~2.97倍。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。