基于Hadoop集群的多表并行关联算法及应用
所属分类:技术论文
上传者:aet
文档大小:362 K
所需积分:0分积分不够怎么办?
文档介绍: 针对因特网环境下并行数据库实现多个大数据表关联存在的计算瓶颈,基于 Hadoop集群设计了一个并行关联多个大数据表的简便算法MR_Join。以商业网站凡客诚品的销售数据为例进行实验,验证算法的可行性并做出应用实例。实验结果表明,MR_Join算法可以有效地实现大数据表的快速关联,具有显著的并行效率。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。