期刊文章详细信息
文献类型:期刊文章
机构地区:[1]华北理工大学信息工程学院,河北唐山063000
基 金:河北省科技支撑计划项目(15210110D);唐山市科技支撑计划项目(14130233B)
年 份:2016
卷 号:21
期 号:2
起止页码:20-27
语 种:中文
收录情况:BDHX、BDHX2014、CAS、CSA、DOAJ、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对传统FP-Growth算法在大规模数据环境下挖掘效率低下的问题,提出了一种改进的FP-Growth算法.该算法主要是通过基于频繁闭项集策略对完备模式树进行剪枝进而减小搜索空间规模,达到提高算法挖掘效率的目的 .并将改进后的FP-Growth算法的分治策略与分布式计算框架Hadoop的MapReduce编程模式有机结合,进一步提高了大数据环境下的挖掘效率.实验证明,基于Hadoop的改进FP-Growth算法的效率较传统FP-Growth算法有所提高.
关 键 词:分布式并行 改进FP-Growth算法 剪枝 MapReduce编程模式
分 类 号:TP311.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...