登录    注册    忘记密码

期刊文章详细信息

基于Spark的并行Eclat算法    

Eclat algorithm based on Spark

  

文献类型:期刊文章

作  者:冯兴杰[1,2] 潘轩[1]

Feng Xingjie;Pan Xuan(College of Computer Science & Technology,Civil Aviation University of China,Tianjin 300300,China;Information Network Center,Civil Aviation University of China,Tianjin 300300,China)

机构地区:[1]中国民航大学计算机科学与技术学院,天津300300 [2]中国民航大学信息网络中心,天津300300

出  处:《计算机应用研究》

基  金:国家自然科学基金委员会与中国民用航空局联合基金项目(U1233113);国家自然科学基金青年基金资助项目(61301245;61201414)

年  份:2019

卷  号:36

期  号:1

起止页码:18-21

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:通过对Spark大数据平台以及Eclat算法的深入分析,提出了基于Spark的Eclat算法(即SPEclat)。针对串行算法在处理大规模数据时出现的不足,该方法在多方面进行改进:为减少候选项集支持度计数带来的损耗,改变了数据的存储方式;将数据按前缀进行分组,并划分到不同的计算节点,压缩数据的搜索空间,实现并行化计算。最终将算法结合Spark云计算平台的优势加以实现。实验表明该算法可在处理海量数据集时高效运行,并且在面对数据量大规模增长的情况下具备良好的可扩展性。

关 键 词:关联规则挖掘 大数据 SPARK 投影树  并行化

分 类 号:TP301.6]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心