登录    注册    忘记密码

期刊文章详细信息

基于加权网格和信息熵的并行密度聚类算法    

Parallel Density-Based Clustering Algorithm by Using Weighted Grid and Information Entropy

  

文献类型:期刊文章

作  者:胡健[1,2] 徐锴滨[1] 毛伊敏[1]

HU Jian;XU Kaibin;MAO Yimin(School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou,Jiangxi 341000,China;Department of Information Engineering,College of Applied Science,Jiangxi University of Science and Technology,Ganzhou,Jiangxi 341000,China)

机构地区:[1]江西理工大学信息工程学院,江西赣州341000 [2]江西理工大学应用科学学院信息工程系,江西赣州341000

出  处:《计算机科学与探索》

基  金:国家重点研发计划,No.2018YFC1504705;国家自然科学基金,No.41562019;江西省教育厅科技项目,Nos.GJJ151528,GJJ151531。

年  份:2020

卷  号:14

期  号:12

起止页码:2094-2107

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、IC、JST、ZGKJHX、核心刊

摘  要:针对大数据下基于密度的聚类算法中存在的数据网格划分不合理,聚类结果准确度不高以及并行化效率较低等问题,提出了基于MapReduce和加权网格信息熵的DBWGIE-MR算法。首先提出自适应网格划分策略(ADG)来划分网格单元;其次提出邻居网格扩展策略(NE)用于构建每个数据分区的加权网格,以此提高聚类效果;同时提出加权网格信息熵策略(WGIE)来计算网格密度以及密度聚类算法的ε邻域和核心对象,使密度聚类算法更适用于加权网格;接着结合MapReduce计算模型,提出并行计算局部簇算法(COMCOREMR),从而加快获取局部簇;最后提出了基于并查集的并行合并局部簇算法(MECORE-MR),用于加快合并局部簇的收敛速度,提升了基于密度的聚类算法对局部簇合并的效率。实验结果表明,DBWGIE-MR算法的聚类效果更佳,且在较大规模的数据集下算法的并行化性能更好。

关 键 词:大数据 密度聚类 加权网格  信息熵

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心