登录    注册    忘记密码

期刊文章详细信息

基于MapReduce框架下K-means的改进算法    

Improved K-means algorithm based on MapReduce framework

  

文献类型:期刊文章

作  者:阴爱英[1] 吴运兵[2] 朱敏琛[1,2] 张莹[1,2]

Yin Aiying;Wu Yunbing;Zhu Minchen;Zhang Ying(Dept.of Computer Engineering,Zhicheng College of Fuzhou University,Fuzhou 350002,China;College of Mathematics & Computer Science,Fuzhou University,Fuzhou 350116,China)

机构地区:[1]福州大学至诚学院计算机工程系,福州350002 [2]福州大学数学与计算机科学学院,福州350116

出  处:《计算机应用研究》

基  金:福建省自然科学基金资助项目(2017J01755);福建省教育厅中青年教师教育科研项目(JAT160658;JAT160077);福建省科技计划项目(2016R0095)

年  份:2018

卷  号:35

期  号:8

起止页码:2295-2298

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:针对海量数据背景下K-means聚类结果不稳定和收敛速度较慢的问题,提出了基于MapReduce框架下的K-means改进算法。首先,为了能获得K-means聚类的初始簇数,利用凝聚层次聚类法对数据集进行聚类,并用轮廓系数对聚类结果进行初步评价,将获得数据集的簇数作为K-means算法的初始簇中心进行聚类;其次,为了能适应于海量数据的聚类挖掘,将改进的K-means算法部署在MapReduce框架上进行运算。实验结果表明,在单机性能上,该方法具有较高的准确率和召回率,同时也具有较强的聚类稳定性;在集群性能上,也具有较好的加速比和运行速度。

关 键 词:MAPREDUCE框架 K-MEANS算法 数据挖掘 聚类分析

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心