期刊文章详细信息
文献类型:期刊文章
Yin Aiying;Wu Yunbing;Zhu Minchen;Zhang Ying(Dept.of Computer Engineering,Zhicheng College of Fuzhou University,Fuzhou 350002,China;College of Mathematics & Computer Science,Fuzhou University,Fuzhou 350116,China)
机构地区:[1]福州大学至诚学院计算机工程系,福州350002 [2]福州大学数学与计算机科学学院,福州350116
基 金:福建省自然科学基金资助项目(2017J01755);福建省教育厅中青年教师教育科研项目(JAT160658;JAT160077);福建省科技计划项目(2016R0095)
年 份:2018
卷 号:35
期 号:8
起止页码:2295-2298
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:针对海量数据背景下K-means聚类结果不稳定和收敛速度较慢的问题,提出了基于MapReduce框架下的K-means改进算法。首先,为了能获得K-means聚类的初始簇数,利用凝聚层次聚类法对数据集进行聚类,并用轮廓系数对聚类结果进行初步评价,将获得数据集的簇数作为K-means算法的初始簇中心进行聚类;其次,为了能适应于海量数据的聚类挖掘,将改进的K-means算法部署在MapReduce框架上进行运算。实验结果表明,在单机性能上,该方法具有较高的准确率和召回率,同时也具有较强的聚类稳定性;在集群性能上,也具有较好的加速比和运行速度。
关 键 词:MAPREDUCE框架 K-MEANS算法 数据挖掘 聚类分析
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...