期刊文章详细信息
文献类型:期刊文章
TAO Ying;YANG Feng;LIU Yang;DAI Bing(School of Computer and Electronic Information,Guangxi University,Nanning 530004,China)
机构地区:[1]广西大学计算机与电子信息学院,广西南宁530004
基 金:广西壮族自治区中青年教师基础能力提升项目(KY2016YB026);广西自然科学基金(2014GXNSFBA118274)
年 份:2018
卷 号:28
期 号:6
起止页码:90-92
语 种:中文
收录情况:JST、RCCSE、ZGKJHX、普通刊
摘 要:聚类分析是数据挖掘的重要组成部分,K均值聚类算法是聚类分析方法中一种基本的划分式方法,也是无监督的机器学习方法。其具有效率高、容易理解和实现等优点,同时,可以对多种数据类型进行聚类,广泛应用于诸多领域。但是,K均值聚类算法也有一些局限性。算法中合理的k值难以确定,而且算法选择初始聚类中心的随机性会导致聚类结果不稳定,同时,算法对噪声和离群点数据也有很强的敏感性。为了解决初始聚类中心随机性的问题,通过全局化思想对K均值聚类算法进行了改进,改进的聚类效果评价使用常用的误差平方和准则。实验结果表明,相较于一般的K均值聚类算法,全局K均值聚类算法得到了更好的聚类效果,同时提升了算法的稳定性。
关 键 词:数据挖掘 K均值聚类 中心点 误差平方和
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...