登录    注册    忘记密码

期刊文章详细信息

优化初始聚类中心的K-means聚类算法    

K-means Clustering Algorithm of Optimizing Initial Clustering Center

  

文献类型:期刊文章

作  者:郭永坤[1] 章新友[1] 刘莉萍[1] 丁亮[1] 牛晓录[2]

GUO Yongkun;ZHANG Xinyou;LIU Liping;DING Liang;NIU Xiaolu(School of Computing,Jiangxi University of Traditional Chinese Medicine,Nanchang 330004,China;School of Pharmacy,Jiangxi University of Traditional Chinese Medicine,Nanchang 330004,China)

机构地区:[1]江西中医药大学计算机学院,南昌330004 [2]江西中医药大学药学院,南昌330004

出  处:《计算机工程与应用》

基  金:国家自然科学基金(No.81660727)。

年  份:2020

卷  号:56

期  号:15

起止页码:172-178

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于α(α为样本集数据点数目与聚类的簇类数目的比值),再把该集合从样本集中删除,重复以上步骤得到K(K为簇类数目)个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。

关 键 词:K-MEANS聚类算法 算法优化  初始聚类中心

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心