登录    注册    忘记密码

期刊文章详细信息

基于优化初始聚类中心和轮廓系数的K-means聚类算法    

K-means Clustering Algorithm Using Optimal Initial Clustering Center and Contour Coefficient

  

文献类型:期刊文章

作  者:孙林[1,2] 刘梦含[1] 徐久成[1,2]

SUN Lin;LIU Meng-han;XU Jiu-cheng(College of Computer and Information Engineering,Henan Normal University,Xinxiang 453007,China;Henan Engineering Laboratory of Smart Business and Internet of Things Technology,Xinxiang 453007,China)

机构地区:[1]河南师范大学计算机与信息工程学院,河南新乡453007 [2]智慧商务与物联网技术河南省工程实验室,河南新乡453007

出  处:《模糊系统与数学》

基  金:国家自然科学基金资助项目(62076089;61772176;61976082);河南省科技攻关项目(212102210136)。

年  份:2022

卷  号:36

期  号:1

起止页码:47-65

语  种:中文

收录情况:BDHX、BDHX2020、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:传统K-means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低。针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法。首先,为了选出准确的初始聚类中心,引入平均样本距离和误差平方和,构造初始聚类中心的选取方法,使得选取的初始聚类中心是样本相对集中的点,有效避免选择离群点;然后,为了选择出最佳聚类数目K,基于最近簇中心进行簇的合并,基于中位数构造轮廓系数,设计基于中位数的平均轮廓系数评价指标,判断簇合并之后的最佳K;最后,通过以上两种方法选择合理的初始聚类中心和K,进而设计了基于优化初始聚类中心和轮廓系数的K-means聚类算法。在选取的合成数据集和UCI数据集上进行测试与分析。实验结果表明,本文所提算法能够选取最优的K和唯一的初始中心点,获得了更好的聚类结果,同时也提升了聚类算法的稳定性。

关 键 词:K-MEANS算法 聚类中心 K值  中位数 轮廓系数  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心