登录    注册    忘记密码

期刊文章详细信息

一种改进的加速K均值聚类算法    

An improved accelerated K means clustering algorithm

  

文献类型:期刊文章

作  者:马俊宏[1] 武丽芬[1]

MA Junhong;WU Lifen(School of Information Technology and Engineering,Jinzhong University,Jinzhong Shanxi 030619,China)

机构地区:[1]晋中学院计算机科学与技术学院

出  处:《太赫兹科学与电子信息学报》

基  金:国家自然科学基金面上资助项目(61601334);晋中学院“1331工程”重点创新团队建设计划资助项目(jzxycktd2017017)

年  份:2019

卷  号:17

期  号:5

起止页码:885-891

语  种:中文

收录情况:BDHX、BDHX2017、CSA、IC、JST、UPD、ZGKJHX、核心刊

摘  要:针对当前聚类算法应用于大规模多类别数据集中时,计算量较大,且算法性能严重依赖于K值的不足,提出一种改进的加速K均值聚类算法。算法主要由两种策略组成:一是基于质心下界(PLB)的跳跃过程,新引入称为质心的固定点来计算对象和矩心间距离的下界,避免了常见聚类算法在收敛早期过程中的距离计算过程;二是基于不变矩心对(ICP)的跳跃过程,如果矩心更新步骤完成后被分配及未被分配矩心的位置保持不变,则维持对象分配策略不变且无需计算与未被分配矩心之间的距离。此外,还给出了将本文算法与Hamerly算法相结合的拓展算法以进一步提升聚类加速效果。对大规模高维图像数据集进行了仿真实验,结果表明,与Hamerly算法相比,本文算法在获得相同聚类效果的同时,极大地压缩了距离计算量。当K值较大时,本文算法的平均压缩率更高,平均耗时更少。

关 键 词:聚类 距离计算  质心下界  Hamerly算法  拓展算法  压缩率 耗时  

分 类 号:TN302] TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心