期刊文章详细信息
文献类型:期刊文章
MA Junhong;WU Lifen(School of Information Technology and Engineering,Jinzhong University,Jinzhong Shanxi 030619,China)
机构地区:[1]晋中学院计算机科学与技术学院
基 金:国家自然科学基金面上资助项目(61601334);晋中学院“1331工程”重点创新团队建设计划资助项目(jzxycktd2017017)
年 份:2019
卷 号:17
期 号:5
起止页码:885-891
语 种:中文
收录情况:BDHX、BDHX2017、CSA、IC、JST、UPD、ZGKJHX、核心刊
摘 要:针对当前聚类算法应用于大规模多类别数据集中时,计算量较大,且算法性能严重依赖于K值的不足,提出一种改进的加速K均值聚类算法。算法主要由两种策略组成:一是基于质心下界(PLB)的跳跃过程,新引入称为质心的固定点来计算对象和矩心间距离的下界,避免了常见聚类算法在收敛早期过程中的距离计算过程;二是基于不变矩心对(ICP)的跳跃过程,如果矩心更新步骤完成后被分配及未被分配矩心的位置保持不变,则维持对象分配策略不变且无需计算与未被分配矩心之间的距离。此外,还给出了将本文算法与Hamerly算法相结合的拓展算法以进一步提升聚类加速效果。对大规模高维图像数据集进行了仿真实验,结果表明,与Hamerly算法相比,本文算法在获得相同聚类效果的同时,极大地压缩了距离计算量。当K值较大时,本文算法的平均压缩率更高,平均耗时更少。
关 键 词:聚类 距离计算 质心下界 Hamerly算法 拓展算法 压缩率 耗时
分 类 号:TN302] TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...