期刊文章详细信息
文献类型:期刊文章
WEI Ya;ZHANG Zhengjun;HE Kailin;TANG Li(School of Mathematics and Statistics,Nanjing University of Science and Technology,Nanjing 210094,China;School of Information Engineering,Jingdezhen University,Jingdezhen 333000,Jiangxi,China)
机构地区:[1]南京理工大学数学与统计学院,南京210094 [2]景德镇学院信息工程学院,江西景德镇333000
基 金:国家自然科学基金(61773014)。
年 份:2023
卷 号:49
期 号:6
起止页码:53-61
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2023_2024、IC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:密度峰值聚类算法在处理密度不均匀的数据集时易将低密度簇划分到高密度簇中或将高密度簇分为多个子簇,且在样本点分配过程中存在误差传递问题。提出一种基于相对密度的密度峰值聚类算法。引入自然最近邻域内的样本点信息,给出新的局部密度计算方法并计算相对密度。在绘制决策图确定聚类中心后,基于对簇间密度差异的考虑,提出密度因子计算各个簇的聚类距离,根据聚类距离对剩余样本点进行划分,实现不同形状、不同密度数据集的聚类。在合成数据集和真实数据集上进行实验,结果表明,该算法的FMI、ARI和NMI指标较经典的密度峰值聚类算法和其他3种聚类算法分别平均提高约14、26和21个百分点,并且在簇间密度相差较大的数据集上能够准确识别聚类中心和分配剩余的样本点。
关 键 词:聚类 密度峰值 相对密度 密度因子 聚类距离 自然最近邻
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...