期刊文章详细信息
K近邻优化的密度峰值快速搜索聚类算法
K-nearest neighbors optimized clustering algorithm by fast search and finding the density peaks of a dataset
文献类型:期刊文章
机构地区:[1]陕西师范大学计算机科学学院,西安710061 [2]深圳大学信息工程学院ATR国家重点实验室,深圳518006
基 金:国家自然科学基金项目(批准号:31372250);陕西省科技攻关项目(批准号:2013K12-03-24);中央高校基本科研业务费专项基金项目(批准号:GK201503067)资助
年 份:2016
卷 号:46
期 号:2
起止页码:258-280
语 种:中文
收录情况:BDHX、BDHX2014、CSCD、CSCD2015_2016、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对2014年6月发表在Science的密度峰值点快速搜索聚类算法的样本局部密度定义和样本分配策略的缺陷,提出一种基于K近邻的快速密度峰值搜索并高效分配样本的聚类算法.算法利用样本点的K近邻信息定义样本局部密度,搜索和发现样本的密度峰值,以峰值点样本作为初始类簇中心;提出两种基于K近邻的样本分配策略,依次分配样本到相应类簇中心,得到数据集样本的分布模式.理论分析和在经典人工数据集、UCI数据集及Olivetti人脸数据集的对比实验表明:提出的基于K近邻的密度峰值搜索聚类算法能快速发现任意形状、任意维度和任意规模数据集的类簇中心,并合理分配样本到相应类簇,揭示数据集样本的分布模式,对噪声数据具有非常好的鲁棒性,聚类结果优于2014年6月发表在Science的密度峰值点快速搜索聚类算法,以及经典聚类算法AP,DBSCAN和K-means.本文算法是一种非常有效的聚类算法,可用于发现任意数据集的隐藏模式与规律.
关 键 词:K近邻 局部密度 密度峰值 类簇中心 聚类
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...