登录    注册    忘记密码

期刊文章详细信息

密度峰值聚类算法综述  ( EI收录)  

Survey on Density Peak Clustering Algorithm

  

文献类型:期刊文章

作  者:陈叶旺[1,2,3,4] 申莲莲[1] 钟才明[5] 王田[1] 陈谊[2] 杜吉祥[1]

Chen Yewang;Shen Lianlian;Zhong Caiming;Wang Tian;Chen Yi;Du Jixiang(College of Computer Science and Technology,Huaqiao University,Xiamen,Fujian 361021;Beijing Key Laboratory of Big Data Technology for Food Safety(Beijing Technology and Business University),Beijing 100048;Provincial Key Laboratory for Computer Information Processing Technology(Soochow University),Suzhou,Jiangsu 215006;Fujian Key Laboratory of Big Data Intelligence and Security(Huaqiao University),Xiamen,Fujian 361021;College of Information,Ningbo University,Ningbo,Zhejiang 315211)

机构地区:[1]华侨大学计算机科学与技术学院,福建厦门361021 [2]食品安全大数据技术北京市重点实验室(北京工商大学),北京100048 [3]江苏省计算机信息处理技术重点实验室(苏州大学),江苏苏州215006 [4]福建省大数据智能与安全重点实验室(华侨大学),福建厦门361021 [5]宁波大学信息学院,浙江宁波315211

出  处:《计算机研究与发展》

基  金:国家自然科学基金项目(61673186,71771094,61876068,61972010);泉州市高层次人才创新创业项目(2018C114R,2018C110R);福建省科技计划项目(2017H01010065,2019H01010129)~~

年  份:2020

卷  号:57

期  号:2

起止页码:378-394

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望.

关 键 词:聚类算法 密度峰值  大数据 数据挖掘 密度聚类

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心