期刊文章详细信息
一种基于特征间隙的检测簇数的谱聚类算法
A Spectral Clustering Algorithm with Identifying Clustering Number Based on Eigengap
文献类型:期刊文章
机构地区:[1]南京邮电大学通信与信息工程学院宽带无线通信与传感网技术教育部重点实验室,江苏南京210003 [2]东南大学移动通信国家重点实验室,江苏南京210096
基 金:国家自然科学基金资助项目(61071092);东南大学移动通信国家重点实验室开放研究基金资助课题(2011D04);中国博士后科学基金项目(2012M511309);江苏省博士后科研资助计划(1101125C);华为公司创新研究计划(YB2014010003)
年 份:2015
卷 号:25
期 号:9
起止页码:37-42
语 种:中文
收录情况:JST、RCCSE、ZGKJHX、普通刊
摘 要:数据挖掘中如何根据数据之间的相似度确定簇(Cluster)数一直是聚类算法中需要解决的难题。文中在经典谱聚(Spectral Clustering)算法的基础上提出了一种基于特征间隙检测簇数的谱聚类算法(Spectral Clustering with Identifying Clustering Number based on Eigengap,SC-ICNE)。通过构建规范的拉普拉斯矩阵,顺序求解其特征值和相应特征向量,并得到矩阵相邻特征值的间隙,通过判断特征间隙的位置来确定簇数k。最后,通过对前k个特征向量的k-means算法实现数据集的聚类。文中通过仿真分析了高斯相似度函数对SC-ICNE聚类性能的影响,在非凸球形数据集和UCI数据集上进行了性能仿真,并和k-means聚类算法进行了对比,在检测簇数和聚类准确性方面,验证了SC-ICNE算法的有效性。
关 键 词:谱聚类 簇数 特征间隙 高斯相似度
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...