期刊文章详细信息
文献类型:期刊文章
机构地区:[1]宁波大学信息科学与工程学院,浙江宁波315210 [2]宁波大学科学技术学院信息工程学院,浙江宁波315210
基 金:国家自然科学基金项目(61175054)
年 份:2017
卷 号:34
期 号:9
起止页码:267-272
语 种:中文
收录情况:CSA、CSA-PROQEUST、IC、JST、ZGKJHX、普通刊
摘 要:聚类集成是将一个数据集的多个划分(基聚类)合成一个新的聚类,该聚类最大程度地代表了所有输入基聚类对数据集的聚类信息。显而易见,初始基聚类的质量对于最终的集成划分至关重要。传统的聚类集成中的基聚类器使用最多的是K-means,因为K-means不仅实现简单,计算复杂度不高,而且其聚类机制符合机器学习关于局部数据的类别条件概率为常数的假设。但由于K-means通常直接使用高斯距离作为距离测度,其只能发现球形簇的类;而对于具有结构复杂、尤其是基于连接性且非球形分布的类结构的数据集,不能生成高质量(即同质性高)的基聚类。为此提出一个基聚类的优化方法,即:判定K-means所生成类的同质性,对同质性较差的类进行再次划分,以提高基聚类的同质性,从而提高整个聚类集成的质量。在8个数据集上的实验数据表明所提出的方法是有效的。
关 键 词:聚类集成 K-MEANS 基聚类 同质性 伪高斯
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...