期刊文章详细信息
文献类型:期刊文章
机构地区:[1]西安电子科技大学智能感知与图像理解教育部重点实验室,陕西西安710071 [2]西安电子科技大学智能信息处理研究所,陕西西安710071
基 金:国家高技术研究发展计划(863)(2009AA12Z210);新世纪优秀人才支持计划(NCET-08-0811);陕西省科技新星支持计划(2010KJXX-03);中央高校基本科研业务费重点项目(K50510020001)
年 份:2011
卷 号:22
期 号:11
起止页码:2760-2772
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20114814570367)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:提出了一种用于复杂分布数据的二阶段聚类算法(two-phase clustering,简称TPC),TPC包含两个阶段:首先将数据划分为若干个球形分布的子类,每一个子类用其聚类中心代表该类内的所有样本;然后利用可以处理复杂分布数据的流形进化聚类(manifold evolutionary clustering,简称MEC)对第1阶段得到的聚类中心进行类别划分;最后综合两次聚类结果整理得到最终聚类结果.该算法基于改进的K-均值算法和MEC算法.在进化聚类算法的基础上引入流形距离,使得算法能够胜任复杂分布的数据聚类问题.同时,算法降低了引入流形距离所带来的计算量.在分布各异的7个人工数据集和7个UCI数据集测试了二阶段聚类算法,并将其效果与遗传聚类算法、K均值算法和流形进化聚类算法做了比较.实验结果表明,无论对于简单或复杂、凸或非凸的数据,TPC都表现出良好的聚类性能,并且计算时间与MEC相比明显减少.
关 键 词:数据挖掘 聚类 K-均值算法 进化算法 流形
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...