登录    注册    忘记密码

期刊文章详细信息

复杂分布数据的二阶段聚类算法  ( EI收录)  

Two-Phase Clustering Algorithm for Complex Distributed Data

  

文献类型:期刊文章

作  者:公茂果[1,2] 王爽[1,2] 马萌[1,2] 曹宇[1,2] 焦李成[1,2] 马文萍[1,2]

机构地区:[1]西安电子科技大学智能感知与图像理解教育部重点实验室,陕西西安710071 [2]西安电子科技大学智能信息处理研究所,陕西西安710071

出  处:《软件学报》

基  金:国家高技术研究发展计划(863)(2009AA12Z210);新世纪优秀人才支持计划(NCET-08-0811);陕西省科技新星支持计划(2010KJXX-03);中央高校基本科研业务费重点项目(K50510020001)

年  份:2011

卷  号:22

期  号:11

起止页码:2760-2772

语  种:中文

收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20114814570367)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:提出了一种用于复杂分布数据的二阶段聚类算法(two-phase clustering,简称TPC),TPC包含两个阶段:首先将数据划分为若干个球形分布的子类,每一个子类用其聚类中心代表该类内的所有样本;然后利用可以处理复杂分布数据的流形进化聚类(manifold evolutionary clustering,简称MEC)对第1阶段得到的聚类中心进行类别划分;最后综合两次聚类结果整理得到最终聚类结果.该算法基于改进的K-均值算法和MEC算法.在进化聚类算法的基础上引入流形距离,使得算法能够胜任复杂分布的数据聚类问题.同时,算法降低了引入流形距离所带来的计算量.在分布各异的7个人工数据集和7个UCI数据集测试了二阶段聚类算法,并将其效果与遗传聚类算法、K均值算法和流形进化聚类算法做了比较.实验结果表明,无论对于简单或复杂、凸或非凸的数据,TPC都表现出良好的聚类性能,并且计算时间与MEC相比明显减少.

关 键 词:数据挖掘  聚类 K-均值算法 进化算法 流形

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心