期刊文章详细信息
一种基于数据垂直划分的分布式密度聚类算法 ( EI收录)
An Efficient Density-Based Clustering Algorithm for Vertically Partitioned Distributed Datasets
文献类型:期刊文章
机构地区:[1]东南大学计算机科学与工程学院,南京210096 [2]南京审计学院审计信息工程实验室,南京210029
基 金:江苏省自然科学基金项目(BK2006095);教育部高等学校博士学科点专项科研基金项目(20040286009)
年 份:2007
卷 号:44
期 号:9
起止页码:1612-1617
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点集关系的基础上,对全局噪声点进行有效过滤,进一步设计闭三角链表结构存储各个结点的聚类中间结果,提出了基于密度的分布式聚类算法DDB-SCAN.理论分析和实验结果表明,算法可以有效解决垂直划分的大数据集聚类问题,算法是有效可行的.
关 键 词:分布式数据挖掘 数据垂直划分 连通点集 局部噪声点集 闭三角链表
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...