登录    注册    忘记密码

期刊文章详细信息

面向位置大数据的快速密度聚类算法  ( EI收录)  

Fast Density-Based Clustering Algorithm for Location Big Data

  

文献类型:期刊文章

作  者:于彦伟[1] 贾召飞[1] 曹磊[2] 赵金东[1] 刘兆伟[1] 刘惊雷[1]

YU Yan-Wei;JIA Zhao-Fei;CAO Lei;ZHAO Jin-Dong;LIU Zhao-Wei;LIU Jing-Lei(School of Computer and Control Engineering,Yantai University,Yantai 264005,China;Computer Science and Artificial Intelligence Laboratory,Massachusetts institute of Technology,Cambridge 02139,USA)

机构地区:[1]烟台大学计算机与控制工程学院,山东烟台264005 [2]Computer Science and Artificial Intelligence Laboratory,Massachusetts Institute of Technology

出  处:《软件学报》

基  金:国家自然科学基金(61403328;61773331;61572419;61502410);山东省重点研发计划(2015GSF115009);山东省自然科学基金(ZR2013FM011;ZR2013FQ023;ZR2014FQ016)~~

年  份:2018

卷  号:29

期  号:8

起止页码:2470-2484

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD2017_2018、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:面向位置大数据聚类,提出了一种简单但高效的快速密度聚类算法CBSCAN,以快速发现位置大数据中任意形状的聚类簇模式和噪声.首先,定义了Cell网格概念,并提出了基于Cell的距离分析理论,利用该距离分析,无需距离计算,可快速确定高密度区域的核心点和密度相连关系;其次,给出了网格簇定义,将基于位置点的密度簇映射成基于网格的密度簇,利用排他网格与相邻网格的密度关系,可快速确定网格簇的包含网格;第三,利用基于Cell的距离分析理论和网格簇概念,实现了一个快速密度聚类算法,将DBSCAN基于数据点的密度扩展聚类转换成基于Cell的密度扩展聚类,极大地减少高密度区域的距离计算,利用位置数据的内在特性提高了聚类效率;最后,在基准测试数据上验证了所提算法的聚类效果,在位置大数据上的实验结果统计显示,与DBSCAN、PR-Tree索引和Grid索引优化的DBSCAN相比,CBSCAN分别平均提升了525倍、30倍和11倍效率.

关 键 词:聚类分析 密度聚类 位置大数据  Cell网格  网格簇  

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心