登录    注册    忘记密码

期刊文章详细信息

基于云计算技术的大规模数据聚类分析    

Large-scale data clustering analysis based on cloud computing technology

  

文献类型:期刊文章

作  者:塔娜[1,2]

TA Na(School of Computer,Hulunbuir University,Hulunbuir 021008,China;College of Computer Science and Technology,Jilin University,Changchun 130012,China)

机构地区:[1]呼伦贝尔学院计算机学院,内蒙古呼伦贝尔021008 [2]吉林大学计算机科学与技术学院,吉林长春130012

出  处:《现代电子技术》

年  份:2020

卷  号:43

期  号:15

起止页码:123-126

语  种:中文

收录情况:BDHX、BDHX2017、IC、RCCSE、ZGKJHX、核心刊

摘  要:考虑到传统大规模数据聚类分析算法收敛速度较慢的问题,提出一种基于云计算技术的大规模数据聚类分析算法。定义云空间内的数据变量,计算数据点密度,以计算出的密度数据为基准,整合为两个不同的数据集合,不断循环删除集合内局部密度低于平均密度的离群点,得出聚类中心。筛选远离聚类中心的点,计算数据点与聚类中心的相似系数,将保留下来的数据点划分为聚类区域,采用层次分配方法将聚类数据点分配到聚类区域中,完成大规模数据的聚类分析。实验结果表明,与传统聚类分析方法相比,所提聚类分析算法的收敛速度最高可达10 mm/s,收敛速度更快,说明该算法的收敛效果较好。

关 键 词:云计算技术 大规模数据 聚类中心 相似系数  数据点密度  收敛速度

分 类 号:TN911.1-34] TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心