期刊文章详细信息
文献类型:期刊文章
TA Na(School of Computer,Hulunbuir University,Hulunbuir 021008,China;College of Computer Science and Technology,Jilin University,Changchun 130012,China)
机构地区:[1]呼伦贝尔学院计算机学院,内蒙古呼伦贝尔021008 [2]吉林大学计算机科学与技术学院,吉林长春130012
年 份:2020
卷 号:43
期 号:15
起止页码:123-126
语 种:中文
收录情况:BDHX、BDHX2017、IC、RCCSE、ZGKJHX、核心刊
摘 要:考虑到传统大规模数据聚类分析算法收敛速度较慢的问题,提出一种基于云计算技术的大规模数据聚类分析算法。定义云空间内的数据变量,计算数据点密度,以计算出的密度数据为基准,整合为两个不同的数据集合,不断循环删除集合内局部密度低于平均密度的离群点,得出聚类中心。筛选远离聚类中心的点,计算数据点与聚类中心的相似系数,将保留下来的数据点划分为聚类区域,采用层次分配方法将聚类数据点分配到聚类区域中,完成大规模数据的聚类分析。实验结果表明,与传统聚类分析方法相比,所提聚类分析算法的收敛速度最高可达10 mm/s,收敛速度更快,说明该算法的收敛效果较好。
关 键 词:云计算技术 大规模数据 聚类中心 相似系数 数据点密度 收敛速度
分 类 号:TN911.1-34] TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...