期刊文章详细信息
一种基于Hadoop云计算平台大数据聚类算法设计
Design of a Large Data Clustering Algorithm Based on Hadoop Cloud Computing Platform
文献类型:期刊文章
机构地区:[1]安徽机电职业技术学院信息工程系,安徽芜湖241000
基 金:安徽省教育厅2016年度高校自然科学研究项目;项目编号:KJ2016A134
年 份:2016
卷 号:31
期 号:3
起止页码:49-55
语 种:中文
收录情况:NSSD、普通刊
摘 要:传统的数据挖掘技术由于受到编程模型等的约束,产生了不同瓶颈,聚类算法的研究面临着海量的大数据处理与分析的挑战,新兴计算模型Hadoop作为一种可并行处理的云计算平台得到了广泛应用。文章对传统聚类挖掘算法进行改进和优化,在Hadoop云计算平台上进行K-means算法的并行化实现,降低算法的时间复杂度,提高了计算效率。实践证明,改进的K-means算法适合大规模数据集的聚类挖掘,具有高效、准确、稳定、安全等特性,适合于海量数据的分析和处理。
关 键 词:HADOOP 云计算平台 大数据 聚类挖掘算法 并行化
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...