期刊文章详细信息
基于云计算平台Hadoop的并行k-means聚类算法设计研究
Research on Parallel k-means Algorithm Design Based on Hadoop Platform
文献类型:期刊文章
机构地区:[1]湘潭大学信息工程学院,湘潭411105 [2]中国科学院计算技术研究所智能信息处理重点实验室,北京100190 [3]西北师范大学数学与信息科学学院,兰州730070 [4]湘潭大学机械工程学院,湘潭411105
基 金:国家自然科学基金(60933004;60975039;61072085);国家973项目(2007CB311004);西北师范大学青年教师科研能力提升计划骨干项目(NWNU-LKQN-10-1);湘潭大学博士启动基金(10QDZ42);湖南省教育厅一般项目(09C967)资助
年 份:2011
卷 号:38
期 号:10
起止页码:166-168
语 种:中文
收录情况:BDHX、BDHX2008、CSA、CSCD、CSCD2011_2012、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等。深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略。在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘。
关 键 词:云计算 HADOOP平台 并行k-means MAPREDUCE
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...