登录    注册    忘记密码

期刊文章详细信息

大数据环境中多维数据去重的聚类算法研究    

Research on Clustering Analysis of Multi-dimensional Remove-duplicate Removal in Big Data

  

文献类型:期刊文章

作  者:罗恩韬[1,2] 王国军[1] 李超良[1,3]

机构地区:[1]中南大学信息科学与工程学院,长沙410073 [2]湖南科技学院电子与信息工程学院,湖南永州425006 [3]湖南商学院计算机与信息工程系,长沙410205

出  处:《小型微型计算机系统》

基  金:国家自然科学基金项目(60173037,6272496,61272151)资助;湖南科技学院科技项目(13XKYTB011)资助;湖南科技学院应用技术重点学科项目资助

年  份:2016

卷  号:37

期  号:3

起止页码:438-442

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD2015_2016、IC、INSPEC、JST、SCOPUS、ZGKJHX、核心刊

摘  要:随着现实和虚拟世界的数据产生速度越来越迅猛,云计算,街景地图服务,社区网络等新兴服务促使数据的种类和规模正以前所未有的速度增长,大数据的规模效应给数据的存储管理和分析带来极大的挑战.数据量的激增会导致很多共性问题,例如数据的可表示,可处理和可靠性问题.如何有效处理和分析数据之间的关系,降低重复和冗余数据,建立非结构化数据的聚类分析模型.已经成为学术界和企业界共同亟待解决的问题.本文讨论大数据内部关系的复杂性,建立了一种更适合大数据时代的数据多维去重聚类分析抽取模型算法,此算法采样复杂度低,数据分析准确,易于实现,具有良好的判定性.

关 键 词:大数据 数据挖掘  非结构化数据 聚类分析

分 类 号:TP393]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心