期刊文章详细信息
文献类型:期刊文章
Tian Hua;He Yi(School of Data Science,Tongren University,Tongren Guizhou 554300,China)
机构地区:[1]铜仁学院大数据学院,贵州铜仁554300
基 金:贵州省教育厅创新群体重大研究项目(黔教合KY字[2016]051)。
年 份:2020
卷 号:37
期 号:12
起止页码:3586-3589
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:针对大数据分析在大规模并行分布式系统和软件平台上可扩展的问题,提出了一个基于无参数围绕质心二进制分裂聚类(clustering using binary splitting,CLUBS)的大数据挖掘技术。该技术以完全无监督的方式工作,基于最小二次距离的准则进行分裂聚类将数据与噪声分离,通过中级精炼来识别仅包含异常值的块并为剩余块生成全面的簇,设计CLUBS的并行化版本以实现对大数据进行快速有效的聚类。实验表明CLUBS并行算法不受数据维度和噪声的影响,比现有算法具有更好的可扩展性且速度较快。
关 键 词:大数据 分裂聚类 凝聚聚类 数据挖掘
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...