期刊文章详细信息
文献类型:期刊文章
WU Guang-jian;ZHANG Jian-lin;YUAN Ding(Hangzhou Normal College,Alibaba Business University,Hangzhou 311100)
机构地区:[1]杭州师范大学阿里巴巴商学院
年 份:2019
卷 号:40
期 号:5
起止页码:167-170
语 种:中文
收录情况:CSA、IC、JST、普通刊
摘 要:典型的K-means算法利用手肘法选择合适的K值在实际项目中应用的较多,但是手肘法获取K值自动性低,以及面对海量数据的处理,效率上也有待提高。提出利用手肘法关系图初始点和末尾点连接的关系直线,求K值范围下直线y值与误差平方和的最大差值的方法,最大差值对应的K值为手肘法的最优肘点,由于手肘法需要多次迭代以及数据集稠密度对关系图的影响较小,提出利用数据集预抽样并且将程序部署在spark平台之上的方式自动获取手肘法的肘点K值,这样不仅根据此方法自动获取K-means最优K值而且提高了大数据集的处理效率。
关 键 词:K-MEANS算法 聚类K值 手肘法 误差平方和 肘点
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...