期刊文章详细信息
基于云计算和改进K-means算法的海量用电数据分析方法
Massive data analysis of power utilization based on improved K-means algorithm and cloud computing
文献类型:期刊文章
机构地区:[1]重庆邮电大学光电工程学院,重庆400065 [2]重庆邮电大学通信与信息工程学院,重庆400065
基 金:中国电力科学研究院科技基金资助项目(XXB51201603155);国网北京经济技术研究院科技基金资助项目(15JS191)~~
年 份:2018
卷 号:38
期 号:1
起止页码:159-164
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进K-means算法的海量用电数据分析方法研究。针对传统K-means算法中存在初始聚类中心和K值难确定的问题,提出一种基于密度的Kmeans改进算法。首先,定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,通过最大权值积法依次确定聚类中心,提高了聚类的准确率;然后,基于MapReduce模型实现改进算法的并行化,提高了聚类的效率;最后,以小区400户家庭用电数据为基础,进行海量电力数据的挖掘分析实验。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明提出的改进K-means算法运行稳定、可靠,具有很好的聚类效果。
关 键 词:用电数据 云计算 改进K-MEANS算法 MAPREDUCE模型 并行化
分 类 号:TP301] TP274.2[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...