期刊文章详细信息
文献类型:期刊文章
机构地区:[1]河北师范大学物理科学与信息工程学院,河北石家庄050016 [2]河北省新型薄膜材料实验室,河北石家庄050016 [3]河北省图书馆,河北石家庄050011
基 金:河北省科学技术研究与发展计划项目(10213512D)
年 份:2011
卷 号:28
期 号:1
起止页码:218-221
语 种:中文
收录情况:BDHX、BDHX2008、CSCD、CSCD_E2011_2012、ZGKJHX、核心刊
摘 要:聚类分析是数据挖掘的一项关键技术,对于大数据集,确定聚类中心点集所需的计算时间相当的长,针对K-中心算法是一种经典的聚类算法,K-中心在处理小数据集聚类的的问题时,具有良好准确性和伸缩性。但由于K-中心初始中心点是随机选取,聚类过程缓慢,易陷入局部极值,聚类的准确性大大降低。为了提高聚类速度和准确性,提出一种改进的快速K-中心聚类算法。方法首先将训练数据集转换为标准的单位特征度量空间,然后将数据先粗划分为m组,再对m组的k个中心进行聚类找到最优聚类中心,找到聚类中心进行聚类并得到最终聚类结果。以网络入侵数据为例对算法进行了验证性分析,实验结果表明,相对于基本K-中心聚类算法,在保持相同聚类效果的情况下,快速K-中心聚类新算法能够加快聚类速度,节省约聚类时间。
关 键 词:数据挖掘 聚类 异常检测 检测率 误警率
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...