登录    注册    忘记密码

期刊文章详细信息

基于谱聚类的高维类别属性数据流离群点挖掘算法  ( EI收录)  

Outlier mining algorithm for high dimensional categorical data streams based on spectral clustering

  

文献类型:期刊文章

作  者:康耀龙[1] 冯丽露[2] 张景安[3] 陈富[4]

KANG Yao-long;FENG Li-lu;ZHANG Jing-an;CHEN Fu(School of Computer and Network Engineering,Shanxi Datong University,Datong 037009,China;School of Education Science and Technology,Shanxi Datong University,Datong 037009,China;Computer Network Center,Shanxi Datong University,Datong 037009,China;School of Mathematics and Statistics,Shanxi Datong University,Datong 037009,China)

机构地区:[1]山西大同大学计算机与网络工程学院,山西大同037009 [2]山西大同大学教育科学与技术学院,山西大同037009 [3]山西大同大学计算机网络中心,山西大同037009 [4]山西大同大学数学与统计学院,山西大同037009

出  处:《吉林大学学报(工学版)》

基  金:国家自然科学基金项目(61803241);大同市平台基地计划项目(2020196);山西省社会科学院(山西省人民政府发展研究中心)2021年度规划一般项目(YWYB202153)。

年  份:2022

卷  号:52

期  号:6

起止页码:1422-1427

语  种:中文

收录情况:BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:为及时发现数据流中的异常数据、降低网络潜在威胁,提出了基于谱聚类的高维类别属性数据流离群点挖掘算法。分析了数据流具有有序性、高速性和高维性等特征,并探究了离群点的主要来源;利用属性权值量化方法,引入信息熵,将具有较强关联性的数据流合并,进而对数据流进行降维以减少干扰;采用谱聚类算法设置关键尺度参数,通过亲和矩阵计算样本与目标之间的距离,将谱聚类变换为无向图分割问题,获取特征矩阵,提取显著的离群点特征;使用距离挖掘方式,在数据流中加入数据块,判断两个邻近数据块之间的概率分布情况,设定滑动窗口,获取数据与滑动窗口间的距离,再与设定的阈值做比较,将离群点加入到集合中完成挖掘。仿真实验结果证明,对于不同大小和不同维度的数据流,该算法所需的执行时间分别在42 s和40 s内,对于数据流大小和维度具有较好的伸缩性,且挖掘出的离群点数据与实际相符。

关 键 词:计算机应用  谱聚类算法 高维类别属性  数据流 离群点挖掘 滑动窗口  

分 类 号:TP274]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心