期刊文章详细信息
文献类型:期刊文章
机构地区:[1]东南大学计算机科学与工程学院,南京210096 [2]南京审计学院审计信息工程实验室,南京210029 [3]江苏省镇江市科技局,江苏镇江212002
基 金:江苏省自然科学基金项目(BK2006095);教育部高等学校博士学科点专项科研基金项目(20040286009)
年 份:2008
卷 号:45
期 号:7
起止页码:1189-1194
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象."维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD.通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念.采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点.算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的.
关 键 词:高维数据 离群点检测 信息熵 子空间挖掘 权向量
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...