期刊文章详细信息
基于MapReduce与相关子空间的局部离群数据挖掘算法 ( EI收录)
Related-Subspace-Based Local Outlier Detection Algorithm Using Map Reduce
文献类型:期刊文章
机构地区:[1]太原科技大学计算机科学与技术学院,山西太原030024 [2]Department of Computer Science and Software Engineering,Auburn University,Auburn,USA
基 金:国家自然科学基金(61272263)
年 份:2015
卷 号:26
期 号:5
起止页码:1079-1095
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD2015_2016、EI(收录号:20152200901126)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:针对高维海量数据,在Map Reduce编程模型下,提出了一种基于相关子空间的局部离群数据挖掘算法.该算法首先利用属性维上的局部稀疏程度,重新定义了相关子空间,从而能够有效地刻画各种局部数据集上的分布特征;其次,利用局部数据集的概率密度,给出了相关子空间中的局部离群因子计算公式,有效地体现了相关子空间中数据对象不服从局部数据集分布特征的程度,并选取离群程度最大的N个数据对象定义为局部离群数据;在此基础上,采用LSH分布式策略,提出了一种Map Reduce编程模型下的局部离群数据挖掘算法;最后,采用人工数据集和恒星光谱数据集,实验验证了该算法的有效性、可扩展性和可伸缩性.
关 键 词:局部离群数据 相关子空间 MAP REDUCE 局部稀疏度 概率密度
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...