期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国人民大学信息学院,北京100872 [2]广西建设职业技术学院计算机与信息技术系,南宁530003 [3]中央财经大学信息学院,北京100081
基 金:国家"八六三"高技术研究发展计划项目基金(2008AA01Z120)资助
年 份:2010
卷 号:33
期 号:8
起止页码:1427-1436
语 种:中文
收录情况:BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20103613222386)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:频繁项集是通过对大规模数据进行挖掘获取的代表数据模式的知识结构.非可导频繁项集作为频繁项集的有效压缩方式,能够高效深入地挖掘海量数据、稠密数据与数据流当中的规律.针对项集在计算界限值时代价昂贵的缺点,提出了近似可导项集的概念,并基于纵向数据格式实现了挖掘算法MANDI,能够提高支持度计算和项集间操作的速度.另外,为了满足数据流实时、快速的特点,讨论并证明了近似可导项集的增量性质,提出了可动态更新的算法UANDI.通过实验验证了两种算法的可行性和有效性.
关 键 词:近似非可导频繁项集 纵向数据格式 数据流 数据流挖掘
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...