期刊文章详细信息
改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA
FP-MFIA: improved algorithm for mining maximum frequent itemsets based on frequent-pattern tree
文献类型:期刊文章
机构地区:[1]中国科学院物联网研究发展中心,江苏无锡214135 [2]江苏物联网研究发展中心,江苏无锡214135 [3]无锡中科泛在信息技术研发中心有限公司,江苏无锡214135 [4]国网枣庄供电公司,山东枣庄277100
基 金:国家科技支撑计划项目(2012BAF12B08)
年 份:2015
卷 号:35
期 号:3
起止页码:775-778
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作。在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量。同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间。通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显。
关 键 词:最大频繁项集 频繁模式树 数据挖掘 关联规则 非频繁项集
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...