期刊文章详细信息
不产生候选项集的TOP-K高效用模式挖掘算法 ( EI收录)
An Algorithm of Mining TOP-K High Utility Patterns Without Generating Candidates
文献类型:期刊文章
机构地区:[1]宁波大红鹰学院信息工程学院,浙江宁波315175 [2]大连理工大学电子信息与电气工程学部计算机科学与技术学院,辽宁大连116024
基 金:国家自然科学基金项目(61370200);宁波市自然科学基金项目(2013A610115;2014A610073);浙江省教育厅一般科研项目(Y201432717)
年 份:2015
卷 号:52
期 号:2
起止页码:445-455
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD2015_2016、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.
关 键 词:高效用模式 频繁模式 频繁项集 数据挖掘 TOP—K
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...