期刊文章详细信息
文献类型:期刊文章
LIU Yan-rong;YANG Yun(School of Information and Engineering,Shaanxi Institute of International Trade&Commerce,Xi’an 712000,China;School of Electronic Information and Artificial Intelligence,Shaanxi University of Science&Technology,Xi’an 710021,China)
机构地区:[1]陕西国际商贸学院信息工程学院,陕西西安712000 [2]陕西科技大学电子信息与人工智能学院,陕西西安710021
基 金:陕西省重点研发计划(2019NY-185);陕西省自然科学基金(2017JM6111)。
年 份:2021
卷 号:31
期 号:2
起止页码:54-59
语 种:中文
收录情况:JST、RCCSE、ZGKJHX、普通刊
摘 要:在关联规则挖掘算法中,Apriori由于多次对数据库进行扫描会产生较多的候选集,在多次扫描数据库的情况下容易产生I/O开销问题,并引起数据挖掘效率低。矩阵关联规则在数据挖掘过程中没有删除非频繁项集,致使存在较多的无效扫描,对于挖掘效率的提高也不明显。该文提出了一种改进的矩阵和排序索引关联规则数据挖掘算法,首先,删除不需要的事务和项,通过矩阵相乘和查找表获得频繁的二项式集合,结合排序索引得到剩下的频繁k-项集。与矩阵关联规则算法和Apriori算法进行比较,提出的算法可以直接查找频繁项集并对数据库进行扫描,当产生频繁项集比较多或者数据库需要进行动态更新时,该算法具有较好的可行性和执行效率。实验表明,提出的矩阵排序索引算法很好地降低了内存的使用率和I/O的开销,提高了数据挖掘的效率且具有较好的可扩展性。
关 键 词:数据挖掘 关联规则 APRIORI算法 矩阵算法 排序索引 序列标记
分 类 号:TP305]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...