期刊文章详细信息
基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法
Association rule mining method based on double threshold Apriori algorithm and infrequent itemsets
文献类型:期刊文章
Ruan Mengli;Wu Lei(School of Information Engineering,Shandong Management University,Jinan 250357,China;School of Information Science & Engineering,Shandong Normal University,Jinan 250358,China)
机构地区:[1]山东管理学院信息工程学院,济南250357 [2]山东师范大学信息科学与工程学院,济南250358
基 金:国家自然科学基金资助项目(61602287);山东省社会科学规划研究项目(17CQXJ11);山东省高等学校科技计划资助项目(J16LN70)
年 份:2018
卷 号:35
期 号:12
起止页码:3579-3583
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:针对从数据集中的正负关联规则挖掘问题,提出一种基于双阈值Apriori算法和非频繁项集的挖掘方法。首先,对通过逆文档频率(IDF)对语料库中的项(项集)进行加权,筛选出前N%的项集;然后,通过提出的双支持度阈值Apriori算法来提取频繁项集和非频繁项集,以此降低非频繁项集的数量;最后,通过置信度和升降度阈值的判断,分别从频繁项集和非频繁项集中挖掘正负关联规则。其中,创新性地利用了非频繁项集来挖掘正负关联规则。在一个医学文本数据集上的实验结果表明,提出的方法能够有效地挖掘出正负关联规则,且能够大大降低项集和规则数量。
关 键 词:正负关联规则挖掘 双支持度阈值 APRIORI算法 非频繁项集 IDF加权
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...