登录    注册    忘记密码

期刊文章详细信息

基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法    

Association rule mining method based on double threshold Apriori algorithm and infrequent itemsets

  

文献类型:期刊文章

作  者:阮梦黎[1] 吴磊[2]

Ruan Mengli;Wu Lei(School of Information Engineering,Shandong Management University,Jinan 250357,China;School of Information Science & Engineering,Shandong Normal University,Jinan 250358,China)

机构地区:[1]山东管理学院信息工程学院,济南250357 [2]山东师范大学信息科学与工程学院,济南250358

出  处:《计算机应用研究》

基  金:国家自然科学基金资助项目(61602287);山东省社会科学规划研究项目(17CQXJ11);山东省高等学校科技计划资助项目(J16LN70)

年  份:2018

卷  号:35

期  号:12

起止页码:3579-3583

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:针对从数据集中的正负关联规则挖掘问题,提出一种基于双阈值Apriori算法和非频繁项集的挖掘方法。首先,对通过逆文档频率(IDF)对语料库中的项(项集)进行加权,筛选出前N%的项集;然后,通过提出的双支持度阈值Apriori算法来提取频繁项集和非频繁项集,以此降低非频繁项集的数量;最后,通过置信度和升降度阈值的判断,分别从频繁项集和非频繁项集中挖掘正负关联规则。其中,创新性地利用了非频繁项集来挖掘正负关联规则。在一个医学文本数据集上的实验结果表明,提出的方法能够有效地挖掘出正负关联规则,且能够大大降低项集和规则数量。

关 键 词:正负关联规则挖掘  双支持度阈值  APRIORI算法 非频繁项集 IDF加权  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心