期刊文章详细信息
文献类型:期刊文章
机构地区:[1]电子科技大学数学科学学院,成都611731 [2]新疆财经大学计算机科学与工程学院,乌鲁木齐830012
基 金:国家自然科学基金(61163066)资助
年 份:2017
卷 号:44
期 号:7
起止页码:262-266
语 种:中文
收录情况:BDHX、BDHX2014、CSCD、CSCD_E2017_2018、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:对于规模庞大的事务数据库,传统的并行Apriori算法在挖掘中会在数据IO上有较大的时间开销。从压缩事务、减少扫描次数、简化候选集生成3个方面对Apriori算法进行改进。提出了以元素"0"和"1"表示事务的布尔矩阵模型,并引入权值维度,压缩了相同事务的矩阵规模。同时,动态地进行剪枝,矩阵的"与"运算用于候选集合的生成。将改进后的算法在Hadoop框架上进行并行化实现,实验表明该算法适合大规模数据挖掘且具有良好的伸缩性与有效性。
关 键 词:APRIORI算法 事务数据库 布尔矩阵 HADOOP
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...