登录    注册    忘记密码

专利详细信息

一种基于数据压缩的改进的Apriori算法       

文献类型:专利

专利类型:发明专利

是否失效:

是否授权:

申 请 号:CN201110430528.9

申 请 日:20111220

发 明 人:高海洋 沈强 张轩溢 唐朝伟 赵志军 慈松 唐晖

申 请 人:中国科学院声学研究所 无锡中科智能信息处理研发中心有限公司

申请人地址:100190 北京市海淀区北四环西路21号

公 开 日:20130626

公 开 号:CN103176976A

代 理 人:杨小蓉;高宇

代理机构:11318 北京法思腾知识产权代理有限公司

语  种:中文

摘  要:一种基于数据压缩的改进的Apriori算法,包括步骤:判断数据库中的事物记录条数N大于该数据库中所有数据项的所有可能的组合数M时,生成数据库项与该数据项数量的映射表DB_Map_Table;将该映射表DB_Map_Table中的所有健值对<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)项候选集时,判断将要合并的两个频繁集中不同的项所组成的二项集是否为2项频繁集的子集,如果是,则将将要合并的两个频繁集的合集加入候选集。本发明的效果在于,减小了原有事务数据库的大小,减少了数据库的扫描次数,减少了算法运行过程中候选集的生成,从而在保证算法正确的同时有效地提高了算法的速度和效率。

主 权 项:1.一种基于数据压缩的改进的Apriori算法,包括步骤:判断数据库中的事物记录条数N大于该数据库中所有数据项的所有可能的组合数M时,生成数据库项与该数据项数量的映射表DB_Map_Table;将该映射表DB_Map_Table中的所有健值对<key,value>按key的大小升序排列,即KEY={key1,key2,...keym},key1<key2<...<keym;利用Apriori算法从DB_Map_Table表的第处开始扫描该DB_Map_Table表,以计算每个候选集Ik={I1,I2...Ix}的支持度。

关 键 词:算法  数据库 数据项 映射表 事务数据库 速度和效率  扫描次数  事物记录  数据压缩 合并  组合数 健值  子集 排列  大于  

IPC专利分类号:G06F17/30(20060101)

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心