专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201110430528.9
申 请 日:20111220
申 请 人:中国科学院声学研究所 无锡中科智能信息处理研发中心有限公司
申请人地址:100190 北京市海淀区北四环西路21号
公 开 日:20130626
公 开 号:CN103176976A
代 理 人:杨小蓉;高宇
代理机构:11318 北京法思腾知识产权代理有限公司
语 种:中文
摘 要:一种基于数据压缩的改进的Apriori算法,包括步骤:判断数据库中的事物记录条数N大于该数据库中所有数据项的所有可能的组合数M时,生成数据库项与该数据项数量的映射表DB_Map_Table;将该映射表DB_Map_Table中的所有健值对<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)项候选集时,判断将要合并的两个频繁集中不同的项所组成的二项集是否为2项频繁集的子集,如果是,则将将要合并的两个频繁集的合集加入候选集。本发明的效果在于,减小了原有事务数据库的大小,减少了数据库的扫描次数,减少了算法运行过程中候选集的生成,从而在保证算法正确的同时有效地提高了算法的速度和效率。
主 权 项:1.一种基于数据压缩的改进的Apriori算法,包括步骤:判断数据库中的事物记录条数N大于该数据库中所有数据项的所有可能的组合数M时,生成数据库项与该数据项数量的映射表DB_Map_Table;将该映射表DB_Map_Table中的所有健值对<key,value>按key的大小升序排列,即KEY={key1,key2,...keym},key1<key2<...<keym;利用Apriori算法从DB_Map_Table表的第
关 键 词:算法 数据库 数据项 映射表 事务数据库 速度和效率 扫描次数 事物记录 数据压缩 合并 组合数 健值 子集 排列 大于
IPC专利分类号:G06F17/30(20060101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...