登录    注册    忘记密码

期刊文章详细信息

相似重复记录清理方法研究综述    

A Survey of Approximately Duplicate Data Cleaning Method

  

文献类型:期刊文章

作  者:叶焕倬[1] 吴迪[1]

机构地区:[1]中南财经政法大学信息与安全工程学院信息系,武汉430073

出  处:《现代图书情报技术》

基  金:国家自然科学基金资助项目"持续审计中智能数据处理及其应用框架研究"(项目编号:70972138);湖北省教育厅人文社会科学基金项目"基于SOA和MAS的金融监管信息系统总体框架研究"(项目编号:2009b080)的研究成果之一

年  份:2010

期  号:9

起止页码:56-66

语  种:中文

收录情况:BDHX、BDHX2008、CSSCI、CSSCI2010_2011、RWSKHX、核心刊

摘  要:介绍相似重复数据清理的步骤、框架和衡量标准。重点对检测和清除算法按照算法类型及相关改进思路进行分类综述,给出算法的适用范围和优缺点,概括现有的数据清理工具(如Merge/Purge)。对相似重复记录清理领域的研究问题进行展望,将知识和语义的概念引入到数据清理框架中是未来重要的发展趋势。

关 键 词:相似重复记录 数据清洗 检测算法  清除算法  

分 类 号:TP311.13]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心