期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中南财经政法大学信息与安全工程学院信息系,武汉430073
基 金:国家自然科学基金资助项目"持续审计中智能数据处理及其应用框架研究"(项目编号:70972138);湖北省教育厅人文社会科学基金项目"基于SOA和MAS的金融监管信息系统总体框架研究"(项目编号:2009b080)的研究成果之一
年 份:2010
期 号:9
起止页码:56-66
语 种:中文
收录情况:BDHX、BDHX2008、CSSCI、CSSCI2010_2011、RWSKHX、核心刊
摘 要:介绍相似重复数据清理的步骤、框架和衡量标准。重点对检测和清除算法按照算法类型及相关改进思路进行分类综述,给出算法的适用范围和优缺点,概括现有的数据清理工具(如Merge/Purge)。对相似重复记录清理领域的研究问题进行展望,将知识和语义的概念引入到数据清理框架中是未来重要的发展趋势。
关 键 词:相似重复记录 数据清洗 检测算法 清除算法
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...