期刊文章详细信息
文献类型:期刊文章
机构地区:[1]荆州师范学院信息科学学院,湖北荆州434104 [2]华中科技大学计算机学院数据库与多媒体技术研究所,湖北武汉430074
基 金:国家科技攻关计划项目"科技部科技电子政务系统关键技术及应用系统的研究"(2001BA110B01)
年 份:2003
卷 号:20
期 号:9
起止页码:36-39
语 种:中文
收录情况:AJ、BDHX、BDHX2000、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:数据清理转换是数据仓库中的一个重要研究领域,其技术难点之一是重复记录的识别。介绍了与重复记录识别相关的字符串匹配方法,详细讨论了识别重复记录的分区式优先队列算法、多趟邻近排序法以及邻近连接法,最后给出了实验结果。
关 键 词:数据清理 重复记录识别 字符串匹配 数据仓库
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...