登录    注册    忘记密码

期刊文章详细信息

基于距离的自适应Web数据库记录匹配方法    

Distance-Based Adaptive Record Matching for Web Databases

  

文献类型:期刊文章

作  者:崔晓军[1,2] 肖红宇[1] 丁立新[2]

机构地区:[1]温州科技职业学院信息技术系,浙江温州325006 [2]武汉大学软件工程国家重点实验室,湖北武汉430072

出  处:《武汉大学学报(理学版)》

基  金:国家自然科学基金(60975050);高等学校博士学科点专项科研基金(20070486081);中央高校基本科研业务费专项资金(6081014)资助项目

年  份:2012

卷  号:58

期  号:1

起止页码:89-94

语  种:中文

收录情况:AJ、BDHX、BDHX2011、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、ZR、核心刊

摘  要:Web数据库环境的重复记录识别是Deep Web信息集成的重要步骤,具有查询依赖性、缺乏训练样本、在线处理要求等特征,导致现有的实体识别技术无法适用.在分析现有方法基础上,引入动态属性权重调整思想,提出基于距离的自适应记录匹配算法,在计算记录对的相似度时,加大匹配记录集合中相似度较大的属性的权重,并加大非匹配记录集合中相似度较小的属性的权重,迭代处理从而达到自适应动态调整各个属性权重的目标.该方法不需要训练样本,也不需要人工参与,实验结果表明其适用于Web数据库环境的重复记录识别处理.

关 键 词:WEB数据库 记录匹配  实体识别  比较向量  权重向量

分 类 号:TP393]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心