期刊文章详细信息
基于遗传神经网络的相似重复记录检测方法
Approximately duplicate record detection method based on neural network and genetic algorithm
文献类型:期刊文章
机构地区:[1]空军雷达学院研究生管理大队,湖北武汉430019 [2]空军雷达学院信息与指挥自动化系,湖北武汉430019
基 金:国家863高技术研究发展计划基金项目(2009AAJ127)
年 份:2010
卷 号:31
期 号:7
起止页码:1550-1553
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD_E2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:为了有效解决数据清洗领域中相似重复记录的检测问题,提出了一种基于遗传神经网络的相似重复记录检测方法。该方法计算两条记录对应字段间的相似度,构建基于神经网络的检测模型,利用遗传算法对网络模型的权值进行优化,使用遗传神经网络组合多个字段上的相似度来检测相似重复记录。在不同领域数据集上的测试结果表明,该方法能够提高相似重复记录检测的准确率和检测精度。
关 键 词:相似重复记录检测 神经网络 遗传算法 数据清洗 数据集成
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...