期刊文章详细信息
文献类型:期刊文章
机构地区:[1]解放军三七一中心医院,河南新乡453002 [2]新乡医学院,河南新乡453003 [3]新乡医学院图书馆,河南新乡453003
基 金:河南省科技计划重点项目(102102210191);河南省教育厅自然科学研究资助计划项目(2009A520013)
年 份:2011
卷 号:19
期 号:5
起止页码:1021-1023
语 种:中文
收录情况:BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD_E2011_2012、INSPEC、ZGKJHX、核心刊
摘 要:本文提出一种基于遗传神经网络的相似重复记录检测方法,充分利用了神经网络的非线性映射和遗传算法的全局优化特性,将基于学习的思想和进化的思想有效结合并应用到重复记录检测中,避开了传统方法计算属性权重的问题,并对遗传神经网络进行改进。实验结果表明本文方法能够有效地解决大数据量的相似重复记录检测问题,不仅具有好的检测精度,而且具有很好的时间效率。
关 键 词:相似重复记录 遗传算法 神经网络 数据清洗
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...