登录    注册    忘记密码

期刊文章详细信息

缺失数据处理方法的比较研究    

A Comparison Study of Missing Value Processing Methods

  

文献类型:期刊文章

作  者:刘鹏[1] 雷蕾[1] 张雪凤[1]

机构地区:[1]上海财经大学经济信息管理系,上海200433

出  处:《计算机科学》

基  金:上海财经大学"211工程"重点学科建设项目资助(2004[9])

年  份:2004

卷  号:31

期  号:10

起止页码:155-156

语  种:中文

收录情况:BDHX、BDHX2000、CSA、CSCD、CSCD2011_2012、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。

关 键 词:信息增益 朴素贝叶斯分类器 模型  数据挖掘 决策树 数据集  医疗领域  医疗数据 保留  处理  

分 类 号:TP391] TP311[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心