期刊文章详细信息
文献类型:期刊文章
机构地区:[1]上海财经大学经济信息管理系,上海200433
基 金:上海财经大学"211工程"重点学科建设项目资助(2004[9])
年 份:2004
卷 号:31
期 号:10
起止页码:155-156
语 种:中文
收录情况:BDHX、BDHX2000、CSA、CSCD、CSCD2011_2012、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。
关 键 词:信息增益 朴素贝叶斯分类器 模型 数据挖掘 决策树 数据集 医疗领域 医疗数据 保留 处理
分 类 号:TP391] TP311[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...