期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京科技大学东凌经济管理学院管理科学与工程系,北京100083 [2]国家信息中心信息化研究部,北京100045
基 金:国家自然科学基金(70771007);中央高校基本科研业务费专项资金(FRF-TP-10-006B)资助~~
年 份:2012
卷 号:35
期 号:8
起止页码:1726-1738
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20124415622460)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的.
关 键 词:数据填补 不完备数据 聚类 约束容差集合差异度
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...