期刊文章详细信息
变精度下不完备混合数据的增量式属性约简方法
Incremental attribute reduction method for incomplete hybrid data with variable precision
文献类型:期刊文章
WANG Yinglong;ZENG Qi;QIAN Wenbin;SHU Wenhao;HUANG Jintao(School of Computer and Information Engineering,Jiangxi Agricultural University,Nanchang Jiangxi 330045,China;School of Software,Jiangxi Agricultural University,Nanchang Jiangxi 330045,China;School of Information Engineering,East China Jiaotong University,Nanchang Jiangxi 330013,China)
机构地区:[1]江西农业大学计算机与信息工程学院,南昌330045 [2]江西农业大学软件学院,南昌330045 [3]华东交通大学信息工程学院,南昌330013
基 金:国家自然科学基金资助项目(61502213;61662023);江西省自然科学基金资助项目(20161BAB212049)~~
年 份:2018
卷 号:38
期 号:10
起止页码:2764-2771
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完备混合数据的增量式属性约简方法。首先,在变精度模型下给出了利用条件熵度量属性的重要性程度;然后,详细分析和设计了当数据动态增加时条件熵的增量式更新变化情况和属性约简的更新机制;在此基础上,利用启发式贪心策略构造了增量式的属性约简算法,实现了不完备的数值型和符号型混合数据下属性约简的动态更新。通过UCI数据集中五个真实的混合型数据集的实验比较和分析,在约简效果方面,利用增量式属性约简算法处理Echocardiogram、Hepatitis、Autos、Credit和Dermatology数据集的增量规模为90%+10%时,数据集的原属性个数分别由12、19、25、17和34个约简至6、7、10、11和13个,分别占原属性集的50. 0%、36. 8%、40. 0%、64. 7%和38. 2%;在执行时间方面,增量式算法在五个数据集的平均耗时分别为2. 99 s、3. 13 s、9. 70 s、274. 19 s和50. 87 s,静态算法的平均耗时分别为284. 92 s、302. 76 s、1062. 23 s、3510. 79 s和667. 85 s,且增量式算法的耗时与数据集的实例规模、属性个数和属性值类型的分布相关。实验结果表明,增量式属性约简算法在计算耗时方面要显著优于静态算法,且能有效剔除数据中的冗余属性。
关 键 词:粗糙集 属性约简 邻域关系 增量式方法 不完备混合数据
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...