期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学技术大学电子工程与信息科学系,合肥230027 [2]中国科学技术大学计算机科学技术系,合肥230027 [3]安徽中科大讯飞信息科技有限公司,合肥230088
基 金:国家"八六三"高技术研究发展计划项目基金(2004AA114030)资助.~~
年 份:2005
卷 号:28
期 号:7
起止页码:1223-1229
语 种:中文
收录情况:BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算法StaFSOS,并证明了在类别数为2时,SCD测度满足分支界限法的单调性;给出了StaFSOS的一个完备形式———BBStaFS.在12个标准数据集中,StaFSOS算法得出的结果和目标集几乎一致,而StaFSOS的效率高于其它算法;而在另1个中,BBStaFS算法得出了准确结果.在用1000个样本20个特征的真实数据进行的测试中,StaFSOS运行时间是目前较快的GRSR的1/2,得出的特征集准确有效.
关 键 词:数据挖掘 分类 特征选择
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...