期刊文章详细信息
融合PLS监督特征提取和虚假最近邻点的数据分类特征选择
Feature selection for data classification based on pls supervised feature extraction and false nearest neighbors
文献类型:期刊文章
Yan Kesheng*, Li Taifu2, Wei Zhengyuan, Su Yingying2 and Yao Lizhong3 (1. School of Mathematics and Statistics, Chongqing University of Technology, Chongqing, 400054, China) (2. School of Electric and Information Engineering, Chongqing University of Science and Technology, Chongqing, 401331, China) (3. School of Electronic Engineering, Xi'an Shiyou University, Xi'an, 710065, Shanxi, China)
机构地区:重庆理工大学数学与统计学院,重庆400054 重庆科技学院科研处 重庆理工大学数学与统计学院,重庆400054 重庆科技学院电气与信息工程学院 西安石油大学电子工程学院,陕西西安710065
年 份:2012
卷 号:29
期 号:7
起止页码:817-821
语 种:中文
收录情况:BDHX、BDHX2011、CAS、CSCD、CSCD(2011-2012)、JST、ZGKJHX、核心刊
摘 要:在高维数据分类中,针对多重共线性、冗余特征及噪声易导致分类器识别精度低和时空开销大的问题,提出融合偏最小二乘(Partial Least Squares,PLS)有监督特征提取和虚假最近邻点(False Nearest Neighbors,FNN)的特征选择方法:首先利用偏最小二乘对高维数据提取主元,消除特征之间的多重共线性,得到携带监督信息的独立主元空间;然后通过计算各特征选择前后在此空间的相关性,建立基于虚假最近邻点的特征相似性测度,得到原始特征对类别变量解释能力强弱排序;最后,依次剔除解释能力弱的特征,构造出各种分类模型,并以支持向量机(Support Vector Machine,SVM)分类识别率为模型评估准则,搜索出识别率最高但含特征数最少的分类模型,此模型所含的特征即为最佳特征子集。3个数据集模型仿真结果均表明,由此法选择出的最佳特征子集与各数据集的本质分类特征吻合,说明该方法有良好的特征选择能力,为数据分类特征选择提供了一条新途径。
关 键 词:偏最小二乘 虚假最近邻点 相似性测度 特征选择
分 类 号:TP391.4] O235
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...