期刊文章详细信息
文本分类中信息增益特征选择算法的改进
IMPROVING THE ALGORITHM OF INFORMATION GAIN FEATURE SELECTION IN TEXT CLASSIFICATION
文献类型:期刊文章
机构地区:[1]信阳师范学院计算机与信息技术学院,河南信阳464000 [2]平顶山学院软件学院,河南平顶山467000
基 金:河南省科技厅基础与前沿技术研究计划项目(122300410281)
年 份:2013
卷 号:30
期 号:8
起止页码:139-142
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、ZGKJHX、核心刊
摘 要:特征选择算法对文本分类系统的精确度有很大影响,传统的信息增益特征选择算法通常会导致在指定类别中很少出现而在其他类别中频繁出现的特征被选择出来。为克服这一缺陷,在对传统算法和相关改进算法深入分析的基础上,引入特征分布差异因子、类内和类间加权因子的改进思路,提出一种基于特征分布加权的信息增益改进算法,并分别采用朴素贝叶斯和支持向量机两种分类算法进行实验。实验结果表明,该算法优于其他改进算法。
关 键 词:文本分类 特征选择 信息增益 特征分布加权
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...