期刊文章详细信息
一种基于特征重要度的文本分类特征加权方法 ( EI收录)
A Feature Weighting Scheme for Text Categorization Based on Feature Importance
文献类型:期刊文章
机构地区:[1]吉林大学计算机科学与技术学院,长春130012 [2]吉林大学符号计算与知识工程教育部重点实验室,长春130012 [3]内蒙古民族大学计算机科学与技术学院,内蒙古通辽028043
基 金:国家自然科学基金重大项目(60496321);国家自然科学基金项目(60773099;60573073);国家"八六三"高技术研究发展计划基金项目(2006AA10Z245;2006AA10A309);吉林省科技发展计划基金重大项目(20020303);吉林省科技发展计划基金项目(20030523);欧盟项目TH/Asia Link/010(111084)~~
年 份:2009
卷 号:46
期 号:10
起止页码:1693-1703
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:针对文本分类中的特征加权问题,提出了一种基于特征重要度的特征加权方法.该方法基于实数粗糙集理论,通过定义特征重要度,将特征对分类的决策信息引入到特征权重中.然后,在标准文本数据集Reuters-21578 Top10和WebKB上进行了实验.结果表明,该方法能改善样本空间的分布状态,使同类样本更加紧凑,异类样本更加松散,从而简化从样本到类别的映射关系.最后,使用Nave Bayes,kNN和SVM分类器在上述数据集上对该方法进行了实验.结果表明,该方法能提高分类的准确率、召回率和F1值.
关 键 词:文本分类 特征加权 特征重要度 粗糙集 决策表
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...