登录    注册    忘记密码

期刊文章详细信息

一种基于特征重要度的文本分类特征加权方法  ( EI收录)  

A Feature Weighting Scheme for Text Categorization Based on Feature Importance

  

文献类型:期刊文章

作  者:刘赫[1,2] 刘大有[1,2] 裴志利[3] 高滢[1,2]

机构地区:[1]吉林大学计算机科学与技术学院,长春130012 [2]吉林大学符号计算与知识工程教育部重点实验室,长春130012 [3]内蒙古民族大学计算机科学与技术学院,内蒙古通辽028043

出  处:《计算机研究与发展》

基  金:国家自然科学基金重大项目(60496321);国家自然科学基金项目(60773099;60573073);国家"八六三"高技术研究发展计划基金项目(2006AA10Z245;2006AA10A309);吉林省科技发展计划基金重大项目(20020303);吉林省科技发展计划基金项目(20030523);欧盟项目TH/Asia Link/010(111084)~~

年  份:2009

卷  号:46

期  号:10

起止页码:1693-1703

语  种:中文

收录情况:AJ、BDHX、BDHX2008、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:针对文本分类中的特征加权问题,提出了一种基于特征重要度的特征加权方法.该方法基于实数粗糙集理论,通过定义特征重要度,将特征对分类的决策信息引入到特征权重中.然后,在标准文本数据集Reuters-21578 Top10和WebKB上进行了实验.结果表明,该方法能改善样本空间的分布状态,使同类样本更加紧凑,异类样本更加松散,从而简化从样本到类别的映射关系.最后,使用Nave Bayes,kNN和SVM分类器在上述数据集上对该方法进行了实验.结果表明,该方法能提高分类的准确率、召回率和F1值.

关 键 词:文本分类 特征加权 特征重要度  粗糙集 决策表

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心