登录    注册    忘记密码

期刊文章详细信息

一种基于特征扩展的中文短文本分类方法    

Method for Chinese short text classification based on feature extension

  

文献类型:期刊文章

作  者:王细薇[1] 樊兴华[1] 赵军[1]

机构地区:[1]重庆邮电大学计算机科学与技术研究所,重庆400065

出  处:《计算机应用》

基  金:国家自然科学基金资助项目(60703010);重庆市自然科学基金资助项目(2006BB2374);重庆市教委科学技术研究项目(KJ070519);教育部回国留学人员启动基金项目(教外司留【2007】1108号);重庆邮电大学科研基金项目(A2006-05)

年  份:2009

卷  号:29

期  号:3

起止页码:843-845

语  种:中文

收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP-Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展。同时,引入语义信息并且改进了知网中DEF词条的描述能力公式,在此基础上对中文短文本进行分类。实验证明,这种方法具有高的分类性能,其微平均和宏平均值都高于常规的文本分类方法。

关 键 词:短文本分类  关联规则挖掘 特征扩展  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心