登录    注册    忘记密码

期刊文章详细信息

一种基于朴素贝叶斯的微博情感分类    

Classification of Microblog Sentiment Based on Nave Bayesian

  

文献类型:期刊文章

作  者:林江豪[1] 阳爱民[2] 周咏梅[2] 陈锦[3] 蔡泽键[2]

机构地区:[1]广东外语外贸大学国际工商管理学院,广东广州510006 [2]广东外语外贸大学思科信息学院,广东广州510006 [3]广东外语外贸大学英语语言文化学院,广东广州510006

出  处:《计算机工程与科学》

基  金:国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年资助项目(10YJCZH247);广东省科技计划资助项目(2010B031000014);广东外语外贸大学研究生科研创新资助项目;广东外语外贸大学大学生创新实验资助项目

年  份:2012

卷  号:34

期  号:9

起止页码:160-165

语  种:中文

收录情况:BDHX、BDHX2011、CSCD、CSCD2011_2012、INSPEC、ZGKJHX、核心刊

摘  要:本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。

关 键 词:微博  文本情感分类 二次情感特征提取  朴素贝叶斯

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心