期刊文章详细信息
文献类型:期刊文章
机构地区:[1]广东外语外贸大学国际工商管理学院,广东广州510006 [2]广东外语外贸大学思科信息学院,广东广州510006 [3]广东外语外贸大学英语语言文化学院,广东广州510006
基 金:国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年资助项目(10YJCZH247);广东省科技计划资助项目(2010B031000014);广东外语外贸大学研究生科研创新资助项目;广东外语外贸大学大学生创新实验资助项目
年 份:2012
卷 号:34
期 号:9
起止页码:160-165
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2011_2012、INSPEC、ZGKJHX、核心刊
摘 要:本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。
关 键 词:微博 文本情感分类 二次情感特征提取 朴素贝叶斯
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...