登录    注册    忘记密码

期刊文章详细信息

基于词典和规则集的中文微博情感分析    

Sentiment analysis of Chinese micro blog based on lexicon and rule set

  

文献类型:期刊文章

作  者:王志涛[1,2] 於志文[1,2] 郭斌[1,2] 路新江[1,2]

机构地区:[1]西北工业大学计算机学院,西安710129 [2]陕西省嵌入式系统技术重点实验室,西安710129

出  处:《计算机工程与应用》

基  金:国家重点基础研究发展计划(973)(No.2012CB316400);国家自然科学基金(No.61222209;No.61103063);教育部"新世纪优秀人才支持计划"(No.NCET-12-0466);教育部高等学校博士学科点专项科研基金(博导类)(No.20126102110043);陕西省自然科学基础研究计划项目(No.2012JQ8028)

年  份:2015

卷  号:51

期  号:8

起止页码:218-225

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘  要:通过对微博文本的特性分析,提取了中文微博情感分析的关键问题:如何识别微博新词并理解其情感含义?如何利用附加信息辅助文本情感分析?如何结合语言特性构造情感计算方法?针对第一个问题,利用统计信息和点间互信息对新词进行挖掘和情感识别,在40万条新浪微博数据中构建了新情感词词典,用于对已有情感词资源的扩充。对于后两个问题,提出了基于词典和规则集的中文微博情感分析方法。根据微博特性,在不同的语言层次上定义了规则,结合情感词典对微博文本进行了从词语到句子的多粒度情感计算,并以表情符号作为情感计算的辅助元素。通过对采集到的原创微博数据集进行实验,验证了该方法的有效性。

关 键 词:微博  新词挖掘  规则集 情感分析

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心