期刊文章详细信息
文献类型:期刊文章
机构地区:[1]西北工业大学计算机学院,西安710129 [2]陕西省嵌入式系统技术重点实验室,西安710129
基 金:国家重点基础研究发展计划(973)(No.2012CB316400);国家自然科学基金(No.61222209;No.61103063);教育部"新世纪优秀人才支持计划"(No.NCET-12-0466);教育部高等学校博士学科点专项科研基金(博导类)(No.20126102110043);陕西省自然科学基础研究计划项目(No.2012JQ8028)
年 份:2015
卷 号:51
期 号:8
起止页码:218-225
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:通过对微博文本的特性分析,提取了中文微博情感分析的关键问题:如何识别微博新词并理解其情感含义?如何利用附加信息辅助文本情感分析?如何结合语言特性构造情感计算方法?针对第一个问题,利用统计信息和点间互信息对新词进行挖掘和情感识别,在40万条新浪微博数据中构建了新情感词词典,用于对已有情感词资源的扩充。对于后两个问题,提出了基于词典和规则集的中文微博情感分析方法。根据微博特性,在不同的语言层次上定义了规则,结合情感词典对微博文本进行了从词语到句子的多粒度情感计算,并以表情符号作为情感计算的辅助元素。通过对采集到的原创微博数据集进行实验,验证了该方法的有效性。
关 键 词:微博 新词挖掘 规则集 情感分析
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...