期刊文章详细信息
基于分类的微博新情感词抽取方法和特征分析 ( EI收录)
A Classification Based Sentiment Words Extracting Method from Microblogs and Its Feature Engineering
文献类型:期刊文章
LIU De-Xi;NIE Jian-Yun;WAN Chang-Xuan;LIU Xi-Ping;LIAO Shu-Mei;LIAO Guo-Qiong;ZHONG Min-Juan;JIANG Teng-Jiao(School of InforTnation Technology,Jiangxi University of Finance and Economics,Nanchang 330013;Department of Computer Science and Operations Research,University of Montreal,Montreal H3C3J7,Canada)
机构地区:[1]江西财经大学信息管理学院,南昌330013 [2]蒙特利尔大学计算机科学与运筹学系
基 金:国家自然科学基金(61762042;61363039;61562032);江西省落地计划项目(KJLD14035);江西省自然科学基金(20171BAB202021;20152ACB20003)资助~~
年 份:2018
卷 号:41
期 号:7
起止页码:1574-1597
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD2017_2018、EI、IC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的发布和传播提供了便捷的途径,是新情感词的重要来源.考虑到已有规模较大的人工情感词典及大量包含新情感词的微博数据,在统计、分析、对比中、英两种语言微博中情感词分布差异的基础上,提出了与特定语言无关的基于分类思想的微博新情感词抽取方法cNSEm.cNSEm根据微博数据集和情感词典自动构建训练数据、训练分类器并判别候选词的情感极性,最后采用投票机制确定候选词的情感极性.通过大量而细致的实验,分析了cNSEm在中、英文两种语言的微博数据上的表现、六类特征的作用和用法以及抽取的新情感词对微博情感分类任务的帮助作用.实验结果表明,cNSEm比经典的基于共现和极性传播的方法要好,特别是当考虑中文微博数据集中的名词类情感词时.对cNSEm抽取的新情感词进行了直接和间接两种方法评测,前者利用人工情感词典作参照,后者考察抽取的新情感词对情感分类的帮助作用,从评测指标上看,cNSEm抽取的新情感词与人工情感词典的质量相当,并且cNSEm能适应有较大差异的中、英两个语种.
关 键 词:微博 新情感词抽取 cNSEm方法 特征分析
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...