登录    注册    忘记密码

期刊文章详细信息

基于表情符号的情感词典的构建研究    

Research on Building Sentiment Lexicon Based on Emoticons

  

文献类型:期刊文章

作  者:林江豪[1,2] 顾也力[1] 周咏梅[2,3] 阳爱民[2,3] 陈锦[1,2]

LIN Jiang-hao;GU Ye-li;ZHOU Yong-mei;YANG Ai-min;CHEN Jin(Guangdong University of Foreign Studies,Guangzhou 510006,China;Laboratory for Language Engineering and Computing,Guangdong University of Foreign Studies,Guangzhou 510006,China;School of Information Science and Technology,Guangdong University of Foreign Studies,Guangzhou 510006,China)

机构地区:[1]广东外语外贸大学,广东广州510006 [2]广东外语外贸大学语言工程与计算实验室,广东广州510006 [3]广东外语外贸大学信息科学与技术学院,广东广州510006

出  处:《计算机技术与发展》

基  金:教育部人文社会科学项目(14YJA740011);广东省哲学社会科学“十二五”规划项目(GD15YTS01);广东省科技计划项目(2017A04 0406025);广州市哲学社会科学“十三五”规划2018年度课题(2018GZQN27);广东外语外贸大学教改项目(GWJY2017046)

年  份:2019

卷  号:29

期  号:6

起止页码:181-185

语  种:中文

收录情况:JST、RCCSE、ZGKJHX、普通刊

摘  要:情感词典是文本情感分析的基础资源。利用表情符号明显的情感表达作用,提出一种基于种子表情符和SO-PMI算法结合的情感词典构建方法。选择44个情感明显、内容丰富的表情符号词作为种子情感集合。构建过程融合了TF-IDF值在词汇重要程度的度量作用,有效选择候选情感词集。基于SO-PMI算法,在大量语料中计算候选情感词汇与种子表情符号之间的情感共现信息,进而确定词汇的情感权值和极性。在500万条微博语料中,计算并构建情感词典SentiNet,共有情感词汇13814个,其中正向词汇6885个,负向词汇6929个。将SentiNet应用于微博文本情感分析任务中,实验结果表明,SentiNet能实现情感词的情感表示,并可应用于大规模的微博语料情感分析任务。该方法融合了情感词的重要度衡量优势和种子表情符号集的情感表达优势,证明了获得的情感权值有效。

关 键 词:情感词典 情感词  情感权值  种子表情符号  SO-PMI  TF-IDF

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心