期刊文章详细信息
文献类型:期刊文章
机构地区:[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030
基 金:国家自然基金(61262054);西北民族大学中央专项资金资助研究生项目(Yxm2014001);国家科技支撑计划项目(2014BAK10B03);甘肃省科技重大专项项目(1203FKDA033)
年 份:2017
卷 号:31
期 号:3
起止页码:163-169
语 种:中文
收录情况:BDHX、BDHX2014、CSCD、CSCD2017_2018、JST、RCCSE、ZGKJHX、核心刊
摘 要:中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性分析算法,算法使用情感词、词性序列、句式信息和表情符号作为特征,并针对藏文微博常出现中文表述的情况,将中文的情感信息也作为特征进行情感计算,利用双语情感特征有效提高了情感倾向性分析的效果。实验显示,该方法对纯藏文表述的微博情感倾向性分析正确率可达到79.8%,针对藏汉双语表述的微博在加入中文情感词、中文标点符号等特征后,正确率能够达到82.8%。
关 键 词:藏文微博 混合文本 情感倾向 情感词 词性序列
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...