登录    注册    忘记密码

期刊文章详细信息

基于SVM的高维混合特征短文本情感分类    

Short Text Sentiment Classification of High Dimensional Hybrid Feature Based on SVM

  

文献类型:期刊文章

作  者:王义真[1] 郑啸[1] 后盾[1] 胡昊[1]

机构地区:[1]安徽工业大学计算机科学与技术学院,安徽马鞍山243032

出  处:《计算机技术与发展》

基  金:国家自然科学基金(61402008;61402009);安徽省科技重大专项(16030901060);安徽省高校自然科学研究重大项目(KJ2014ZD05);安徽省高校优秀青年人才支持计划

年  份:2018

卷  号:28

期  号:2

起止页码:88-93

语  种:中文

收录情况:JST、RCCSE、ZGKJHX、普通刊

摘  要:针对短文本具有的稀疏性、不规范性、主题不明确性等相关特点,提出一种基于SVM的高维混合特征模型。首先介绍了兼顾语义和情感的6类特征:表情符号特征、词聚类特征、词性标注特征、n-gram特征、否定特征和情感词典。其中主要介绍了该6类特征的概念、抽取方式以及输出形式;其次在第六届中文倾向性分析评测(COAE2014)为基础的数据集上,采用5折交叉的方法对该模型进行了有效性验证,其平均准确率为84.69%、平均召回率为83.13%,而平均F1值为83.90%;接着探讨了SVM惩罚系数对实验的影响;最后将该模型与一步三分类方法、Recursive Auto Encoder、Doc2vec做了对比分析,结果表明提出的模型对短文本情感分类更有效。

关 键 词:情感分类 混合特征  支持向量机 情感词典

分 类 号:TP393]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心