期刊文章详细信息
基于SVM的高维混合特征短文本情感分类
Short Text Sentiment Classification of High Dimensional Hybrid Feature Based on SVM
文献类型:期刊文章
机构地区:[1]安徽工业大学计算机科学与技术学院,安徽马鞍山243032
基 金:国家自然科学基金(61402008;61402009);安徽省科技重大专项(16030901060);安徽省高校自然科学研究重大项目(KJ2014ZD05);安徽省高校优秀青年人才支持计划
年 份:2018
卷 号:28
期 号:2
起止页码:88-93
语 种:中文
收录情况:JST、RCCSE、ZGKJHX、普通刊
摘 要:针对短文本具有的稀疏性、不规范性、主题不明确性等相关特点,提出一种基于SVM的高维混合特征模型。首先介绍了兼顾语义和情感的6类特征:表情符号特征、词聚类特征、词性标注特征、n-gram特征、否定特征和情感词典。其中主要介绍了该6类特征的概念、抽取方式以及输出形式;其次在第六届中文倾向性分析评测(COAE2014)为基础的数据集上,采用5折交叉的方法对该模型进行了有效性验证,其平均准确率为84.69%、平均召回率为83.13%,而平均F1值为83.90%;接着探讨了SVM惩罚系数对实验的影响;最后将该模型与一步三分类方法、Recursive Auto Encoder、Doc2vec做了对比分析,结果表明提出的模型对短文本情感分类更有效。
关 键 词:情感分类 混合特征 支持向量机 情感词典
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...