期刊文章详细信息
基于层次结构的多策略中文微博情感分析和特征抽取
Hierarchical Structure Based Hybrid Approach to Sentiment Analysis of Chinese Micro Blog and Its Feature Extraction
文献类型:期刊文章
机构地区:[1]智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机系,北京100084 [2]微软亚洲研究院,北京100084
基 金:国家自然科学基金资助项目(60873174)
年 份:2012
卷 号:26
期 号:1
起止页码:73-83
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:随着Web2.0时代的兴起,与微博相关的研究得到了学术界和工业界的广泛关注。该文使用新浪API获取数据,针对中文微博消息展开了情感分析方面的研究。我们对于三种情感分析的方法进行了深入研究,包括表情符号的规则方法、情感词典的规则方法、基于SVM的层次结构的多策略方法,实验表明基于SVM的层次结构多策略方法效果最好。其次,针对层次结构的多策略方法的特征选择进行了详细分析,包括主题无关、主题相关的特征。实验表明使用主题无关的特征时获得的准确率为66.467%。引入主题相关的特征后,准确率提升至67.283%。
关 键 词:新浪微博 情感分析 SVM
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...