期刊文章详细信息
在线评论情感分析中固定搭配特征提取方法研究
Regular Collocation Features Extraction Method in Online Reviews Sentiment Analysis
文献类型:期刊文章
机构地区:[1]哈尔滨工业大学信息管理与信息系统研究所,黑龙江哈尔滨150001
基 金:国家自然科学基金资助项目(71202168;71271066);中央高校基本科研业务费专项资金资助项目(HIT.NSRIF2010083);黑龙江省教育厅科学技术研究资助项目(12511435)
年 份:2014
卷 号:28
期 号:4
起止页码:180-186
语 种:中文
收录情况:BDHX、BDHX2011、CSSCI、CSSCI2014_2016、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:有效和稳定的特征提取和特征表示是提高在线评论情感分析性能的重要因素。在常规的连续词袋性、触发对等特征的基础上,本文研究在线评论中固定搭配特征的提取与表示方法,提出结合互信息和平均互信息、基于粗糙集两种策略用于固定搭配特征提取,并从特征抽取方法的有效性和稳定性分析出发考查所抽取的固定搭配其内部及外部稳定性,并将经筛选的固定搭配特征融合于多种情感分析模型中进行情感分析。真实酒店评论数据上的实验表明,固定搭配特征的恰当表示和筛选有效改善情感分析模型的分类精度,此外研究发现评论中情感特征词分布不均衡情况下采用可变精度粗规则的提取策略有助于提高情感分析的分类精度。
关 键 词:情感分析 固定搭配特征提取 互信息与平均互信息 粗糙集 支持向量机
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...