期刊文章详细信息
一种主动学习和协同训练相结合的半监督微博情感分类方法
Semi-supervised Micro-blog Sentiment Classification Method Combining Active Learning and Co-training
文献类型:期刊文章
机构地区:[1]昆明理工大学艺术与传媒学院,昆明650093 [2]云南财经大学信息学院,昆明650221 [3]云南财经大学信息管理中心,昆明650221
基 金:云南省哲学社会科学规划基金项目"微博用户影响力模型研究"(项目编号:QN2014071)的研究成果之一
年 份:2015
期 号:1
起止页码:38-44
语 种:中文
收录情况:CSSCI、CSSCI2014_2016、RWSKHX、普通刊
摘 要:【目的】针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法。【方法】在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类。【结果】使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高。特别是在已标注样本占40%的情况下,提升5%左右。【局限】在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件。【结论】引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率。
关 键 词:协同训练 主动学习 情感分类
分 类 号:TP393.092] TP391.1[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...