登录    注册    忘记密码

期刊文章详细信息

高校网络舆情安全中主题分类方法研究——以新浪微博数据为例    

Classifying Topics of Internet Public Opinion from College Students:Case Study of Sina Weibo

  

文献类型:期刊文章

作  者:贾隆嘉[1,2] 张邦佐[3]

Jia Longjia;Zhang Bangzuo(School of Mathematics and Statistics,Northeast Normal University,Changchun 130024,China;Department of Planning and Development,Northeast Normal University,Changchun 130024,China;School of Computer Science and Information Technology,Northeast Normal University,Changchun 130024,China)

机构地区:[1]东北师范大学数学与统计学院,长春130024 [2]东北师范大学发展规划处,长春130024 [3]东北师范大学信息科学与技术学院,长春130024

出  处:《数据分析与知识发现》

基  金:国家自然科学基金项目"基于网络结构演化的Folksonomy模式中社群知识组织与知识涌现研究"(项目编号:71473035);国家自然科学基金青年科学基金项目"基于贝叶斯图模型的海量短文本数据统计推断"(项目编号:11501095);吉林省科技厅重点科技攻关项目"基于异构信息网络融合社会关系的电子商务推荐系统关键技术研究与开发"(项目编号:20150204040GX)的研究成果之一

年  份:2018

卷  号:2

期  号:7

起止页码:55-62

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2017_2018、CSSCI、CSSCI2017_2018、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:【目的】通过一种特征加权方法解决高校新浪微博主题分类研究所面临的高维性和稀疏性问题。【方法】计算特征属于类别的概率,进一步预测文档属于类别的概率,使得特征由基于词的表示转换为基于类别的表示,最终采用支持向量机对转换后的特征矩阵进行分类。【结果】传统tf,tf?idf以及tf?rf三种方法在结合本文提出的方法后,在微平均F1/宏平均F1方面分别提升:7.2%/7.8%,7.5%/7.9%以及6.4%/5.7%。【局限】仅针对主题分类中特征加权方法进行探索,未对主题分类中其他部分展开研究。【结论】在高校网路舆情主题分类中,该方法可以有效地降低特征矩阵维度,同时提升分类能力与分类效率。

关 键 词:网络舆情安全  主题分类 特征加权 机器学习  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心