登录    注册    忘记密码

期刊文章详细信息

基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型    

Convolution Neural Network Text Classification Model Based on Word2vec and Improved TF-IDF

  

文献类型:期刊文章

作  者:王根生[1,2,3] 黄学坚[1]

WANG Gen-sheng;HUANG Xue-jian(Computer Practice Teaching Center,Jiangxi University of Finance and Economics,Nanchang 330013,China;School of International Trade and Economics,JiangXi University of Finance and Economic,Nanchang 330013,China;School of Humanities,JiangXi University of Finance and Economic,Nanchang 330013,China)

机构地区:[1]江西财经大学计算机实践教学中心,南昌330013 [2]江西财经大学国际经贸学院,南昌330013 [3]江西财经大学人文学院,南昌330013

出  处:《小型微型计算机系统》

基  金:国家自然科学基金项目(71461012)资助;国家社会科学基金项目(17BXW059)资助;江西省高校人文社会科学研究一般项目(TQ1404)资助

年  份:2019

卷  号:40

期  号:5

起止页码:1120-1126

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果.

关 键 词:Word2vec  改进型TF-IDF算法  卷积神经网络 文本分类 CTMWT  

分 类 号:TP391.1] TP183[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心