期刊文章详细信息
基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型
Convolution Neural Network Text Classification Model Based on Word2vec and Improved TF-IDF
文献类型:期刊文章
WANG Gen-sheng;HUANG Xue-jian(Computer Practice Teaching Center,Jiangxi University of Finance and Economics,Nanchang 330013,China;School of International Trade and Economics,JiangXi University of Finance and Economic,Nanchang 330013,China;School of Humanities,JiangXi University of Finance and Economic,Nanchang 330013,China)
机构地区:[1]江西财经大学计算机实践教学中心,南昌330013 [2]江西财经大学国际经贸学院,南昌330013 [3]江西财经大学人文学院,南昌330013
基 金:国家自然科学基金项目(71461012)资助;国家社会科学基金项目(17BXW059)资助;江西省高校人文社会科学研究一般项目(TQ1404)资助
年 份:2019
卷 号:40
期 号:5
起止页码:1120-1126
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果.
关 键 词:Word2vec 改进型TF-IDF算法 卷积神经网络 文本分类 CTMWT
分 类 号:TP391.1] TP183[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...