期刊文章详细信息
基于组合-卷积神经网络的中文新闻文本分类 ( EI收录)
A Combined-Convolutional Neural Network for Chinese News Text Classification
文献类型:期刊文章
ZHANG Yu;LIU Kai-feng;ZHANG Quan-xin;WANG Yan-ge;GAO Kai-long(School of Electrical and Information Engineering & Beijing Key Laboratory of Intelligent Processing for Building Big Data,Beijing University of Civil Engineering and Architecture,Beijing 100044,China;State Key Laboratory in China for Geo Mechanics and Deep Underground Engineering,China University of Mining & Technology,Beijing 100083,China;School of Computer Science and Technology,Beijing Institute of Technology,Beijing 100081,China)
机构地区:[1]北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室,北京100044 [2]中国矿业大学深部岩土力学与地下工程国家重点实验室,北京100083 [3]北京理工大学计算机科学与技术学院,北京100081
基 金:北京建筑大学优秀主讲教师培育计划(No.21082718041);国家重点研发计划(No.2016YFC0600901);教育部2018产学合作协同育人项目(No.201801113001);市属高校基本科研业务费(No.30850919027);北京建筑大学研究生创新项目(No.PG2020051)。
年 份:2021
卷 号:49
期 号:6
起止页码:1059-1067
语 种:中文
收录情况:BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型.
关 键 词:自然语言处理 词向量 组合-卷积神经网络 中文新闻 文本分类
分 类 号:TP183]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...