登录    注册    忘记密码

期刊文章详细信息

基于改进词性信息和ACBiLSTM的短文本分类    

SHORT TEXT CLASSIFICATION BASED ON IMPROVED PART OF SPEECH INFORMATION AND ACBiLSTM

  

文献类型:期刊文章

作  者:朱向其[1] 张忠林[1] 李林川[1] 马海云[2]

Zhu Xiangqi;Zhang Zhonglin;Li Linchuan;Ma Haiyun(School of Electronics and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,Gansu,China;School of Electronic Information and Electrical Engineering,Tianshui Normal University,Tianshui 741001,Gansu,China)

机构地区:[1]兰州交通大学电子与信息工程学院,甘肃兰州730070 [2]天水师范学院电子信息与电气工程学院,甘肃天水741001

出  处:《计算机应用与软件》

基  金:国家自然科学基金项目(61662043);甘肃省自然科学基金项目(18JR3RE245)。

年  份:2021

卷  号:38

期  号:12

起止页码:179-186

语  种:中文

收录情况:BDHX、BDHX2020、IC、JST、ZGKJHX、核心刊

摘  要:中文短文本分类最重要的是提取和表示短文本特征,传统的表示方法静态训练词向量,存在特征稀疏、语义不足等问题,对此提出一种基于改进词性信息和ACBiLSTM的中文短文本分类模型。用BERT模型动态训练词向量,引入词性因子优化,将得到的具有词性信息的词向量作为输入层信息;经过卷积神经网络初步提取局部特征,通过双向长短时记忆网络进一步得到具有上下文时序信息的中间向量表示;结合注意力机制,突显关键信息,获得最终文本特征表示。在FudanNews、SougouNews及THUCNews数据集上将该模型与其他模型进行对比,实验结果表明,其准确率和F1值显著提高。

关 键 词:短文本  BERT  神经网络 文本特征 注意力机制  文本分类

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心