期刊文章详细信息
融合Bert和BiLSTM的中文短文本分类研究
Research on Chinese Short Text Classification Model based on Bert and Bi-LSTM
文献类型:期刊文章
HAO Ting;WANG Wei(College of Cyberspace Security,Changchun University,Changchun 130022,China;College of Computer Science and Technology,Changchun 130022,China)
机构地区:[1]长春大学网络安全学院,吉林长春130022 [2]长春大学计算机科学技术学院,吉林长春130022
年 份:2023
卷 号:26
期 号:3
起止页码:58-62
语 种:中文
收录情况:JST、普通刊
摘 要:中文短文本具有长度短及上下文依赖强的特点,针对新闻主题文本用词不够规范、语义模糊、特征稀疏等问题,提出首先在词向量表示阶段引入Bert(双向Transformers编码器)生成融合字、文本及位置的词向量作为训练文本的词表征进行文本语义增强,然后将得到的词向量输送到BiLSTM(双向长短期记忆网络)网络中提取上下文关系特征,最后使用Softmax分类器进行文本分类,模型准确率达0.9391。通过与其他主流方法进行对比和实验验证,实验结果表明,文章提出的方法在进行新闻短文本分类时有良好效果。
关 键 词:文本分类 BiLSTM Bert 新闻分类
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...