登录    注册    忘记密码

期刊文章详细信息

基于ALBERT-TextCNN模型的多标签医疗文本分类方法    

Multi-label classification for medical text based on ALBERT-TextCNN model

  

文献类型:期刊文章

作  者:郑承宇[1] 王新[1] 王婷[1] 邓亚萍[1] 尹甜甜[1]

ZHENG Cheng-yu;WANG Xin;WANG Ting;DENG Ya-ping;YIN Tian-tian(School of Mathematics and Computer Science,Yunnan Minzu University,Kunming 650500,Yunnan,China)

机构地区:[1]云南民族大学数学与计算机科学学院,云南昆明650500

出  处:《山东大学学报(理学版)》

基  金:国家自然科学基金资助项目(61363022);云南省教育厅科学研究基金资助项目(2021Y670)。

年  份:2022

卷  号:57

期  号:4

起止页码:21-29

语  种:中文

收录情况:BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、IC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:针对现有Word2Vec和Glove等静态词向量表征方法无法解决文本完整语义的问题,结合ALBERT预训练语言模型和TextCNN卷积神经网络,提出一种用于多标签医疗文本分类的深层神经网络模型ALBERT-TextCNN。该模型采用ALBERT预训练语言模型进行动态字向量表示,通过其内部多层双向的Transfomer结构获取更高效的文本向量表达,并引入TextCNN卷积神经网络模型构造多标签分类器进行训练,提取不同抽象层次的语义信息特征。在中文健康问句数据集上进行算法性能测试,实验结果表明,该模型分类的整体F1值达到了90.5%,能有效提升医疗文本的多标签分类效果。

关 键 词:ALBERT TextCNN模型  多标签分类  医疗文本  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心