期刊文章详细信息
基于ALBERT-TextCNN模型的多标签医疗文本分类方法
Multi-label classification for medical text based on ALBERT-TextCNN model
文献类型:期刊文章
ZHENG Cheng-yu;WANG Xin;WANG Ting;DENG Ya-ping;YIN Tian-tian(School of Mathematics and Computer Science,Yunnan Minzu University,Kunming 650500,Yunnan,China)
机构地区:[1]云南民族大学数学与计算机科学学院,云南昆明650500
基 金:国家自然科学基金资助项目(61363022);云南省教育厅科学研究基金资助项目(2021Y670)。
年 份:2022
卷 号:57
期 号:4
起止页码:21-29
语 种:中文
收录情况:BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、IC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对现有Word2Vec和Glove等静态词向量表征方法无法解决文本完整语义的问题,结合ALBERT预训练语言模型和TextCNN卷积神经网络,提出一种用于多标签医疗文本分类的深层神经网络模型ALBERT-TextCNN。该模型采用ALBERT预训练语言模型进行动态字向量表示,通过其内部多层双向的Transfomer结构获取更高效的文本向量表达,并引入TextCNN卷积神经网络模型构造多标签分类器进行训练,提取不同抽象层次的语义信息特征。在中文健康问句数据集上进行算法性能测试,实验结果表明,该模型分类的整体F1值达到了90.5%,能有效提升医疗文本的多标签分类效果。
关 键 词:ALBERT TextCNN模型 多标签分类 医疗文本
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...