登录    注册    忘记密码

期刊文章详细信息

基于Transformer模型的问句语义相似度计算    

Semantic similarity calculation of questions based on Transformer model

  

文献类型:期刊文章

作  者:丁邱[1,2] 迟海洋[3] 严馨[1,2] 徐广义[4] 邓忠莹[1]

DING Qiu;CHI Hai-yang;YAN Xin;XU Guang-yi;DENG Zhong-ying(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming 650500,China;Information Center,Kunming University,Kunming 650214,China;Kunming Nantian Computer System Limited Company,Yunnan Nantian Electronic Information Industry Limited Company,Kunming 650040,China)

机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650500 [2]昆明理工大学云南省人工智能重点实验室,云南昆明650500 [3]昆明学院信息中心,云南昆明650214 [4]云南南天电子信息产业股份有限公司昆明南天电脑系统有限公司,云南昆明650040

出  处:《计算机工程与设计》

基  金:国家自然科学基金项目(61562049、61462055)。

年  份:2023

卷  号:44

期  号:3

起止页码:887-893

语  种:中文

收录情况:BDHX、BDHX2020、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此注意力加权后的新的句子表示矩阵,将获取的新矩阵同原始矩阵拼接融合,丰富句子特征信息;将拼接后的句子特征矩阵作为Transformer编码器网络的输入,由Transformer编码器分别对其进行深层次语义编码,获得句子的全局语义特征;通过全连接网络和Softmax函数对特征进行权重调整,得到句子相似度。在中文医疗健康问句数据集上模型取得了90.2%的正确率,较对比模型提升了将近4.2%,验证了该方法可以有效提高句子的语义表示能力和语义相似度的准确性。

关 键 词:自然语言处理  Transformer编码器  交互注意力机制  特征融合  语义相似度 语义编码  句子表示  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心