登录    注册    忘记密码

期刊文章详细信息

基于稳健设计的双向长短期记忆神经网络模型的调优方法    

A Tuning Method for Bi-directional Long Short-Term Memory Neural Network Model Based on Robust Design

  

文献类型:期刊文章

作  者:曹学飞[1] 李济洪[2] 王瑞波[2] 牛倩[1] 王钰[2]

CAO Xuefei;LI Jihong;WANG Ruibo;NIU Qian;WANG Yu(School of Software,Shanxi University,Taiyuan,030006,China;School of Modern Education Technology,Shanxi University,Taiyuan,030006,China)

机构地区:[1]山西大学软件学院,太原030006 [2]山西大学现代教育技术学院,太原030006

出  处:《应用概率统计》

基  金:国家自然科学基金项目(批准号:62076156、61806115)资助.

年  份:2022

卷  号:38

期  号:3

起止页码:317-332

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、JST、MR、ZGKJHX、ZMATH、核心刊

摘  要:双向长短期记忆神经网络模型在自然语言处理中广泛使用,但其调优问题是使用中的难点.本文以自然语言处理中的语义角色识别任务为例,在双向长短期记忆神经网络模型的调优中,将4个候选特征(词、词性、目标词和位置)和2个超参数(网络的层数和是否在顶层添加CRF分类器)看作稳健设计中的因子,设置各因子的水平,进行实验来选择特征和超参数的最优配置组合.本文在小数据集(6692条带有语义角色标注信息的例句)上以3×2交叉验证来做完全实验,以稳健设计的望大特性信噪比为优化目标,选出了模型的最优配置组合,并采用因子的方差分析,定量分析了各因子对模型性能的影响,使得模型有一定的可解释性.为了验证本文选出的最优配置组合的优良性,采用传统方法,在大数据集(约4万条例句)上以自然语言处理中常用的标准切分8:1:1,基于传统的贪心策略调优方法选出最优配置组合,并与本文方法在测试集进行比较,验证了本文的调优方法优于传统的调优方法.

关 键 词:稳健设计 语义角色识别  长短期记忆神经网络  3×2交叉验证  

分 类 号:O212.6]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心