期刊文章详细信息
文献类型:期刊文章
LIU Wuying;JIN Kai(Shandong Key Laboratory of Language Resources Development and Application,Ludong University,Yantai 264025,China;School of Foreign Languages,Qilu University of Technology,Jinan 250353,China)
机构地区:[1]鲁东大学山东省语言资源开发与应用重点实验室,山东烟台264025 [2]齐鲁工业大学外国语学院,山东济南250353
基 金:教育部新文科研究与改革实践项目(2021060049);教育部人文社会科学研究青年基金项目(20YJC740062);教育部人文社会科学研究规划基金项目(20YJAZH069);山东省研究生教育教学改革研究项目(SDYJG21185);山东省本科教学改革研究重点项目(Z2021323);上海市哲学社会科学“十三五”规划课题(2019BYY028)。
年 份:2024
卷 号:63
期 号:6
起止页码:1033-1041
语 种:中文
收录情况:AJ、BDHX、BDHX2023、CAS、CSCD、CSCD_E2023_2024、INSPEC、JST、MR、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:[目的]为了提升神经机器翻译模型的迁移学习效果,以语言数据为中心开展域适应方法探索.[方法]根据KL散度和最大均差两种域适应量度的定量分析结果,提出一种针对拥有大规模平行句子和小规模域文本场景的两阶段减量学习框架.第1阶段域过滤,利用域文本过滤平行句子,得到域平行句子,再利用得到的域平行句子训练出域神经机器翻译模型.第2阶段质量过滤,利用训练出的域神经机器翻译模型将第1阶段过滤出的域平行句子翻译一遍,比较机器译文与人工译文的质量,删除低质量平行句子以获得高质量域平行句子.最后利用得到的高质量域平行句子训练出优化的域神经机器翻译模型.[结果]在适应法律域英汉神经机器翻译上的实验结果显示新提出的两阶段算法只需原来训练步的四分之一左右,就反而可以提高2个多的BLEU分数.[结论]实验结论证明减量学习框架能够在大大减少训练时空开销的前提下获得最优的性能,最终实现神经机器翻译模型的快速域迁移.
关 键 词:域适应 域适应量度 减量学习 神经机器翻译 法律域
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...