期刊文章详细信息

基于语义差异的汉-缅平行句对生成方法
Chinese-Myanmar parallel sentence pairs generation method based on semantic difference

文献类型：期刊文章

作　　者：于志强[1] 文永华[2] 高明虎[3] 杨曼[3]

YU Zhi-qiang;WEN Yong-hua;GAO Ming-hu;YANG Man(School of Mathematics and Computer Science,Yunnan Minzu University,Kunming 650500,China;Information and Network center,Yunnan Minzu University,Kunming 650500,China;School of Electrical Information Engineering,Yunnan Minzu University,Kunming 650500,China)

机构地区：[1]云南民族大学数学与计算机科学学院,云南昆明650500 [2]云南民族大学信息与网络中心,云南昆明650500 [3]云南民族大学电气信息工程学院,云南昆明650500

出　　处：《云南民族大学学报（自然科学版）》

基　　金：国家自然科学基金(62241604);云南省教育厅科学研究基金(2022J0449).

年　　份：2023

卷　　号：32

期　　号：1

起止页码：118-123

语　　种：中文

收录情况：CAS、JST、RCCSE、ZGKJHX、ZMATH、普通刊

摘　　要：神经机器翻译是数据驱动式翻译方法,其性能依赖于平行句对的规模和质量,构建海量高质量的平行句对是提升机器翻译性能的基础工作之一.然而,人工标注高质量平行句对需要较高的成本,因此,探究如何从既有语料资源中生成新语料,对提升低资源机器翻译性能具有重要的意义.提出了基于语义差异的汉-缅平行句对生成方法.一方面,利用基于词表征的近义词检索技术获取关键词的近义词列表,随后基于近义词替换生成新句对;另一方面,利用预训练模型度量新生成句对间的语义差异,筛选语义差异较小的句对作为训练语料.实验表明,所提方法可作为有效的数据增强手段,能够提升汉-缅语言对的数据规模并改善翻译质量.

关键词：语义差异预训练模型句对生成汉-缅机器翻译

分类号：TP391.13] H421[计算机类]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于语义差异的汉-缅平行句对生成方法
Chinese-Myanmar parallel sentence pairs generation method based on semantic difference

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于语义差异的汉-缅平行句对生成方法 Chinese-Myanmar parallel sentence pairs generation method based on semantic difference

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于语义差异的汉-缅平行句对生成方法
Chinese-Myanmar parallel sentence pairs generation method based on semantic difference