登录    注册    忘记密码

期刊文章详细信息

同源语料增强的低资源神经机器翻译    

Cognate-Corpus-Enhanced Low-Resource Neural Machine Translation

  

文献类型:期刊文章

作  者:王琳[1] 刘伍颖[2]

WANG Lin;LIU Wuying(Xianda College of Economics and Humanities,Shanghai International Studies University,Shanghai 200083,China;Shandong Key Laboratory of Language Resources Development and Application,Ludong University,Yantai,Shandong 264025,China)

机构地区:[1]上海外国语大学贤达经济人文学院,上海200083 [2]鲁东大学山东省语言资源开发与应用重点实验室,山东烟台264025

出  处:《中文信息学报》

基  金:教育部人文社会科学研究青年基金(20YJC740062);教育部人文社会科学研究规划基金(20YJAZH069);教育部新文科研究与改革实践项目(2021060049);上海市哲学社会科学“十三五”规划课题(2019BYY028);山东省研究生教育改革研究项目(SDYJG21185);山东省本科教学改革研究重点项目(Z2021323)。

年  份:2024

卷  号:38

期  号:2

起止页码:54-60

语  种:中文

收录情况:BDHX、BDHX2023、CSCD、CSCD2023_2024、JST、RCCSE、ZGKJHX、核心刊

摘  要:缺少平行句对的低资源机器翻译面临跨语言语义转述科学问题。该文围绕具体的低资源印尼语-汉语机器翻译问题,探索了基于同源语料的数据增广方法,并混合同源语料训练出更优的神经机器翻译模型。这种混合语料模型在印尼语-汉语机器翻译实验中提升了3个多点的BLEU4评分。实验结果证明,同源语料能够有效增强低资源神经机器翻译性能,而这种有效性主要是源于同源语言之间的形态相似性和语义等价性。

关 键 词:同源语料  数据增广  低资源机器翻译  印尼语 马来语

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心