期刊文章详细信息
文献类型:期刊文章
WANG Lin;LIU Wuying(Xianda College of Economics and Humanities,Shanghai International Studies University,Shanghai 200083,China;Shandong Key Laboratory of Language Resources Development and Application,Ludong University,Yantai,Shandong 264025,China)
机构地区:[1]上海外国语大学贤达经济人文学院,上海200083 [2]鲁东大学山东省语言资源开发与应用重点实验室,山东烟台264025
基 金:教育部人文社会科学研究青年基金(20YJC740062);教育部人文社会科学研究规划基金(20YJAZH069);教育部新文科研究与改革实践项目(2021060049);上海市哲学社会科学“十三五”规划课题(2019BYY028);山东省研究生教育改革研究项目(SDYJG21185);山东省本科教学改革研究重点项目(Z2021323)。
年 份:2024
卷 号:38
期 号:2
起止页码:54-60
语 种:中文
收录情况:BDHX、BDHX2023、CSCD、CSCD2023_2024、JST、RCCSE、ZGKJHX、核心刊
摘 要:缺少平行句对的低资源机器翻译面临跨语言语义转述科学问题。该文围绕具体的低资源印尼语-汉语机器翻译问题,探索了基于同源语料的数据增广方法,并混合同源语料训练出更优的神经机器翻译模型。这种混合语料模型在印尼语-汉语机器翻译实验中提升了3个多点的BLEU4评分。实验结果证明,同源语料能够有效增强低资源神经机器翻译性能,而这种有效性主要是源于同源语言之间的形态相似性和语义等价性。
关 键 词:同源语料 数据增广 低资源机器翻译 印尼语 马来语
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...