期刊文章详细信息
文献类型:期刊文章
机构地区:[1]伊犁师范学院计算机科学系,新疆伊犁835000 [2]新疆大学信息科学与工程学院,新疆乌鲁木齐830046
基 金:国家自然科学基金(编号:60663006);新疆维吾尔自治区高新技术计划项目(200712109)
年 份:2010
卷 号:27
期 号:1
起止页码:102-105
语 种:中文
收录情况:CAS、MR、RCCSE、ZGKJHX、ZMATH、普通刊
摘 要:随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.
关 键 词:汉文-维吾尔文双语语料库 段落对齐 多层次分段对齐
分 类 号:TP317.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...