期刊文章详细信息
基于同步树序列替换文法的统计机器翻译模型 ( EI收录)
Synchronous Tree Sequence Substitution Grammar for Statistical Machine Translation
文献类型:期刊文章
机构地区:[1]哈尔滨工业大学计算机科学与技术学院机器智能与翻译研究室,哈尔滨150001 [2]新加坡信息通讯研究所,新加坡119613
基 金:国家自然科学基金重点项目(60736014);国家高技术研究发展计划(863计划)重点项目(2006AA010108)资助~~
年 份:2009
卷 号:35
期 号:10
起止页码:1317-1326
语 种:中文
收录情况:BDHX、BDHX2008、CSCD、CSCD2011_2012、EI(收录号:20094912531111)、IC、INSPEC、JST、MR、PUBMED、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:基于短语的模型是目前发展相对成熟的一种统计机器翻译(Statistical machine translation,SMT)模型.但基于短语的模型不包含任何结构信息,因而缺乏有效的全局调序能力,同时不能对非连续短语进行建模.基于句法的模型因具有结构信息而具有解决以上问题的潜力,因而越来越受到研究者们的重视.然而现有的大多数基于句法的模型都因严格的句法限制而制约了模型的描述能力.为突破这种限制并将基于短语的模型的优点融入到句法模型中,本文提出一种基于同步树序列替换文法(Synchronous tree sequence substitution grammar,STSSG)的统计机器翻译模型.在此模型中,树序列被用作为基本的翻译单元.在这种框架下,不满足句法限制的翻译等价对和满足句法限制的翻译等价对都可以融入句法信息并被翻译模型所使用.从而,两种模型的优点均得到充分利用.在2005年度美国国家标准与技术研究所(NIST)举办的机器翻译评比的中文翻译任务语料上的实验表明,本文提出的模型显著地超过了两个基准系统:基于短语的翻译系统Moses和一个基于严格树结构的句法翻译模型.
关 键 词:统计机器翻译 句法限制 同步文法 同步树替换文法 同步树序列替换文法
分 类 号:TP391.2]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...