期刊文章详细信息
文献类型:期刊文章
机构地区:[1]昌吉学院计算机工程系,新疆昌吉831100 [2]昌吉学院人事处,新疆昌吉831100
基 金:国家自然科学基金(项目编号:60963018);新疆维吾尔自治区高校科研计划青年教师科研基金项目(项目编号:XJEDU2011S42);昌吉学院项目(项目编号:2012YJQT03;12JYYB004)~~
年 份:2014
卷 号:35
期 号:3
起止页码:62-64
语 种:中文
收录情况:CSA、IC、JST、普通刊
摘 要:针对政府文献的汉语维吾尔语语料库特点,充分利用汉语和维吾尔语的句子特性,提出一种汉维句子级别的对齐方法。该方法重点分析政府领域的汉语和维吾尔语的句型,分别对汉语和维吾尔语的语料进行边界识别,避免了复杂句型对汉语-维吾尔语句子对齐的影响,使得该方法取得句子对齐达到97%与99%之间的正确率。对齐的汉语-维吾尔语句子对可以充实语料库的规模,为汉语-维吾尔语短语对齐以及汉维机器翻译提供翻译语料。
关 键 词:平行语料库 句子对齐 机器翻译 汉语-维吾尔语 句子边界识别
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...