期刊文章详细信息
文献类型:期刊文章
机构地区:[1]仰恩大学计算机与信息学院 [2]郑州大学信息工程学院
基 金:河南省教育厅自然科学基金项目(2007520050)
年 份:2009
卷 号:30
期 号:18
起止页码:4356-4358
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD_E2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位。提出了几种不同的汉英句子长度计算方法,分别以句子所含动词、名词、形容词、实词、字节及所含全部词语个数作为句子的长度,进行基于长度的汉英句子对齐。实验结果表明,汉英句子对齐以词语作为句子长度计算单位时,正确率为99.01%,召回率为99.5%。
关 键 词:自然语言处理 双语语料库 句子对齐 基于长度的方法 基于词汇的方法
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...