期刊文章详细信息
文献类型:期刊文章
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]苏州市科技局,江苏苏州215006
基 金:国家自然科学基金资助项目(60970057)
年 份:2010
卷 号:28
期 号:3
起止页码:126-130
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CAB、CAS、CSA、CSA-PROQEUST、IC、PROQUEST、RCCSE、WOS、ZGKJHX、ZMATH、ZR、核心刊
摘 要:本文主要研究基于网络的可比较语料库的构建以及其在跨语言信息检索(CLIR)中的应用。首先从新闻网站获取新闻文本,用Lucene进行对齐,构建可比较语料库;其次,利用上下文信息从对齐的文本中抽取翻译知识;最后,用获得的翻译知识在TDT4语料上进行CLIR性能实验。实验表明,所抽取的翻译知识可以提高CLIR的性能,取得了0.272 8的MAP值,相对于基于本地词典的方法提高了35.44个百分点。
关 键 词:可比较语料库 翻译知识抽取 上下文向量 跨语言信息检索 查询翻译
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...