登录    注册    忘记密码

期刊文章详细信息

跨语言文献相似度的分析方法    

An analysis method of cross-lingual literature similarity

  

文献类型:期刊文章

作  者:刘娇[1] 崔荣一[1] 赵亚慧[1] 张振国[1]

机构地区:[1]延边大学工学院计算机科学与技术学科智能信息处理研究室,吉林延吉133002

出  处:《延边大学学报(自然科学版)》

基  金:吉林省科技发展计划项目(20130101179JC-18);吉林省公共计算平台资助;延边大学科技发展计划项目(延大科合字[2014]第16号)

年  份:2016

卷  号:42

期  号:2

起止页码:151-155

语  种:中文

收录情况:CAS、普通刊

摘  要:对不同语言的句对齐文献资料进行分析,提出了基于多语主题模型的跨语言文献相似度的计算方法.首先,对收集整理的不同语言(中文、英文、韩文)文献构建数据模型,通过分词、分词结果修正及选择、词权重计算等预处理工作构造词项-文档矩阵.其次,建立多语主题语义空间,将译成3种不同语言的文献映射到语义空间,在语义空间中每一主题都由3种语言构成.最后,通过其语义空间中对应的主题计算比较不同语言间的文献相似度.实验结果显示,不同语言之间的文献相似度可以直接在语义空间中计算,且相似度计算的准确性在90%以上,验证了本文方法在跨语言文献相似度计算时的有效性.

关 键 词:多语主题模型  跨语言 语义相似度

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心