期刊文章详细信息
文献类型:期刊文章
机构地区:[1]延边大学工学院计算机科学与技术学科智能信息处理研究室,吉林延吉133002
基 金:吉林省科技发展计划项目(20130101179JC-18);吉林省公共计算平台资助;延边大学科技发展计划项目(延大科合字[2014]第16号)
年 份:2016
卷 号:42
期 号:2
起止页码:151-155
语 种:中文
收录情况:CAS、普通刊
摘 要:对不同语言的句对齐文献资料进行分析,提出了基于多语主题模型的跨语言文献相似度的计算方法.首先,对收集整理的不同语言(中文、英文、韩文)文献构建数据模型,通过分词、分词结果修正及选择、词权重计算等预处理工作构造词项-文档矩阵.其次,建立多语主题语义空间,将译成3种不同语言的文献映射到语义空间,在语义空间中每一主题都由3种语言构成.最后,通过其语义空间中对应的主题计算比较不同语言间的文献相似度.实验结果显示,不同语言之间的文献相似度可以直接在语义空间中计算,且相似度计算的准确性在90%以上,验证了本文方法在跨语言文献相似度计算时的有效性.
关 键 词:多语主题模型 跨语言 语义相似度
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...