期刊文章详细信息
基于互译特征词对匹配的老-汉双语句子相似度计算方法研究
Laos-Chinese bilingual sentence similarity calculation method based on mutual translation feature word pair matching
文献类型:期刊文章
LI Sizhuo;ZHOU Lanjiang;ZHOU Feng;ZHANG Jian’an(Key Laboratory of Intelligent Information Processing,School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China;Kunming Battalion,Third College,Information Engineering University,PLA Strategic Support Force,Kunming 650500,China)
机构地区:[1]昆明理工大学信息工程与自动化学院智能信息处理重点实验室,云南昆明650500 [2]解放军战略支援部队信息工程大学三院昆明大队,云南昆明650500
基 金:国家自然科学基金:老挝语词法分析及老-汉双语平行语料抽取方法研究(61662040);国家自然科学基金:基于篇章特征的越南语新闻事件信息抽取关键技术研究(61562049)~~
年 份:2019
卷 号:42
期 号:24
起止页码:79-83
语 种:中文
收录情况:BDHX、BDHX2017、IC、RCCSE、ZGKJHX、核心刊
摘 要:句子相似度的计算在自然语言处理的各个领域有很广泛的应用,但跨语言的句子相似度计算方法却非常少。文中提出一种基于互译特征词对匹配,构建老-汉双语句子相似度计算方法,改进了传统的依赖于词形词序通过计算相同词个数和共有单词的位置信息的相似度计算方法,充分考虑了老挝语和汉语句子中的词汇互译信息、相似概率,避免了由于特征词位置导致的精度丢失。此方法用来最终识别相似度较高的老-汉双语平行句对,依据相似度对源句子和目标句子进行对齐,在老-汉双语平行语料库的建设中使用。实验结果表明,此方法在一定程度上提高了老-汉双语句子相似度计算的准确率。
关 键 词:老-汉双语词典 相似度计算 算法改进 双语句对识别 词汇互译 实验验证
分 类 号:TN912.34-34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...