登录    注册    忘记密码

期刊文章详细信息

基于术语同义关系的文档相似度研究    

Research on document similarity based on terms synonymous relationship

  

文献类型:期刊文章

作  者:张锡忠[1] 徐建民[2]

机构地区:[1]保定市教育考试院信息处,河北保定071000 [2]河北大学计算机科学与技术学院,河北保定071002

出  处:《河北大学学报(自然科学版)》

基  金:河北省自然科学基金资助项目(F2015201142);河北省社会科学基金资助项目(HB15SH064)

年  份:2017

卷  号:37

期  号:1

起止页码:108-112

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CAS、CSA、MR、RCCSE、RSC、WOS、ZGKJHX、ZR、核心刊

摘  要:基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者的相似性.针对这种情况,文章利用词语的同义关系,在给出术语与术语组相似度、术语组和术语组间相似度的概念及算法的基础上,给出一种基于词语相似关系的文档相似度计算方法.实验采用科技文献类文档和新闻报道类文档作为测试集合,比较新方法和向量空间算法的分类性能,结果显示新方法可提高文档分类的准确性.

关 键 词:同义词 词语相似度 文档相似度

分 类 号:G353] TP393]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心