期刊文章详细信息
文献类型:期刊文章
机构地区:[1]保定市教育考试院信息处,河北保定071000 [2]河北大学计算机科学与技术学院,河北保定071002
基 金:河北省自然科学基金资助项目(F2015201142);河北省社会科学基金资助项目(HB15SH064)
年 份:2017
卷 号:37
期 号:1
起止页码:108-112
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CAS、CSA、MR、RCCSE、RSC、WOS、ZGKJHX、ZR、核心刊
摘 要:基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者的相似性.针对这种情况,文章利用词语的同义关系,在给出术语与术语组相似度、术语组和术语组间相似度的概念及算法的基础上,给出一种基于词语相似关系的文档相似度计算方法.实验采用科技文献类文档和新闻报道类文档作为测试集合,比较新方法和向量空间算法的分类性能,结果显示新方法可提高文档分类的准确性.
关 键 词:同义词 词语相似度 文档相似度
分 类 号:G353] TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...