期刊文章详细信息
文献类型:期刊文章
机构地区:[1]杭州电子科技大学软件与智能技术研究所,浙江杭州310018
基 金:2013年浙江省公益技术应用研究项目"基于语义的科技项目查重研究与实现"(2013C33G2040027)2013-2014
年 份:2015
期 号:5
起止页码:1-3
语 种:中文
收录情况:普通刊
摘 要:基于统计的TF-IDF相似度计算方法由于不考虑词语的语义信息,不能准确地反映文本间的相似性。针对该问题,提出一种结合语义理解和TF-IDF的科技项目相似度计算方法。在项目分词的基础上,利用《知网》计算两个项目间的特征项语义相似度,基于TF-IDF计算每个特征项的权重,然后针对权重大于给定阈值的特征项进行加权进而计算得到项目相似度值。实验结果表明,该方法效果优于单纯的TF-IDF和语义理解的方法。
关 键 词:语义理解 《知网》 特征项权重 相似度计算
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...