期刊文章详细信息
文献类型:期刊文章
机构地区:[1]福建省科学技术信息研究所,福州350003
基 金:福建省公益类科研院所科研专项"基于相似性计算的科技项目查重技术研究"(项目编号:2010R1009-4)的成果之一
年 份:2012
期 号:1
起止页码:1-3
语 种:中文
收录情况:RWSKHX、普通刊
摘 要:针对科技项目查重的需要,利用分词的结果,将科技项目文档转换为文本向量空间模型,抽取特征词,并将特征词的位置和词的长度2个因素考虑进来,提出一种TF-IDF值的改进计算方法,并实例验证该方法有一定的改善效果。
关 键 词:文本特征 特征词权值 TF—IDF 算法改进 项目查重 科技项目
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...