登录    注册    忘记密码

期刊文章详细信息

一种基于HowNet语义计算的综合特征词权重计算方法    

  

文献类型:期刊文章

作  者:孙丽莉[1,2] 张小刚[3,4]

机构地区:[1]西安交通大学人文学院,西安710049 [2]塔里木大学学报编辑部,新疆阿拉尔843300 [3]塔里木大学信息工程学院,新疆阿拉尔843300 [4]浙江大学计算机学院,杭州310027

出  处:《统计与决策》

基  金:国家自然科学基金资助项目(61562072);新疆维吾尔自治区高校人文社科重点研究基地重点项目(090113B06)

年  份:2018

卷  号:0

期  号:18

起止页码:82-85

语  种:中文

收录情况:BDHX、BDHX2017、CSSCI、CSSCI2017_2018、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:传统文本特征词提取方法采用TF-IDF计算文本特征词的权重,但TF-IDF方法只使用了文本中的词频因素,体现不出特征词的位置信息,也忽略了特征词之间的语义相似关系,降低了提取特征词的准确性。针对此问题,文章提出了一种综合的文本特征词权重计算方法,该方法在计算特征词权重时兼顾了特征词的词频、位置和词义信息。实验结果表明,该方法是有效的,且能在一定程度上提高文本相似度结果的区分度和聚类效果。

关 键 词:知网 词频与反文档频率  权重计算  语义相似度计算

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心