登录    注册    忘记密码

期刊文章详细信息

改进的基于知网的词语相似度算法    

Improved word similarity algorithm based on HowNet

  

文献类型:期刊文章

作  者:王小林[1] 王义[1,2]

机构地区:[1]安徽工业大学计算机学院,安徽马鞍山243002 [2]山东省淄博市周村区人民医院信息科,山东淄博255300

出  处:《计算机应用》

基  金:国家自然科学基金资助项目(61003311);安徽省高校省级自然科学基金资助项目(KJ2011A040)

年  份:2011

卷  号:31

期  号:11

起止页码:3075-3077

语  种:中文

收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:词语相似度计算在文本分类、问答系统、机器翻译、文本聚类等有着广泛的应用。词语相似度计算的研究工作一般都是基于《知网》的义原的层面上,根据义原之间的距离和义原本身的层次深度,进行词语相似度的计算。基于以上研究,提出了一种新的改进的词语相似度算法,首先根据义项中各类义原的个数不同,提出了一种新的变系数义项相似度计算方法;其次从词性的角度,认为词语义项中的不同词性对词语相似度的贡献度不同,剔除不同词性义项之间的组合。实验结果证明,改进的算法结果在原有基础上得到较好的提升,大幅度降低了相似度计算的复杂度,提高了运算效率。

关 键 词:词语相似度 知网 义原  义项  词性

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心