登录    注册    忘记密码

期刊文章详细信息

一种基于熵的文本相似性计算方法    

Text-similarity method based on entropy

  

文献类型:期刊文章

作  者:李圣文[1] 凌微[1] 龚君芳[1] 周长征[2]

机构地区:[1]中国地质大学信息工程学院,武汉430074 [2]国网十堰供电公司,湖北十堰442000

出  处:《计算机应用研究》

基  金:国家自然科学基金资助项目(61272470);中国地质大学(武汉)中央高校基本科研业务费专项资金资助项目(2012119039;2012119145)

年  份:2016

卷  号:33

期  号:3

起止页码:665-668

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。

关 键 词:文本相似性  字符串匹配 编辑距离算法  最长公共子序列

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心