期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京理工大学计算机科学技术学院,北京100081 [2]中国石油大学计算机与通信工程学院,山东东营257061
基 金:国家自然科学基金资助项目(60503050)
年 份:2006
卷 号:20
期 号:6
起止页码:25-30
语 种:中文
收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用。词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构。本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了利用《知网》为知识库构建词汇链的算法。通过计算词义相似度首先构建词汇链,然后结合词频与区域特征进行关键词选择。该方法考虑了词汇之间的语义信息,能够改善关键词标引的性能。实验结果表明,与单纯的词频、区域方法相比,召回率提高了7.78%,准确率提高了9.33%。
关 键 词:计算机应用 中文信息处理 关键词标引 关键词抽取 词汇链 词义相似度 知网
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...