登录    注册    忘记密码

期刊文章详细信息

基于联合权重的多文档关键词抽取技术    

Keyword Extractionin Multi-Document Based on Joint Weight

  

文献类型:期刊文章

作  者:杨洁[1] 季铎[1] 蔡东风[1] 林晓庆[1,2] 白宇[1]

机构地区:[1]沈阳航空工业学院知识工程中心,辽宁沈阳110034 [2]辽东学院信息技术学院,辽宁丹东118003

出  处:《中文信息学报》

基  金:教育部科学技术研究重点资助项目(207148);辽宁省自然科学基金资助项目(1063297-1-01)

年  份:2008

卷  号:22

期  号:6

起止页码:75-79

语  种:中文

收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊

摘  要:该文提出一种多文档关键词抽取方法,该方法提出ATF×PDF(Average Term Frequency×ProportionalDocument Frequency)来计算词语权重,并根据候选关键词之间的语义相似度,采用联合权重方法重新计算候选关键词的权重来抽取关键词。该方法综合考虑了词语的频率,词性以及词语之间的语义相似性等信息,实验表明,该方法能有效抽取多个文档的关键词,同基于关键词的聚类标记方法相比,其准确率提高3%,召回率提高7%,F-measure提高4.4%。

关 键 词:计算机应用 中文信息处理 ATF×PDF  联合权重  多文档 语义相似度

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心