期刊文章详细信息
文献类型:期刊文章
机构地区:[1]沈阳航空工业学院知识工程中心,辽宁沈阳110034 [2]辽东学院信息技术学院,辽宁丹东118003
基 金:教育部科学技术研究重点资助项目(207148);辽宁省自然科学基金资助项目(1063297-1-01)
年 份:2008
卷 号:22
期 号:6
起止页码:75-79
语 种:中文
收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:该文提出一种多文档关键词抽取方法,该方法提出ATF×PDF(Average Term Frequency×ProportionalDocument Frequency)来计算词语权重,并根据候选关键词之间的语义相似度,采用联合权重方法重新计算候选关键词的权重来抽取关键词。该方法综合考虑了词语的频率,词性以及词语之间的语义相似性等信息,实验表明,该方法能有效抽取多个文档的关键词,同基于关键词的聚类标记方法相比,其准确率提高3%,召回率提高7%,F-measure提高4.4%。
关 键 词:计算机应用 中文信息处理 ATF×PDF 联合权重 多文档 语义相似度
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...