期刊文章详细信息
文献类型:期刊文章
机构地区:[1]河北大学工商学院,河北保定071002 [2]河北大学管理学院,河北保定071002 [3]河北大学数学与计算机学院,河北保定071002
基 金:国家博士后科学基金资助项目(20070420700)
年 份:2011
卷 号:29
期 号:2
起止页码:279-283
语 种:中文
收录情况:BDHX、BDHX2008、CSSCI、CSSCI2010_2011、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:针对传统TF-IDF方法提取文本特征词时未考虑词语间关系的不足,提出一种利用本体关联度改进的文本特征词提取方法。该方法首先利用传统的TF-IDF方法构建候选特征词集合和非候选特征词集合,然后根据领域本体知识在非候选特征词集合中提取候选特征词的本体关联词,利用候选特征词与其本体关联词之间的本体关联度以及本体关联词本身的权重调整候选特征词的权重,得到新的候选特征词权重排序。实验证明,该方法能够有效提高文本特征词提取的准确度。
关 键 词:文本特征词提取 TF-IDF 本体关联词 本体关联度
分 类 号:G350]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...