期刊文章详细信息
基于共词分析的文本主题词聚类与主题发现
Discovering of Subjects and Clustering of Textual Subject Terms Based on Co-word Analysis
文献类型:期刊文章
机构地区:[1]杭州电子科技大学计算机应用技术研究所,浙江杭州310018
基 金:浙江省自然科学基金资助项目(Y1100176)
年 份:2011
卷 号:29
期 号:11
起止页码:1621-1624
语 种:中文
收录情况:BDHX、BDHX2008、CSSCI、CSSCI2010_2011、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。
关 键 词:共词分析 TF-IDF 共词矩阵 Bisecting K-MEANS 主题
分 类 号:G350]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...