登录    注册    忘记密码

期刊文章详细信息

一种改进型TF-IDF文本聚类方法    

An Improved TF-IDF Text Clustering Method

  

文献类型:期刊文章

作  者:张蕾[1] 姜宇[2] 孙莉[1]

ZHANG Lei;JIANG Yu;SUN Li(Division of Development and Strategic Planning,Jilin University,Changchun 130012,China;College of Computer Science and Technology,Jilin University,Changchun 130012,China)

机构地区:[1]吉林大学发展规划处,长春130012 [2]吉林大学计算机科学与技术学院,长春130012

出  处:《吉林大学学报(理学版)》

基  金:国家自然科学基金(批准号:62072211).

年  份:2021

卷  号:59

期  号:5

起止页码:1199-1204

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CAS、JST、MR、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:针对传统词频-逆文档频率(TF-IDF)算法对具有特定属性的文本分类存在的不足,尤其是词汇在特定分类中具有特殊意义情形下准确率较低的问题,提出一种改进的TF-IDF文本聚类算法.采用2015—2019年吉林省科研机构发表论文数据进行对比实验,分别用改进TF-IDF算法和传统TF-IDF算法先统计论文中的关键词词频,再通过K-means++算法进行聚类,最后使用随机森林算法分别评估聚类的准确性.实验结果表明,改进TF-IDF算法提高了分类的准确率.

关 键 词:词频-逆文档频率(TF-IDF)  混合聚类 交叉学科  基本科学指标数据库(ESI)文献  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心