登录    注册    忘记密码

期刊文章详细信息

基于DBSCAN聚类的改进KNN文本分类算法    

An Improved KNN Text Categorization Algorithm Based on DBSCAN

  

文献类型:期刊文章

作  者:苟和平[1] 景永霞[1] 冯百明[2] 李勇[2]

机构地区:[1]琼台师范高等专科学校信息技术系,海口571100 [2]西北师范大学计算机科学与工程学院,兰州730070

出  处:《科学技术与工程》

基  金:教育部科学技术研究重点项目(208148);琼台师范高等专科学校项目(qtkz201006)资助

年  份:2013

卷  号:21

期  号:1

起止页码:219-222

语  种:中文

收录情况:BDHX、BDHX2011、RCCSE、ZGKJHX、核心刊

摘  要:K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时,计算代价大,分类效率降低。因此,提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量。

关 键 词:K最近邻  文本分类 样本裁剪  

分 类 号:TP391.11]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心