期刊文章详细信息
文献类型:期刊文章
机构地区:[1]琼台师范高等专科学校信息技术系,海口571100 [2]西北师范大学计算机科学与工程学院,兰州730070
基 金:教育部科学技术研究重点项目(208148);琼台师范高等专科学校项目(qtkz201006)资助
年 份:2013
卷 号:21
期 号:1
起止页码:219-222
语 种:中文
收录情况:BDHX、BDHX2011、RCCSE、ZGKJHX、核心刊
摘 要:K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时,计算代价大,分类效率降低。因此,提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量。
关 键 词:K最近邻 文本分类 样本裁剪
分 类 号:TP391.11]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...