期刊文章详细信息
文献类型:期刊文章
YAO Binxiu;NI Jiancheng;YU Pingping;CAO Bo;LI Linlin(College of Information Science and Engineering, Qufu Normal University, Rizhao, Shandong 276800, China;College of Software, Qufu Normal University, Qufu, Shandong 273100, China)
机构地区:[1]曲阜师范大学信息科学与工程学院,山东日照276800 [2]曲阜师范大学软件学院,山东曲阜273100
基 金:国家自然科学基金(No.61402258);山东省本科高校教学改革研究项目(No.2015M102);校级教学改革研究项目(No.jg05021*)
年 份:2017
卷 号:53
期 号:11
起止页码:172-177
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSCD、CSCD_E2017_2018、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似作差所得的边界区域数据需要通过KNN算法确定其最终的类别。实验结果表明,该算法降低了KNN算法的数据计算规模,提高了分类效率。同时与传统的KNN算法和基于聚类改进的KNN文本分类算法相比,准确率、召回率和F_1值都得到了一定的提高。
关 键 词:Canopy聚类 粗糙集 K-最近邻(KNN)算法 文本分类
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...