期刊文章详细信息
基于密度的kNN文本分类器训练样本裁剪方法 ( EI收录)
A Density-Based Method for Reducing the Amount of Training Data in kNN Text Classification
文献类型:期刊文章
机构地区:[1]复旦大学计算机与信息技术系,上海200433
基 金:国家自然科学基金项目 (60 173 0 2 7)
年 份:2004
卷 号:41
期 号:4
起止页码:539-545
语 种:中文
收录情况:AJ、BDHX、BDHX2000、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:随着WWW的迅猛发展 ,文本分类成为处理和组织大量文档数据的关键技术 kNN方法作为一种简单、有效、非参数的分类方法 ,在文本分类中得到广泛的应用 但是这种方法计算量大 ,而且训练样本的分布不均匀会造成分类准确率的下降 针对kNN方法存在的这两个问题 ,提出了一种基于密度的kNN分类器训练样本裁剪方法 ,这种方法不仅降低了kNN方法的计算量 ,而且使训练样本的分布密度趋于均匀 ,减少了边界点处测试样本的误判 实验结果显示 。
关 键 词:文本分类 KNN 快速分类
分 类 号:TP391] TP18[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...