期刊文章详细信息
基于KL距离的非平衡数据半监督学习算法 ( EI收录)
A Semi-Supervised Learning Algorithm from Imbalanced Data Based on KL Divergence
文献类型:期刊文章
机构地区:[1]复旦大学计算机科学技术学院,上海200433 [2]华东师范大学海量计算研究所,上海200062 [3]上海市智能信息处理重点实验室,上海200433
基 金:国家自然科学基金项目(60673137;60773075);国家"八六三"高技术研究发展计划基金项目(2009AA01Z149);上海市教委科技创新项目(10ZZ33)
年 份:2010
卷 号:47
期 号:1
起止页码:81-87
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当隐匿反例非常少或训练集中的实例分布不均匀时.因此,提出了一种基于KL距离的半监督分类算法——LiKL:依次挖掘出未标识集中的最可靠正例和反例,接着使用训练好的增强型分类器来分类.与其他方法相比,不仅提高了分类的查准率和查全率,而且具有鲁棒性.
关 键 词:半监督学习 非平衡 KL距离 朴素贝叶斯 LOGISTIC回归
分 类 号:TP391] TP18[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...