期刊文章详细信息
文献类型:期刊文章
LÜJia;FU Quhan(College of Computer and Information Sciences,Chongqing Normal University,Chongqing Digital Agriculture Service Engineering Technology Research Center,401331,Chongqing,China)
机构地区:[1]重庆师范大学计算机与信息科学学院,重庆市数字农业服务工程技术研究中心,重庆401331
基 金:国家自然科学基金资助项目(11971084);重庆市科技创新资助项目(KJCX2020024);重庆市高校创新研究群体资助项目(CXQT20015)。
年 份:2022
卷 号:58
期 号:1
起止页码:25-32
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、JST、MR、RCCSE、WOS、ZGKJHX、ZMATH、核心刊
摘 要:针对主动学习面向大型数据集人工标记成本过高和半监督自训练算法中存在误标记点影响的问题,提出了一种主动学习与半监督自训练交替迭代训练的联合算法.算法在训练过程中奇数轮次采用主动学习算法,偶数轮次采用自训练算法,通过2种算法的交替迭代训练以弥补彼此不足.自训练算法对无标记样本的预测减轻了主动学习标记样本的负担,同时主动学习标记易变成噪声的样本,减轻了自训练算法训练过程中对样本的标记错误.提出了一种基于密度峰值聚类和隶属度的改进主动学习算法:将初始无标记样本聚类成簇,根据隶属度差值在每个簇内选取部分样本做人工标记,获得可表达样本的整体结构的均衡样本.仿真试验表明:提出的联合算法在性能上要优于2种单一算法.对比常见的主动学习算法,改进后的主动学习算法分类性能得到显著提升,将其应用于联合算法中的效果更具优势.
关 键 词:主动学习 自训练算法 密度峰值聚类 联合算法 隶属度
分 类 号:TP301]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...