登录    注册    忘记密码

期刊文章详细信息

基于数据模糊性的PU学习研究    

On positive and unlabeled learning based on data fuzziness

  

文献类型:期刊文章

作  者:李婷婷[1] 吕佳[1]

LI Tingting;LYU Jia(College of Computer and Information Science,Chongqing Normal University,Chongqing Center of Engineering Technology Research on Digital Agricultural Service,Chongqing Normal University,401331,Chongqing,China)

机构地区:[1]重庆师范大学计算机与信息科学学院重庆市数字农业服务工程技术研究中心,重庆401331

出  处:《北京师范大学学报(自然科学版)》

基  金:重庆市自然科学基金资助项目(cstc2014jcyjA40011);重庆市教委科技资助项目(KJ1400513);重庆师范大学科研资助项目(YKC19018)。

年  份:2020

卷  号:56

期  号:1

起止页码:45-51

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CAS、CSCD、CSCD2019_2020、INSPEC、JST、MR、RCCSE、WOS、ZGKJHX、ZMATH、ZR、核心刊

摘  要:PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的PU学习方法:先对正例无标记样本集进行半监督聚类,选出靠近正例样本的低模糊度数据来扩充初始正例集,并选择远离正例样本的低模糊度数据作为可靠负例;再剪辑掉无标记样本中高模糊度数据;最后在扩充后的正例样本集和可靠负例集上训练分类器,对初始无标记样本集进行分类.在标准数据集上的对比实验证实了提出算法的有效性.

关 键 词:PU学习  模糊性  可靠负例  噪声点  分类边界  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心