期刊文章详细信息

基于GAN数据增强的软件缺陷预测聚合模型
Aggregation Model for Software Defect Prediction Based on Data Enhancement by GAN

文献类型：期刊文章

作　　者：徐金鹏[1] 郭新峰[1] 王瑞波[2] 李济洪[2]

XU Jinpeng;GUO Xinfeng;WANG Ruibo;LI Jihong(School of Automation and Software Engineering,Shanxi University,Taiyuan 030006,China;School of Modern Education Technology,Shanxi University,Taiyuan 030006,China)

机构地区：[1]山西大学自动化与软件学院,太原030006 [2]山西大学现代教育技术学院,太原030006

出　　处：《计算机科学》

基　　金：国家自然科学基金青年科学基金(61806115)。

年　　份：2023

卷　　号：50

期　　号：12

起止页码：24-31

语　　种：中文

收录情况：BDHX、BDHX2020、CSCD、CSCD_E2023_2024、DOAJ、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘　　要：在软件缺陷预测任务中,通常基于C&K等静态软件特征数据集,使用机器学习分类算法来构建软件缺陷预测(SDP)模型。然而,大多数静态软件特征数据集中缺陷数较少,数据集的类不平衡问题较为严重,导致学习到的SDP模型的预测性能较差。文中基于生成对抗网络(GAN),并利用FID得分筛选生成正例样本数据,增强正例样本量,然后在组块正则化m×2交叉验证(m×2BCV)框架下,通过众数投票法聚合多个子模型的结果,最终构成SDP模型。以PROMISE数据库下的20个数据集为实验数据集,采用随机森林算法构建SDP聚合模型。实验结果表明,与传统的随机上采样、SMOTE、随机下采样相比,所提SDP聚合模型的F1平均值分别提高了10.2%,5.7%,3.4%,且F1的稳定性也得到相应提高;所提SDP聚合模型在20个数据集的评测中,有17个F1值最高。从AUC指标来看,所提方法与传统的采样方法没有明显差异。

关键词：生成对抗网络数据增强组块正则化交叉验证软件缺陷预测聚合模型

分类号：TP311]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于GAN数据增强的软件缺陷预测聚合模型
Aggregation Model for Software Defect Prediction Based on Data Enhancement by GAN

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于GAN数据增强的软件缺陷预测聚合模型 Aggregation Model for Software Defect Prediction Based on Data Enhancement by GAN

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于GAN数据增强的软件缺陷预测聚合模型
Aggregation Model for Software Defect Prediction Based on Data Enhancement by GAN