登录    注册    忘记密码

期刊文章详细信息

基于机器学习的个人贷款违约预测模型的应用研究    

The Application Research of Households’ Loan Default Prediction Model Based on Machine Learning

  

文献类型:期刊文章

作  者:张丽颖[1,2] 杨若瑾[3]

机构地区:[1]河北金融学院河北省科技金融协同创新中心 [2]河北金融学院大数据科学学院 [3]河北金融学院研究生部

出  处:《金融监管研究》

基  金:河北省社会科学基金项目“后脱贫时期扶贫金融对脱贫户可行能力的传导机制与政策设计研究”的资助,项目编号HB20GL015

年  份:2022

期  号:6

起止页码:46-59

语  种:中文

收录情况:BDHX、BDHX2020、CSSCI、CSSCI_E2021_2022、NSSD、RCCSE、RWSKHX、核心刊

摘  要:针对贷款违约给商业银行带来的信用风险损失,本文基于Kaggle平台的Loan Defaulter数据集,通过建立机器学习模型预测客户违约情况,以降低信贷风险。本文根据贷款数据类别不平衡和特征维度高的特点,对其进行数据处理以及探索性数据分析,得出与贷款违约高度相关的重要特征,包括性别、家庭人数以及借款人所在城市、住房类型、总收入、所属行业、职业类型、工作年限、受教育程度、消费贷款额度、贷款金额、贷款年金等。在比较各类模型的基础上,本文选择表现较好的随机森林,XGBoost以及K近邻组合为Stacking集成模型。实验表明,与单一算法相比,该模型的集成算法具有更高的精确度和预测效果,其中Stacking模型能够融合其他基础模型的优点,取得最好的预测效果。本文主要创新点有二:一是梳理信用评估模型中集成模型的基本特征,基于不同模型的优势,引入Stacking模型组合建模,融合四组机器学习模型并建立双层学习器,提高了信用风险评估效果;二是基于普惠金融发展,将研究对象具体化为个人信贷,应用场景更加细化,并得出影响贷款违约的重要特征。

关 键 词:贷款违约预测  数据分析 集成算法  模型融合  

分 类 号:TP181] F832.479]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心