期刊文章详细信息
基于机器学习的个人贷款违约预测模型的应用研究
The Application Research of Households’ Loan Default Prediction Model Based on Machine Learning
文献类型:期刊文章
机构地区:[1]河北金融学院河北省科技金融协同创新中心 [2]河北金融学院大数据科学学院 [3]河北金融学院研究生部
基 金:河北省社会科学基金项目“后脱贫时期扶贫金融对脱贫户可行能力的传导机制与政策设计研究”的资助,项目编号HB20GL015
年 份:2022
期 号:6
起止页码:46-59
语 种:中文
收录情况:BDHX、BDHX2020、CSSCI、CSSCI_E2021_2022、NSSD、RCCSE、RWSKHX、核心刊
摘 要:针对贷款违约给商业银行带来的信用风险损失,本文基于Kaggle平台的Loan Defaulter数据集,通过建立机器学习模型预测客户违约情况,以降低信贷风险。本文根据贷款数据类别不平衡和特征维度高的特点,对其进行数据处理以及探索性数据分析,得出与贷款违约高度相关的重要特征,包括性别、家庭人数以及借款人所在城市、住房类型、总收入、所属行业、职业类型、工作年限、受教育程度、消费贷款额度、贷款金额、贷款年金等。在比较各类模型的基础上,本文选择表现较好的随机森林,XGBoost以及K近邻组合为Stacking集成模型。实验表明,与单一算法相比,该模型的集成算法具有更高的精确度和预测效果,其中Stacking模型能够融合其他基础模型的优点,取得最好的预测效果。本文主要创新点有二:一是梳理信用评估模型中集成模型的基本特征,基于不同模型的优势,引入Stacking模型组合建模,融合四组机器学习模型并建立双层学习器,提高了信用风险评估效果;二是基于普惠金融发展,将研究对象具体化为个人信贷,应用场景更加细化,并得出影响贷款违约的重要特征。
关 键 词:贷款违约预测 数据分析 集成算法 模型融合
分 类 号:TP181] F832.479]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...