期刊文章详细信息
代价敏感的客户流失预测半监督集成模型研究 ( EI收录)
Semi-supervised ensemble based on metacost model for customer churn prediction
文献类型:期刊文章
XIAO Jin;LI Sihan;HE Xiaozhou;TENG Geer;JIA Pinrong;XIE Ling(Business School,Sichuan University,Chengdu 610064,China;Management Science and Operations Research Institute,Sichuan University,Chengdu 610064,China;Beijing Research Center Science of Science,Beijing 100089,China;School of Medical Information Engineering,Zunyi Medical University,Zunyi 563006,China)
机构地区:[1]四川大学商学院,成都610064 [2]四川大学管理科学/运筹学研究所,成都610064 [3]北京科学学研究中心,北京100089 [4]遵义医科大学医学信息工程学院,遵义563006
基 金:国家社会科学基金重大项目(18VZL006);四川大学文科杰出青年基金(sksy1201709);北京市科学技术研究院“北科学者”计划(PXM2020-178216-000008);北京市财政课题(PXM2020-178216-000001)。
年 份:2021
卷 号:41
期 号:1
起止页码:188-199
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、CSSCI、CSSCI2021_2022、EI、IC、JST、NSSD、RCCSE、RWSKHX、SCOPUS、ZGKJHX、核心刊
摘 要:客户流失预测是企业客户关系管理的重要内容.在现实的很多客户流失预测建模过程中,由于数据类别的高度不平衡现象的存在,使得模型的分类性能低下,不能很好地进行分类预测.同时由于现实情况中只有少量有类别标签的样本,更多的是无类别标签数据的存在,造成了大量有用信息的浪费.为了解决以上两个问题,本研究将元代价敏感学习,半监督学习和Bagging集成等技术结合,提出了代价敏感的客户流失预测半监督集成模型(semi-supervised ensemble based on metacost,SSEM).该模型主要包括三个阶段:1)用Metacost方法修改初始有标签训练集L的类别标签,得到新的训练集Lm,并将其随机的分为模型训练集Ltr和模型验证集Va;2)使用Va挑选分类精度最高的三个基分类器,并用其选择性标记无类别标签U中的样本,并将它们添加到Ltr中;3)用新的模型训练集Ltr训练N个基本分类模型,并对测试集样本进行分类,进一步将分类结果进行集成.在两个客户流失预测数据集上进行实证分析,将SSEM模型与常用的监督式集成模型以及半监督式集成模型相比,结果表明,SSEM具有更好的客户流失预测性能.
关 键 词:客户流失预测 类别分布不平衡 半监督 协同训练 代价敏感
分 类 号:TP18] F270]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...