登录    注册    忘记密码

期刊文章详细信息

基于不平衡文本数据挖掘的铁路信号设备故障智能分类  ( EI收录)  

Intelligent Classification of Faults of Railway Signal Equipment Based on Imbalanced Text Data Mining

  

文献类型:期刊文章

作  者:杨连报[1] 李平[2] 薛蕊[2] 马小宁[2] 吴艳华[2] 邹丹[2]

机构地区:[1]中国铁道科学研究院,北京100081 [2]中国铁道科学研究院电子计算技术研究所,北京100081

出  处:《铁道学报》

基  金:中国铁道科学研究院院基金重大课题(2017YJ005;2017YJ006)

年  份:2018

卷  号:40

期  号:2

起止页码:59-66

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2017_2018、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:针对铁路信号设备不平衡故障文本数据,提出基于文本挖掘的铁路信号设备故障智能分类模型。采用TF-IDF模型实现电务信号设备故障文本的特征提取并转换为向量,基于Voting的方式实现多分类器集成学习分类。该模型利用SVM-SMOTE算法对TF-IDF转换后的小类别文本向量数据进行随机生成,采用逻辑回归、朴素贝叶斯、SVM等基分类器和GBDT、随机森林集成分类器对平衡后的数据进行分类,考虑不同分类器的适用特点,通过Voting方式进行多分类器集成学习。通过对某铁路局2012—2016年铁路信号设备故障文本数据进行试验分析,表明该模型可使故障分类的准确率、召回率和F-score均得到显著提升。

关 键 词:铁路信号设备 故障分类  不平衡文本数据  SMOTE 基分类器  集成分类器 集成学习  

分 类 号:U284]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心