期刊文章详细信息
基于改进朴素贝叶斯分类算法的火灾分类
On the fire-disaster classification based on the improved naive Bayesian algorithm
文献类型:期刊文章
GE Ji-ke;CHEN Dong;WANG Wen-he;CHEN Zu-qin;CHEN Guo-rong;LIU Can(School of Intelligent Technology and Engineering,Chongqing University of Science and Technology,Chongqing 401331,China)
机构地区:[1]重庆科技学院智能技术与工程学院
基 金:国家自然科学基金项目(51704054);教育部人文社会科学研究项目(18YJCZH018);重庆市基础与前沿研究计划项目(cstc2017jcyjAX0379)
年 份:2019
卷 号:19
期 号:4
起止页码:1122-1127
语 种:中文
收录情况:BDHX、BDHX2017、CAS、CSA-PROQEUST、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对火灾文本中各类别分布不均衡的特点,提出了基于改进朴素贝叶斯(INB)的文本分类算法,用于对其进行相对准确的分类。首先,利用改进的卡方统计(ICHI)方法提取各类别文本特征词条,再根据特征词条在对应类别中所起的作用不同,使用词频-反文档频率(TF-IDF)加权计算方法对其赋予不同的权重,从而构建INB分类器;接着,通过分词处理和特征词提取,构建火灾文本数据集;最后,应用INB分类器实现对火灾文本的有效分类。本方法规范化地提取和表示了火灾文本的特征词条,解决了火灾文本在训练集数据量少且各类别分布不均衡时存在少数类别特征被覆盖和分类准确度受特征词集规模影响较大的问题。为了验证本方法的有效性,引入Kappa系数作为分类器性能评价指标,并与传统朴素贝叶斯方法和补集朴素贝叶斯算法进行比较。结果表明,所提方法准确度和Kappa系数分别达到了91.45%和0.903,分类器性能比较理想,能够较为准确地对类别分布不均衡的火灾文本进行分类。
关 键 词:安全管理工程 不均衡分布 火灾文本 改进朴素贝叶斯 Kappa系数
分 类 号:X921[安全科学与工程类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...