期刊文章详细信息
文献类型:期刊文章
机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学教育技术与网络中心,昆明650500 [3]云南省计算机技术应用重点实验室,昆明650500
基 金:国家自然科学基金资助项目(81360230);国家科技部科技型中小企业技术创新基金资助项目(13C26215305404)
年 份:2016
卷 号:33
期 号:4
起止页码:989-992
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意;面对类别关联度极高的不良信息的多标签分类,分类效果更是大打折扣。针对上述问题,通过改进经典的多标签分类算法RAk EL,首先根据训练文本计算出各标签之间的相似度系数,然后再根据自定义不良信息层次关系计算出综合标签相似度系数矩阵,最后在RAk EL算法投票过程中根据综合标签相似度与中心标签重新确定最终的结果标签集合。与传统的分类方法在真实的语料库上进行多标签分类效果对比,结果证明,该方法对不良信息分类具有较好的效果。
关 键 词:多标签分类 标签之间的相关关系 不良信息 中心标签 标签相似度系数矩阵
分 类 号:TP391.43]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...