期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学技术大学计算机科学技术系,安徽合肥230027 [2]安徽省计算与通讯软件重点实验室,安徽合肥230027 [3]解放军保密委员会技术安全研究所,北京100091
基 金:国家973课题(No.2004CB318109);国家863课题(No.2007AA11Z240);教育部新世纪优秀人才支持计划(No.NCET-07-0787)
年 份:2009
卷 号:37
期 号:5
起止页码:1019-1024
语 种:中文
收录情况:BDHX、BDHX2008、CAS、CSCD、CSCD2011_2012、EI(收录号:20092412123358)、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:短文本分类是网络内容安全的一种主要方法.然而,短文本固有的关键词特征稀疏和样本高度不均衡等特点,使得难以直接使用现有针对长文本的分类算法.本文提出了一种针对短文本的动态组合分类算法.首先构造出一种树状组合分类器结构,可有效缓解短文本特征稀疏和样本高度不均衡对分类性能的影响;进一步,提出了一种动态调整策略来训练组合分类器,可以根据样本的分布特点自适应地调整分类器的组合结构.测试实验表明,相对于传统的单一分类方法和集成分类方法,动态组合分类算法在短文本分类中可以获得更好的准确率和召回率.
关 键 词:短文本分类 组合分类器 动态调整策略 ADABOOST算法
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...