登录    注册    忘记密码

期刊文章详细信息

结合类频率的关联中文文本分类    

Integrating Class Frequency Into Association Rules Based Chinese Text Categorization

  

文献类型:期刊文章

作  者:钱铁云[1] 王元珍[1] 冯小年[2]

机构地区:[1]华中科技大学计算机学院数据库与多媒体技术研究所,湖北武汉430074 [2]中国电力财务有限公司华中分公司,湖北武汉430077

出  处:《中文信息学报》

基  金:科技部科技电子政务系统关键技术及应用系统的研究资助 (2 0 0 1BA110B0 1)

年  份:2004

卷  号:18

期  号:6

起止页码:30-36

语  种:中文

收录情况:BDHX、BDHX2000、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊

摘  要:该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关系。挖掘出的规则用于形成类别特征词的集合 ,可用来和类标号未知文档的词的集合求交集 ,交集元素个数最多者即为所分类别。实验证明 ,该算法在提高训练时间和测试时间的同时具有较好的召回率、准确率和F Measure。

关 键 词:计算机应用 中文信息处理 基于关联的分类  中文文本分类 词类频率  类别特征词集合  

分 类 号:TP311.13]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心