登录    注册    忘记密码

期刊文章详细信息

基于字频向量的中文文本自动分类系统    

  

文献类型:期刊文章

作  者:王梦云[1] 曹素青[1]

机构地区:[1]山西大学成人教育学院,太原030006

出  处:《情报学报》

年  份:2000

卷  号:19

期  号:6

起止页码:644-649

语  种:中文

收录情况:AJ、BDHX、BDHX1996、CSA、CSA-PROQEUST、CSSCI、CSSCI2000_2002、INSPEC、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。

关 键 词:文本分类 中文 自动分类  字频向量  映射函数 语料库 汉字

分 类 号:G254[图书情报与档案管理类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心