期刊文章详细信息
文献类型:期刊文章
机构地区:[1]山西大学成人教育学院,太原030006
年 份:2000
卷 号:19
期 号:6
起止页码:644-649
语 种:中文
收录情况:AJ、BDHX、BDHX1996、CSA、CSA-PROQEUST、CSSCI、CSSCI2000_2002、INSPEC、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
关 键 词:文本分类 中文 自动分类 字频向量 映射函数 语料库 汉字
分 类 号:G254[图书情报与档案管理类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...