期刊文章详细信息
文献类型:期刊文章
机构地区:[1]广东商学院教育技术中心,广东广州510320 [2]华南理工大学计算机学院,广东广州510640 [3]广州卷烟一厂信息计算中心,广东广州510310
基 金:广东省科技攻关项目(A1020103)
年 份:2004
卷 号:22
期 号:9
起止页码:107-110
语 种:中文
收录情况:BDHX、BDHX2000、CSCD、CSCD2011_2012、EBSCO、INSPEC、JST、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:根据信息学理论和贝叶斯语义模型,提出一种有效特征词发现方法,利用该方法对训练文本的原始文本特征词集进行聚类,对测试文本进行分类计算和类别标注。闭式测试的结果表明,文本识别的正确率达到了90%以上,该算法对互联网信息处理有较好的应用价值。
关 键 词:文本分类 特征抽取 KL距离 正态分布 贝叶斯概率
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...