期刊文章详细信息

使用最大熵模型进行中文文本分类 ( EI收录)
Using Maximum Entropy Model for Chinese Text Categorization

文献类型：期刊文章

作　　者：李荣陆[1] 王建会[1] 陈晓云[1] 陶晓鹏[1] 胡运发[1]

机构地区：[1]复旦大学计算机与信息技术系,上海200433

出　　处：《计算机研究与发展》

基　　金：国家自然科学基金项目(60173027)

年　　份：2005

卷　　号：42

期　　号：1

起止页码：94-101

语　　种：中文

收录情况：AJ、BDHX、BDHX2004、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘　　要：随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于最大熵模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果.但是,将最大熵模型应用在文本分类中的研究却非常少,而使用最大熵模型进行中文文本分类的研究尚未见到.使用最大熵模型进行了中文文本分类.通过实验比较和分析了不同的中文文本特征生成方法、不同的特征数目,以及在使用平滑技术的情况下,基于最大熵模型的分类器的分类性能.并且将其和Bayes,KNN,SVM三种典型的文本分类器进行了比较,结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法.

关键词：文本分类最大熵模型特征 N-GRAM

分类号：TP391] TP18[计算机类]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

使用最大熵模型进行中文文本分类 ( EI收录)
Using Maximum Entropy Model for Chinese Text Categorization

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

使用最大熵模型进行中文文本分类 ( EI收录) Using Maximum Entropy Model for Chinese Text Categorization

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

使用最大熵模型进行中文文本分类 ( EI收录)
Using Maximum Entropy Model for Chinese Text Categorization