期刊文章详细信息
文献类型:期刊文章
机构地区:[1]河北大学数字与计算机学院,河北保定071002 [2]河北大学工商管理学院,河北保定071002
基 金:河北省科学技术研究与发展计划(编号:04213534)
年 份:2005
卷 号:41
期 号:14
起止页码:175-178
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:该文根据CH I值原理、基于R BF神经网络和决策树原理,提出了一种文本分类的新方法。决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间,对于维数达成千上万维的文本分类问题很难应用。该文分析了CH I值原理,提出了一种改进的CH I值;并用改进的CH I值选择了对每个文本类别分类贡献大的若干词条,并采用基于RBF神经网络方法对选择的特征进行进一步提取,因此得到维数较小的文本向量空间。最后再使用决策树进行分类,从而既保证了分类精度又可很容易地抽取出分类规则。
关 键 词:特征提取 CHI值 RBF神经网络 决策树
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...