登录    注册    忘记密码

期刊文章详细信息

几种文本特征降维方法的比较分析    

Comparing Dimension Reduction Methods of Text Feature Matrix

  

文献类型:期刊文章

作  者:高茂庭[1,2] 王正欧[1]

机构地区:[1]天津大学系统工程研究所 [2]上海海事大学计算机系,上海200135

出  处:《计算机工程与应用》

基  金:国家自然科学基金资助项目(编号:60275020);上海市教委科研项目(编号:04FB22);上海海事大学重点学科建设项目(编号:XL0101)

年  份:2006

卷  号:42

期  号:30

起止页码:157-159

语  种:中文

收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘  要:文本挖掘中采用向量空间模型(VSM)来表达文本特征,表现出巨大的维数,从而导致处理过程计算复杂,为此,需要先对文本特征矩阵进行合理的降维处理。隐含语义分析(LSA)、概念索引(CI)、非负矩阵分解(NMF)和随机映射(RP)是几种有效的降维方法,在分析降维空间的含义和计算复杂度后,通过文本聚类实验比较和分析了这几种降维方法的差异,实验表明,这些方法不仅可以对文本特征空间作有效的降维处理,还能在不同程度上凸现文本和词条之间的语义关系,从而提高文本挖掘的效率和准确率。

关 键 词:文本挖掘 降维 随机映射  非负矩阵分解 概念索引  隐含语义分析

分 类 号:TP183]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心