登录    注册    忘记密码

期刊文章详细信息

VSM信息检索中的数据稀疏问题分析与规避策略    

Data Sparseness Analysis and its Avoidance Strategies in the VSM Information Retrieval

  

文献类型:期刊文章

作  者:梁士金[1]

机构地区:[1]东莞理工学院城市学院图书信息中心

出  处:《图书情报工作》

年  份:2013

卷  号:57

期  号:1

起止页码:142-146

语  种:中文

收录情况:BDHX、BDHX2011、CSSCI、CSSCI2012_2013、JST、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:以矩阵理论作为研究的切入点,将经典向量空间模型中常用的向量和集合以矩阵的形式加以重构,并认为基于向量内积法的相似性计算与相应矩阵的乘法运算等价。结合稀疏矩阵和数据稀疏的定义,分析VSM信息检索背景下数据稀疏产生的原因;同时,讨论三种情形下数据稀疏对相似性计算的共同影响———部分毫无意义的时间复杂度。最后,给出规避数据稀疏问题的三层策略:文本级策略、文本集级策略和矩阵级策略。

关 键 词:向量空间模型 信息检索 数据稀疏 规避策略

分 类 号:G354]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心