期刊文章详细信息
VSM信息检索中的数据稀疏问题分析与规避策略
Data Sparseness Analysis and its Avoidance Strategies in the VSM Information Retrieval
文献类型:期刊文章
机构地区:[1]东莞理工学院城市学院图书信息中心
年 份:2013
卷 号:57
期 号:1
起止页码:142-146
语 种:中文
收录情况:BDHX、BDHX2011、CSSCI、CSSCI2012_2013、JST、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:以矩阵理论作为研究的切入点,将经典向量空间模型中常用的向量和集合以矩阵的形式加以重构,并认为基于向量内积法的相似性计算与相应矩阵的乘法运算等价。结合稀疏矩阵和数据稀疏的定义,分析VSM信息检索背景下数据稀疏产生的原因;同时,讨论三种情形下数据稀疏对相似性计算的共同影响———部分毫无意义的时间复杂度。最后,给出规避数据稀疏问题的三层策略:文本级策略、文本集级策略和矩阵级策略。
关 键 词:向量空间模型 信息检索 数据稀疏 规避策略
分 类 号:G354]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...