期刊文章详细信息
基于词替代策略的LSA预处理研究
Research on Pretreatment of Latent Semantic Analysis Based on Term Replacement Policy
文献类型:期刊文章
机构地区:[1]解放军信息工程大学电子技术学院信息安全系,郑州450004
年 份:2011
卷 号:27
期 号:1
起止页码:242-243
语 种:中文
收录情况:普通刊
摘 要:潜在语义分析(LSA)是一种扩展的向量空间模型,通过截断奇异值分解(TSVD)建立低维的词语对文档的潜在语义空间,达到信息抽取和去除"噪声"的目的。但是当文档集里的文档主题分布不均匀时,弱势主题会被当作"噪声"忽略掉。为减弱LSA对弱势主题的忽略,本文利用《同义词林》来计算词语的相似度,提出了一个基于词替代策略的潜在语义分析改进模型。实验表明,此模型能够更好的解决同义词、多义词问题,并且大大减弱对弱势特征的忽略。
关 键 词:词替代 潜在语义分析 同义词林
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...