期刊文章详细信息
基于潜在语义索引的Web信息预测采集过滤方法 ( EI收录)
Forecast and Filter Method for Web Page Gathering Based on Latent Sematic Indexing
文献类型:期刊文章
机构地区:[1]北京航空航天大学机械工程及自动化学院,北京100083 [2]江苏省太仓海关,苏州215400 [3]北京中科辅龙计算机技术有限公司,北京100080
基 金:国家经贸委重大技术创新项目资助
年 份:2004
卷 号:16
期 号:1
起止页码:142-147
语 种:中文
收录情况:AJ、BDHX、BDHX2000、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:Web信息急速膨胀使有效定向采集特定领域信息成为网上信息检索中一个日益重要的研究方向 提出一种基于潜在语义索引的Web信息预测采集过滤方法 在样本文档集潜在语义索引对文档相似计算的基础上 ,构造出用户兴趣模型 ,判断页面相关性进行文本过滤 通过对Web站点结构分析、对未知网页的相关性预测来控制信息采集过程 在保持定向采集精度的同时 ,缩短采集时间、减少存储、加快检索 。
关 键 词:潜在语义索引 信息采集 Web检索系统 网络资源 互联网
分 类 号:G354.4]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...