登录    注册    忘记密码

期刊文章详细信息

Deep Web爬虫研究与设计  ( EI收录)  

On the research and design of deep web crawler

  

文献类型:期刊文章

作  者:郑冬冬[1] 赵朋朋[1] 崔志明[1]

机构地区:[1]苏州大学计算机科学与技术系,苏州215006

出  处:《清华大学学报(自然科学版)》

基  金:Deep Web关键技术研究

年  份:2005

卷  号:45

期  号:S1

起止页码:1896-1902

语  种:中文

收录情况:AJ、AMR、BDHX、BDHX2004、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:随着W eb的发展,越来越多的数据可以通过表单提交来获取,这些表单提交所产生信息是由D eep W eb后台数据库动态产生的。在这种情况下,信息集成就更加需要W eb爬虫来自动获取这些页面以进一步地处理数据。为了帮助用户完成这样的任务,提出一种用于搜集D eep W eb页面的爬虫的设计方法。此方法使用一个预定义的领域本体知识库来识别这些页面的内容,同时利用一些来自W eb站点的导航模式来识别自动填写表单时所需进行的路径导航。通过对来自不同领域的D eep W eb站点的大量实验,验证了此方法是非常有效的。

关 键 词:DEEPWEB 导航模式  领域本体知识库  爬虫

分 类 号:TP393.09]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心