期刊文章详细信息
文献类型:期刊文章
机构地区:[1]福州大学经济与管理学院
基 金:国家自然科学基金资助项目(71201032);福建省社会科学规划资助项目(2012C021);福建省教育厅社会科学研究资助项目(JA11040S)
年 份:2015
卷 号:37
期 号:2
起止页码:231-237
语 种:中文
收录情况:BDHX、BDHX2014、CSCD、CSCD2015_2016、INSPEC、ZGKJHX、核心刊
摘 要:网络信息资源呈指数级增长,面对用户越来越个性化的需求,主题网络爬虫应运而生。主题网络爬虫是一种下载特定主题网页的程序。利用在采集页面过程获得的特定信息,主题网络爬虫抓取的页面都是与主题相关的。基于主题网络爬虫的搜索引擎以及基于主题网络爬虫构建领域语料库等应用已经得到广泛运用。首先介绍了主题爬虫的定义、工作原理;然后介绍了近年来国内外关于主题爬虫的研究状况,并比较了各种爬行策略及相关算法的优缺点;最后提出了主题网络爬虫未来的研究方向。
关 键 词:网络爬虫 主题爬虫 搜索引擎
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...