期刊文章详细信息
文献类型:期刊文章
LI Pei(School of Computer Science & Technology,Xi'an University of Posts & Telecommunications,Xi'an 710121;Shaanxi Provincial Key Laboratory of Network Data Analysis and Intelligent Processing,Xi'an University of Posts & Telecommunications,Xi'an 710121)
机构地区:[1]西安邮电大学计算机学院 [2]西安邮电大学陕西省网络数据智能处理重点实验室
基 金:国家自然科学基金项目(编号:61105064);陕西省自然科学基础研究计划项目(编号:2016JM6085);陕西省教育厅科学研究计划项目“基于文本挖掘的网络社区情感倾向研究”(编号:17JK0687);陕西省普通高等学校重点学科专项资金建设项目资助
年 份:2019
卷 号:47
期 号:6
起止页码:1415-1420
语 种:中文
收录情况:ZGKJHX、普通刊
摘 要:论文主要为网络爬虫的设计及实现、反爬虫技术的实现及相关技术的研究。通过研究目标网站爬虫门槛的协商及通过的条件,及反爬虫相关技术及最新发展。基于Python设计及实现一个完整的网络爬虫,最终完成了对目标网站所有文章数据的提取和存储,并借助对实验室内部网站的测试并实现了绕过反爬虫及反爬虫技术的研究,并对网络爬虫及反爬虫技术进行了理论说明和发展展望。
关 键 词:网络爬虫 Scrapy框架 反爬虫
分 类 号:TN711]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...