期刊文章详细信息
文献类型:期刊文章
机构地区:[1]浙江外国语学院科学技术学院,杭州310012 [2]浙江大学计算机科学与技术学院,杭州310027
基 金:国家自然科学基金项目(61003254);国家科技支撑计划项目(2008BAH24B03);浙江省自然科学基金项目(Y1080130;Y1101304)
年 份:2012
卷 号:42
期 号:S1
起止页码:377-381
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CAS、CSA、CSA-PROQEUST、CSCD、CSCD_E2011_2012、EI、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:从商品评论抽取算法出发,使用开放应用编程接口调用和链接跟踪的方法,分别设计了基于通用爬虫原理和开放应用编程接口(OpenAPI)的商品评论聚焦爬虫算法。在此基础上实现了淘宝网和京东网商品评论收集程序。最后将两者与通用爬虫算法进行比较,证实了二者的程序设计具有针对性强、数据采集实时性好、易嵌入开发等优点,为实时评论数据采集技术的研究提供了新思路。
关 键 词:计算机软件 商品评论 开放应用编程接口 聚焦爬虫 爬虫算法
分 类 号:T-55]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...