登录    注册    忘记密码

期刊文章详细信息

基于Bloom Filter的大规模网页去重策略研究    

Research of Large-scale URL Filter Based on Bloom Filter

  

文献类型:期刊文章

作  者:丁振国[1] 吴宝贵[2] 辛友强[2]

机构地区:[1]西安电子科技大学网络教育学院,西安710071 [2]西安电子科技大学经济管理学院,西安710071

出  处:《现代图书情报技术》

年  份:2008

期  号:3

起止页码:45-50

语  种:中文

收录情况:BDHX、BDHX2004、CSSCI、CSSCI2008_2009、RWSKHX、核心刊

摘  要:针对大规模信息采集,运用Bloom Filter及其改进算法,在误差允许的条件下,通过URL散列运算可以有效地对同源网页进行去重。实践证明,通过对其参数进行合理的调整,可以达到满意的结果。

关 键 词:布隆过滤器 散列函数 URL 网页去重

分 类 号:TP393.092]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心