期刊文章详细信息
文献类型:期刊文章
机构地区:[1]西安电子科技大学网络教育学院,西安710071 [2]西安电子科技大学经济管理学院,西安710071
年 份:2008
期 号:3
起止页码:45-50
语 种:中文
收录情况:BDHX、BDHX2004、CSSCI、CSSCI2008_2009、RWSKHX、核心刊
摘 要:针对大规模信息采集,运用Bloom Filter及其改进算法,在误差允许的条件下,通过URL散列运算可以有效地对同源网页进行去重。实践证明,通过对其参数进行合理的调整,可以达到满意的结果。
关 键 词:布隆过滤器 散列函数 URL 网页去重
分 类 号:TP393.092]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...