期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京大学计算机系网络实验室,北京100871
基 金:国家973重点基础研究发展规划:网络环境下海量信息的理论与方法研究(编号:G1999032706)
年 份:2004
卷 号:40
期 号:1
起止页码:129-133
语 种:中文
收录情况:AJ、BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:北京大学网络实验室的“天网”文件搜索引擎是国内自主开发的一个海量(FTP和HTTP)文件搜索引擎系统,它的数据库维护着1千多万的FTP文件与目录信息,索引了国内大部分匿名FTP站点。该文对“天网”的海量FTP文件目录信息的分布特征进行了研究,并分析了其对文件搜索引擎设计以及FTP服务器分类管理等方面的某些重要启示。该文的研究成果将增强人们对互联网上文件分布特征的了解,对于设计和优化一个大规模的文件搜索引擎系统具有积极的指导作用。
关 键 词:FTP文件与服务器 分布特征 搜索引擎 文件系统 数据挖掘
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...