期刊文章详细信息
文献类型:期刊文章
机构地区:[1]智能技术与系统国家重点实验室,清华信息科学与技术国家实验室(筹),清华大学计算机系,北京100084 [2]搜狐公司研发中心,北京100084
基 金:国家973重点基础研究资助项目(2004CB318108);国家自然科学基金资助项目(60621062,60503064,60736044);国家863高科技计划资助项目(2006AA01Z141)
年 份:2008
卷 号:22
期 号:2
起止页码:76-80
语 种:中文
收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:网页在其生命周期内的活跃程度会随时间发生变化。有的网页只在特定的阶段有价值,此后就会过时。从用户的角度对网页的生命周期进行分析可以提高网络爬虫和搜索引擎的性能,改善网络广告的效果。利用一台代理服务器收集的网页访问量信息,我们对网页的生命周期进行了研究,给出了用户兴趣演变的模型。这个模型有助于更好地理解网络的组织与运行机理。
关 键 词:计算机应用 中文信息处理 用户行为分析 网页生命周期 网络日志挖掘
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...