期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南开大学信息技术科学学院,天津300071 [2]军事交通学院汽车指挥系,天津300161
基 金:天津市科技发展计划基金资助项目(06YFGZGX05700);天津市应用基础研究计划基金资助项目(07JCYBJC14500)
年 份:2008
卷 号:34
期 号:21
起止页码:40-41
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:分析大规模中文搜索日志中的查询重复性,通过对查询重复率和用户个体查询重复率等数据的统计发现:查询串的查询频率、文档的点击频率及用户查询频率均符合Zipf分布,查询重复率较高。查询历史越长,查询重复率越高。高查询频率用户的查询重复率较高。以上数据为中文搜索引擎的改进提供了有力的依据。
关 键 词:搜索引擎 日志分析 重复性 ZIPF分布
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...