期刊文章详细信息
文献类型:期刊文章
机构地区:[1]合肥工业大学计算机与信息学院,合肥230009 [2]池州学院计算机中心,池州247000
基 金:国家自然科学基金资助项目(050504F);池州学院自然科学基金资助项目(XK0829)
年 份:2009
卷 号:35
期 号:7
起止页码:49-51
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
关 键 词:WEB挖掘 数据预处理 阈值 Frame页面 会话识别
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...