期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京邮电大学计算机学院,可信分布式计算与服务教育部重点实验室,北京 [2]北京邮电大学软件学院,北京
基 金:市委、市政府资助.
年 份:2013
卷 号:2
期 号:6
起止页码:125-130
语 种:中文
收录情况:普通刊
摘 要:web服务器的日志文件记录了大量的用户网页访问信息,如何分析这些数据并从中发现用户的网页浏览模式比如用户感兴趣的页面、最佳的页面组合等从而为商家提供良好的决策支持变得越来越重要。本文用数据挖掘技术中的Apriori算法对记录用户页面访问信息的日志数据进行挖掘从而得到用户浏览网页的模式。本文首先对日志数据进行了预处理,从中提取了用户的一次会话中的页面访问记录,然后用Apriori算法对这些访问记录数据进行挖掘,同时针对这些待挖掘数据上的特点对挖掘算法Apriori在k-项候选集与事务的匹配上进行了改进,实验结果表明改进后的算法在处理数据量很大的数据时性能较传统算法有很好的提高。最后本文对挖掘后产生的规则进行了分析,发现了用户对本网站的一些网页的浏览模式,这些浏览模式为商家提供良好的决策支持。
关 键 词:WEB日志 APRIORI算法 WEB日志挖掘 会话识别 k-项候选集
分 类 号:TP39]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...