登录    注册    忘记密码

期刊文章详细信息

基于关联规则的Web文档聚类算法  ( EI收录)  

A Web Document Clustering Algorithm Based on Association Rule

  

文献类型:期刊文章

作  者:宋擒豹[1] 沈钧毅[1]

机构地区:[1]西安交通大学计算机科学与技术系,陕西西安710049

出  处:《软件学报》

基  金:国家自然科学基金资助项目(60173058);国家863青年基金资助项目(863-306-QN2000-5)~~

年  份:2002

卷  号:13

期  号:3

起止页码:417-423

语  种:中文

收录情况:AJ、BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看作事务的形式,采用关联规则挖掘算法发现主题频集,相应的文档集即为初步文档类;然后依据类间距离和类内连接强度阈值合并、拆分类,最终实现文档聚类.实验结果表明,该算法是有效的,能处理文档类间固有的重叠情况,具有一定的实用价值.

关 键 词:产联规则  WWW Web文档聚类算法  数据挖掘 数据库

分 类 号:TP311.13]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心