期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京大学信息工程学院深圳市云计算关键技术与应用重点实验室,广东深圳518055 [2]北京大学高可信软件技术教育部重点实验室,北京100871 [3]北京大学信息科学技术学院,北京100871 [4]北京大学机器感知与智能教育部重点实验室,北京100871
基 金:国家自然科学基金Nos.60973002;61170003;国家高技术研究发展计划(863计划)No.2012AA011002;教育部-中国移动科研基金~~
年 份:2015
卷 号:9
期 号:8
起止页码:897-905
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD2015_2016、IC、ZGKJHX、核心刊
摘 要:随着数据规模的日益庞大,在大规模数据集中帮助用户定位出数据量可控的代表性信息显得越发重要。虽然Top-k Skyline查询能够找到数据集中前k个最具代表性的信息,在获取代表性信息的同时又控制了结果规模,满足了上述要求,但是现有的Top-k Skyline查询在面对大规模数据集时效率较低,并不适用于大规模数据集。为了解决这个问题,将Top-k Skyline查询与并行化处理相结合,提出了一种面向大规模数据集的并行化Top-k Skyline查询算法PTKS(parallel Top-k Skyline),通过充分利用分布式资源,将原有查询进行有效的并行化处理,同时设计了基于用户偏好的用于缩减结果数据量的筛选规则,满足用户需求。在真实数据集上进行了相关实验,并与现有方法进行了对比,结果表明PTKS在大规模数据集上的查询效率更具有优势,能很好地适用于大规模数据集。
关 键 词:大规模数据集 Top—k SKYLINE 代表性信息 并行化处理 筛选规则
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...