登录    注册    忘记密码

期刊文章详细信息

用户感知的重复数据删除算法  ( EI收录)  

User-Aware De-Duplication Algorithm

  

文献类型:期刊文章

作  者:张沪寅[1] 周景才[1,2] 陈毅波[3] 查文亮[1]

机构地区:[1]武汉大学计算机学院,湖北武汉430072 [2]深圳华为技术有限公司IT标准与专利部,广东深圳518219 [3]国网湖南省电力公司信息通信公司,湖南长沙410000

出  处:《软件学报》

基  金:国家自然科学基金(61272454);高等学校博士学科点专项科研基金(20130141110022)

年  份:2015

卷  号:26

期  号:10

起止页码:2581-2595

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD2015_2016、EI(收录号:20154401478239)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:通过大量的实验分析发现:在云桌面场景下,数据拥有者之间的工作相关度越大,则该用户之间存在重复数据的概率越大.基于该实验结果,提出了用户感知的重复数据删除算法.该算法打破了数据空间局部性特征的限制,实现了以用户为单位的更粗粒度的查重计算,可以在不影响重删率的前提下,减少5-10倍常驻内存指纹的数量,并可将每次查重计算的指纹检索范围控制在一个常数范围内,不随数据总量的增加而线性增加,从而有效避免了因为数据总量增加而导致内存不足的问题.除此之外,该算法还能根据存储系统的负载情况自动调整重复指纹检索范围,在性能与重删率之间加以平衡,从而更好地满足主存储场景的需要.原型验证表明,该算法可以很好地解决云计算场景下海量数据的重复数据删除性能问题.与Open Dedup算法相比,当数据指纹总量超出内存可用空间时,该算法可以表现出巨大的优势,减少200%以上的读磁盘操作,响应速度提升3倍以上.

关 键 词:重复数据删除 云计算  虚拟桌面云  I/O性能瓶颈  数据局部性

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心