期刊文章详细信息
文献类型:期刊文章
机构地区:[1]国防科学技术大学并行与分布处理国防科技重点实验室,湖南长沙410073 [2]国防科学技术大学计算机学院软件研究所,湖南长沙410073
基 金:国家自然科学基金(60921062;61003087);国家高技术研究发展计划(863)(2009AA01Z102)
年 份:2012
卷 号:23
期 号:2
起止页码:411-427
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20121014842135)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性.
关 键 词:容错 OPENMP 并行复算 数据流分析
分 类 号:TP316]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...