期刊文章详细信息
云计算系统中基于伴随状态追踪的故障检测机制 ( EI收录)
Detecting Faults by Tracing Companion States in Cloud Computing Systems
文献类型:期刊文章
机构地区:[1]国防科学技术大学并行与分布处理国家重点实验室,长沙410073 [2]香港中文大学深圳研究院 [3]阿里巴巴云计算公司计算平台部,杭州310011
基 金:国家"九七三"重点基础研究发展规划项目基金(2011CB302600);国家自然科学基金(90818028;91018004;61100077);国家杰出青年科学基金(60625203)资助~~
年 份:2012
卷 号:35
期 号:5
起止页码:856-870
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20122815240367)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:在运行时检测分布式系统内所产生的故障需要事先获得故障特征模型.构造故障特征模型的常见做法为将故障注入系统并根据随后系统内所产生的特征症状(如异常事件日志)建模.已有建模方法通常使用从故障发生到给定时间窗口之内的特征症状.然而,根据真实系统观察,不同故障的传播影响时间相差很大,且故障特征会在故障传播过程中发生改变.因此,已有方法对检测时间窗口之后发的故障特征症状不能识别或会产生大量错误报警.为了解决此问题,文中提出一种基于故障注入测试的故障特征提取方法,该方法主要由3步组成:(1)过滤噪声日志;(2)构造1个故障识别器识别不同故障的早期特征;(3)为每类故障构造限状态追踪器追踪该故障的后期传播状态,从而在故障被识别出来后持续跟踪故障传播状态.通过在企业级云计算系统中进行实验验证,与已有方法相比该文方法具备更高的故障检测精确度.
关 键 词:事件日志 故障检测 故障注入 故障特征提取 云计算系统
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...