期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学院大学软件研究所软件工程研究中心,北京100190 [2]电子工业出版社,北京100036 [3]中山大学信息科学与技术学院,广州510006
基 金:国家自然科学基金 No.61100068;国家高技术研究发展计划(863计划) No.2012AA011204;国家科技支撑计划 No.2012BAH14B02~~
年 份:2014
卷 号:8
期 号:8
起止页码:945-955
语 种:中文
收录情况:AJ、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、JST、ZGKJHX、普通刊
摘 要:在线服务系统需要实时接受并处理大量的用户请求,各种原因的错误都可能导致用户的请求失败。由于在线服务系统的请求数量多,产生的日志数据量大,传统使用人工方法进行请求失败原因的分析、统计和管理的工作量巨大。提出了一种基于聚类算法的自动化故障诊断与错误管理方法,通过自动分析在线服务系统自身产生的日志,对用户的失败请求进行归类,帮助程序开发人员和系统管理员进行错误管理,并了解各种失败请求的类别、分布和趋势。同时,使用投票机制自动将每一类错误定位到其所在的源码位置,实现软件缺陷和问题的快速定位。基于该方法实现了一个自动化的错误管理工具,并应用在企业级在线服务系统中。实验结果表明,该方法可以对系统故障进行有效管理,降低系统维护和错误调试成本,还能与MapReduce技术相结合来处理海量的日志信息。
关 键 词:错误管理 日志分析 聚类
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...