什么是问题管理?
发布时间:2010年05月31日点击数: 作者:ITGOV中国IT治理研究中心 来源:ITGOV中国IT治理研究中心
【字体: 收藏 打印文章
摘要:
如果发生事故则启动事故管理流程对其进行处理;当服务恢复正常,受影响用户恢复工作时,就停止对该事故的处理活动。但是这样做意味着导致事故发生的根源并不一定都解决了,因而事故还有可能再次发生。

如果发生事故则启动事故管理流程对其进行处理;当服务恢复正常,受影响用户恢复工作时,就停止对该事故的处理活动。但是这样做意味着导致事故发生的根源并不一定都解决了,因而事故还有可能再次发生。

问题管理调查基础架构和所有可用信息,包括事故数据库,来确定引起事故的真正的潜在原因以及提供的服务中可能存在的故障。这些调查是必要的,因为基础架构复杂而且分散,而且事故间的关联不是很明显。比如,有几种错误可能由一个问题引起,而同一个错误也可能与几个若干个问题相关。因此,首先我们必须确定引起事故的原因,一旦确定了根本的原因,同时产生了可接受的应急措施,问题就可被当成一个已知错误来处理。因此,一旦找到了永久解决这些根本原因的方法,我们就可以发出一个变更请求(RFC)来消灭这些已知错误。而在此之后,问题管理会继续跟踪和监控这些基础架构中的已知错误。因此,需要记录所有已确定的错误,他们的症状以及可用的解决方案等相关信息。

如下图所示,说明了问题、已知错误和变更请求(RFC)三个概念的定义及它们之间的相互关系。

在ITIL中,“已知错误”这个词也可用于表示某一事故的状态。而在问题管理这一章节中,“已知错误”只用于表示问题,即:一个已知错误是指当成功地对一个问题进行诊断并且以找到了一个应急措施之后,这个问题所处的状态。

京ICP备06004481号   Copyright 2002 - 2006 ITGov.org.cn, All Rights Reserved