各位大家好,非常高兴今天有这样一个机会就IT服务管理体系的建设和应用进行一个交流。今天跟大家汇报和交流的题目是IT服务管理的战略及实施策略。刚才两位嘉宾也谈到了IT实施服务管理体系,这段时间以来这个词在国内也比较热。具体IT服务管理的体系和这个平台如何建设?大家了解IT服务里面这些实施流程先后和优先次序到底是什么?我们是围绕着现在已有的网管平台和应用平台基础上做,还是提到更高一层的IT服务管理的平台上来。今天我跟大家交流的就是思科体系流程方面的一些经验跟大家分享。
今天介绍的题目有四个方面,首先是思考企业级IT平台近来管理方面的经验,其次结合我们部门对国内行业几个客户实施IT管理评估和咨询方面我们发现的一些典型的问题跟大家总结一下。第三,IT服务管理平台实施方面我们建议的一些实施的步骤。最后谈一下IT的生命周期的服务。
既然我们谈IT的服务管理的实施的战略和策略,先谈一下思科的战略管理的目标。其实这个目标就是通过对管理职能的集成和自动化来降低IT资源的整体和运营成本。大家注意这里我们提到的是IT而不是网络。事实上在现在的IT或者是IT服务管理平台体系建设中,大家经常把网络管理和IT管理相混淆,把管理监控和网络相混淆。这个主要的原因,我们感觉是我们国内一些用户在IT管理的过程中,体系和平台的建设过程中还是缺乏一些成熟的经验和实施案例的指导和参照。要么是根据自己的需求拍脑门想出来,根据IT服务里面一些指导性的原则,要么更多的是围绕着厂商提供的跟IT服务相关的产品,实际上是网管系统和应用监控平台,而不是整体的IT资源管理平台。围绕着产品这样的实施最终造成一些结果是实施出来的东西和一开始的期望值有差距,或者说实施出来这样一个IT服务平台,对实际IT管理中没有非常大的帮助。
可以看到思科当前网络投资运营成本来看,一方面运行成员的机构现在相对来讲是比较庞大的。第二点,跟设备和我们进行监控管理和运营管理相关的这样一些平台和软件的应用比较繁多,这点说出来大家非常了解,几乎每家客户网管平台、系统的监控平台和应用的监控平台通常都是分开的,要么这三块选择不同厂商的产品,要么选择相同厂商的产品。但是由于相同厂商的产品运营这块没有实现共享,所以我们最基本的流程就是配置管理的流程。所以说在这样的状况下进行的IT管理,和服务平台的建设某种程度上形同虚设。国内一家客户服务平台已经运行两年了,也按照需求进行了变更管理等一系列的流程和审批的程序。但是事实上底层的运行数据还是静态的,没有人维护,而这些流程的制定和审批的过程是形同虚设,所以往往是先执去审批。而没有达到IT服务里所达到的效果。大部分单位我们制定了一些跟服务相关的指标。最简单的全网的可融性等等,但是也存在两个问题,一个是这些指标没有办法时时的进行监控,第二点运营管理流程不足以保证这些管理指标的实行。
我们思科的注意力更多的是在如何搭建IT服务管理的这个一般平台。包括网络设备、主机服务器,包括核心应用包括打印机、都使用到IT服务管理的平台上去。
资源管理平台的四个要项,1、体系架构。体系架构里的这两点看起来不用说大家都知道,其实这里面有一些隐含的深意,第一点我管理的对象必须是一个可靠、趋向单一厂商这样的网络体系架构。现在在思科里面运行一庞大的核心业务系统,当这样一个系统按照P级故障的要求在15分钟之内解决问题的时候,发生这样一个事件的时候你一年全网的指标已经泡汤了。所以SLA的制定第一点要满足网络要可靠,当你网络核心部位的路由器、交换器或者主机发生故障10分钟的时候体的全年SLA指标已经形同虚设了。IT服务管理的SIV到底是什么概念呢?我们思科感觉更多的设备一级出现问题的时候我们的响应时间。
另外在搭建我们IT资源管理平台的时候,一定要是开放的、模块化、功能可标准化配置的这样一个资源管理平台。我们绝大部分国内客户实际上是在网管平台,这个当中厂商的作用是很大的。这个就像你去请一个个人的健身教练,你是去请健身器械的厂商制定自己的健身计划还是去请一个个人的健身教练为自己制定一个贴身的健身计划。除此之外你聘请健身教练的时候你还要看教练本身的体型体魄,我才能决定是否用他。
第二点就是工具,在IT资源管理平台上我们到底要实现哪些功能?要使用哪些工具?我们觉得首先是全网设备一级的配置,并更、实时监控和报警、SLA测量和分析统计,报表和基于策略的IP地址分支和管理功能模块。我们思科10年前决定到底是使用一些商用的软件,还是根据自己的业务需求在已有的网络系统和应用的监控工具基础之上搭建一个统一的IT服务管理平台,思科选择了后者。
再有一点SLA的分析测定和统计报表。这点首先你要确定我的运行标是可以实现的,其次这些指标在实施的过程中要实时的进行监控。相关的统计功能主要是临时趋势分析、总量规划。再有一点就是集成的基于策略的,在企业内部IP地址的分配和管理功能。这点目前市面上一些网管平台通常大家把IP地址不当作自己的IT资源。其实IP地址是你实施IT管理的一项资源,跟网络设备一样是一个可分配的资源。再有当然了很简单,因为现在分布式的基于管理和应用的操作界面是必然的。再有就是流程,不管有没有平台的工具我们认为流程都是必要的,流程的必要在于规范你日常运维管理过程中所进行的一些操作步骤和相应的体系架构的管理。这个流程思科IT服务管理平台当然是支持相关协议的。
管理机制这个同样重要,我们看到国内大部分的客户在实施自己服务平台的时候通常是整个企业设置一个服务平台。我们不是说服务平台建设是不必须要求的,但是现在我们感觉服务平台的建立更多的有点像政府的样板工程。你的服务平台管理如果没有底层实时的数据库支持它,如果你的服务平台在人员和设置之上没有任何分层的技术架构的设置那么它一定是一个我们所说的这样一个样板工程。它所发生的作用就是IT最终的用户或者部门领导他在出现问题的时候知道去找谁。并不能帮助你们真正的实现你事先所制定的SLA。所以我们进行企业级服务管理体系平台建设的时候,我们参照这些基本原则,一个是自顶向下、统一规划、分布实施的原则。再有支持IT服务管理中主要的运营流程。再一个一定要以网络的服务平台为中心。
下面我们列了四点,一个是进咱实现统一的网络系统和应用资源配制和变更管理的功能。服务平台建立起来之后,服务平台只是进行事件故障变更过程中的过程管理。服务平台建设的本身并没有办法来保证当一个网络事件或者是事故发生的时候能力得到有效的处理。得到有效的处理必须要有一个实时的配制管理的工具,以及要有合理的分级体系的建立。
再一个实现资源配制的管理过程中,通过假设分析确定网络和系统设备及应用的故障和服务的级别。这点是IT服务管理中最常见的一个误区。比如思科IT资源管理平台近来的时候当设备入网的时候,对它进行配置管理。配置管理的时候要根据设备系统的应用它所在的在你整个网络计算环境中所处的位置确定它的故障和服务级别。这样做有两个好处,第一事件发生的时候当时值班的人员他不需要这样的故障是一个什么级别,这样的级别事先已经做好了。大部分现在客户中的一些情况,我相信每一家企业都有自己制定的这样一个故障和服务级别。但是这些级别的建立我们想想有多少呢?绝大部分都是基于对可能发生事件所产生结果的这样一个描述的基础之上所建立的。这就意味着当一个事件发生的时候大家都知道一个网络事件,演变成事故的过程中它有一个衍变的过程,本来一个桌面系统安全管理中的问题,由于儒虫病毒供给的是网络,最终造成的整个网络瘫痪,最终体现是网络的事故。而追根究底事实上是桌面管理的问题。
我们再来看看思科IT资源管理平台我们叫企业的资源管理平台。它管理的对象远远超出了我们全球这个网络设备的层次,还包括所有运行在网络之上的核心应用。我们的主机和服务器、数据中心。事实上所有连在网络上的资源包括打印机、不间断电源等等这些都在管理的范围。这是思科我们称之为IT的运行指挥中心,不是网络的的运行指挥中心。他们是每一班有三个人员。在印度我们有两个团队的小组,根据时差的关系他们可以随时备份。如果没有整体IT资源管理的话如何应付我们每年花的P级这样整个网络的事件?这个是绝对不可能的。所以强调两点,第一点是整体整合的IT资源管理平台的建立。第二点就是分级实施的管理。
今天跟大家分享的主要目的,是把思科搭建IT管理平台过程中经验跟大家分享和介绍一下。EMAN有点类似于电信运营商的OSS。就是说日常管理服务这块是大家比较关心的,我们通常所的IT服务管理这一块,它还包括思科像部门之间IT经费的结算,这个是基础设施的服务,主要是管理所有思科用户管理和权限管理。由于思科内部大量使用IP电话、无线网络等等。所以这些管理也在EMAN管理范围这内。我们EMAN建设的核心是支持IT服务管理的所有的这些流程,思科的EMAN事实上是做到了对整个的服务提供和服务支持这两部分功能和流程的支持。我们可以看到按照IT服务的原理,服务提供的支持是建立在一个统一的数据库资源管理之上的。所以我们认为数据库的管理是IT服务管理的一项非常重要的核心重要。就是说首先我要了解管理的对象是什么,同时管理的过程中我对整个设备系统和应用它所在的物理位置、值班工程师、实时的运行状况,以及未来的总量规划进行一个统一的管理。这个角度来看你的网络设备、系统、和应用从IT管理的角度来讲是没有什么区别的。我所看的指标和管理的方式和进行运维的方式是没有什么区别的,尽管略有不同,我们不能因为现在市场上这些厂商,因为他们把网管平台,系统监控平台、应用平台分开。事实上把这三块分开考虑这样的做法是不对的。一个网络设备你监控它的运行状况和功能,我要对网络设备进行一个补,同样你对于数据库服务器内容是简单的存储的操作。我对应用是简单的交易操作,它只是进行监控的方式略有所不同。但是这些对于管理来讲应该是完全相同的。所以我的SLA也好,运营流程也好,它的对象应该说要把这三者集成来考虑。
仔细看一下思科的EMAN它本身也是一个平台,这上面的这些功能是在10年的时间逐步发展和完善过来的。里面平台的功能,平台里面对这些流程的支持,我们平均下来大概是每隔一个季度要对流程中不合理的情况进行一些改进和优化。EMAN的部署也非常简单,左边这个图是EMAN部署的标准基架图。你所要做的每当有一个新的办公地点或者网络成生的时候你只是把EMAN的标准基架操到网上去,对新增的网络设备系统和应用进行配置管理。一旦入网之后所有的运行监控完全由网络控制。现在有一些厂商也推荐把IT资产管理的数据库放在这个平台下面,我们觉得这个做法是值得商榷的。首先数据库的一些变更和历史信息是必须要动态的,现在一些厂商提供的服务平台下面的所谓的进行IT资产管理这样的数据库基本上是一锤子买卖,我进来的时候填这个数据库的时候要对我的资产进行普查,之后的这些变更操作很大程度上依靠人工完成。所以这样根本上讲对于IT运营维护师解决实时发生的系统的故障确切讲它的作用是非常有限的。
我们再看一下EMAN上我们提供的一些工具。基本的刚才提到了你的设备和系统应用入网的时候我要通过假设分析确定故障和服务级别这个是最重要的。所以IT服务管理平台和网管平台最大的区别,是网管平台看到的界面事实上是发生器,是在系统上不断的发生了一些实践。而思科IT资源管理平台上你看到的整个全网的IT的资源。你进去之后才能看到跟它相关的实时的数据。现在网管系统只是完成IT运行中实时监控管理的测量的这一部分功能。所以我们建议不能把网管平台和IT服务管理平台等同起来。
下面的这些东西是跟IT的服务提供相关的。像最终用户提供了这样一些功能以及流程的实现。大家可以看到思科的流程P一级的问题我们的解决时间是两个小时。我们相关的这样一些管理机制,集中的IT组织和经费管理,以及分级制度相关的人员配置和财务的规划下面看一下。思科整个服务平台的发展演变经历了10年的时间,按照自己的需求开发自己的IT资源管理平台的好处是什么呢?好处就是在我的流程建设过程中,我可以随时把不合理的东西加以改进和优化。
举一个例子,思科2000年之前进行变更的管理之前要设置方案,你要看变更管理是不是在可允许的变更管理时间段之内。在此之上要根据它所对应的级别进行层层审批。后来发现这个很大程度上拴住了工程师的后退。所以我们一个是把平台分开,P3以下的问题由技术支持中心负责。再有IT指挥中心这些人员专注于负责流程的执行,这样使得我们的值班工程师可以把全部精力花在对这个问题的处理上。与之相关的所有的流程的管理、审批等等这些功能是由我们的一线支持。也就是说IT运行指挥中心的人员负责。
IT典型的差距分析这一块因为时间的关系,不讲了。这个是我们按照过么IT学院的管理成熟度上标准制定的模型。我们思科认为大概是第四级,第四级和第五级的差距就是流程的优化可以更迅速的在IT管理资源上实现。现在发现一些问题,在下一个季度中加以处理。我们对国内客户进行IT成熟度进行评估的时候主要采取一个是标准高可靠性的网络架构和部署;统一的服务级协议和基于服务级协议的王运维管理流程;集中的网络资源配制和图一的资源管理。后面的一些是我们对国内的一些总结,时间关系这里不讲了。会后材料可以供大家进一步参考。
我们觉得IT服务管理,我们建议分为五步走。第一步通过网络基线定义和假设分析,建立IT服务管理系统。第二把IT地址作为一项资源管理。第三,SLA的设备、集成可用性报表。第四,统一的IT资源数据库的实现。第五,统一的IT服务管理的平台建设。你的SLA和你的运维知识管理平台不是单独在网管平台上实现的。
我们建议客户在搭建你的IT服务管理平台和流程建设之前要把大量的时间应该是花在我们称之为网络的基线近来这件事情,上确定你的SLA到底是怎么样的。
思科的IT生命周期服务;在每一步过程中,从思科来讲我们也尽量提供完整的服务。现在我们觉得思科IT服务管理的建立还是属于前三块,实施中有一些问题,我们刚才也提到了一些相对比较尖锐的观点,就是考虑IT服务管理的资源过程中应该把你的资源结合起来考虑。最重要的是不要把服务平台、网管平台跟你的IT管理相混淆这是最重要的。
因为时间的关系,今天就跟大家交流这些。
- 信息系统运维预算定额参考标准研究[04-09]
- 第2章 跨文化管理理论和实践[01-14]
- 16:什么是关键成功因素法(CSF)?[06-09]
- 24:eSCM-SP(服务提供商外包能力模型)有哪些…[06-10]
- 第4章 跨文化沟通[01-14]
- 治理评论第一期[01-20]
- 治理评论第二期[01-20]
- 治理评论第五期[01-20]
- 治理评论第三期[01-20]
- 治理评论第六期[01-20]
- 治理评论第四期[01-20]
- 太极凭什么中标12306? [09-26]
- 中国国际航空股份有限公司--书评[11-01]