网管综述:IT基础结构与服务管理
2005-07-22    李长征、王东红   
打印自: 安恒公司
地址: HTTP://e3.anheng.com.cn/news/article.php?articleid=643
网管综述:IT基础结构与服务管理

IT服务管理的通用标准:ITIL(IT基础架构库,Information Technology Infrastructure Library)

相关资料、书籍:ITIL是世界IT服务管理领域公认的最佳实践,主要指与ITIL的6个模块相对应的7本书。《IT服务管理:概念、理解与实施》为目前IT服务管理领域唯一的中文图书。

发布者
80年代中期,英国政府部门发现提供给其的IT服务质量不佳,于是要求当时的政府计算机和电信局(CCTA)(后来并入英国政府商务部(OGC)) ,启动一个项目对此进行调查,并开发一套有效的可进行财务计量的IT资源使用方法以供本国的政府部门和私有部门使用。这个项目的最终成果是一套公开出版的IT管理指南,即ITIL(Information Technology Infrastructure Library),由于OGC颁布了ITIL的第一个版本,所以一直拥有ITIL的商标。

准则或指南发布的目标
ITIL的目的是提供一套独立于厂商并且可适用于不同规模、不同技术和业务需求的有效的 IT服务管理方法。通称为IT服务管理的最佳实践。

企业实施指南的业务需求
  * 确定IT组织内的服务流程
  * IT服务质量的定义与提高
  * 以客户为中心提高IT服务
  * 服务台功能的实施

相关的非遵从风险(Risks of Noncompliance)
可能导致支持流程的错误。

目标读者
组织中负责IT服务管理及对ITIL感兴趣的人员。

时效性
OGC仍然不断地对ITIL进行更新和补充。业务视角(Business Perspective volume)正在进行开发。

认证
  目前,ITIL只有针对个人的认证而没有针对组织的认证。BSI 15000服务管理标准由英国标准协会(BSI)开发,是目前世界上第一个针对IT服务管理的国家标准。它提出了一系列相对独立又彼此相互关联的服务管理所需要的管理流程。这些流程很大程度上是在ITIL的基础上开发而来的。BSI 15000预计将在2006年成为ISO国际标准,到2008年的时候,大部分组织将会寻求这个标准认证。
  ITIL针对个人的认证有如下三个级别:
  * IIIL基础认证:全称为“IT服务管理基础认证”(ITIL Foundation Certification),是对IIIL入门者的核心基础认证。要求接受3天有关ITIL核心流程的培训,通过多项选择题的考试;基本理解IT服务支持、服务提供的十大流程和一个Service Desk功能及相互关系;适用于实施IT组织的主管或相当级别人员参加。
  * IIIL实践者认证:全称为"IT服务管理实践者认证"(ITIL Practitioner Certification),是对ITIL实施者的专业技术认证。要求接受3天培训,完成课程作业和通过考试;深入理解ITIL的流程,学会设计和执行流程;适用于专注特定流程人员参加。目前分为九种,分别是事故管理和服务台、问题管理、变更管理、配置管理、服务级别管理、可用性管理、能力管理、财务管理和安全管理。
  * IIIL管理者认证:全称为"IT服务管理管理者认证"(ITIL Manager),是对ITIL管理者的经营管理认证。要求参加10天培训,并通过2次各3小时的笔试与面试;深入理解IT服务支持、让渡的十大流程和一个Service Desk功能,并且掌握ITIL的实施;适合负责实施、或管理组织ITSM职能的高级职员参加。

 

通用性
ITIL虽然被广泛使用,但只有英文版。

关注领域
企业的信息及信息系统的战术和运营层面。

载体
ITIL有文档和CD-ROM两个版本。

指南及其内容叙述
  如前面所提到的,ITIL包含了IT服务管理领域的最佳实践,列出了IT服务管理流程的“最佳”的目标、活动、输入和输出以及各个流程之间的关系,然而,ITIL并没有描述做什么,而是关注如何做及谁来做。
  有效的IT流程的主要任务是:
  * 已有系统的运营与维护
  * 新系统的开发
  * 调整服务提供流程来促进核心业务持续发展
  ITIL的两个特征:
  整体的服务管理——IT服务管理层
    * 确保运营和维护的需求考虑
    * 开发测试计划
    * 确认由于新系统建设或修改系统给原系统基础架构带来的影响
    * 对未来需求的分析
  以客户为导向——给客户提供高质量、低成本的IT服务。为了确保服务质量,须进行责任分配,他们
    * 向用户请教并帮助他们使用优质的服务
    * 收集并分析用户的观点和建议
    * 对用户不满意的地方进行跟踪
    * 监控用户对的服务的评价
    * 支持内部用户

ITIL的内容框架


  IT服务管理实施规划(Planning to Implement Service Management)讨论了规划和实施IT服务管理的关键性问题,并对实施和提升IT服务提供了全面的指导。

  ICT基础架构管理(ICT Infrastructure Management)覆盖了网络服务管理、运营管理、本地处理器的管理、计算机系统安装与验收、系统管理等方面,目标是确保提供一个稳定可靠的IT基础架构,以支撑业务运营。

  应用管理(Application Management)讨论了使用基于生命周期的方法开发软件,及在明确的需求分析的基础上进行设计与变更。

  安全管理(Security Management)目标是保护IT基础架构,对其采取合适的保护措施,使其免受未经授权的使用。

  商业远景(Business Perspective)用于帮助业务管理者深入了解ICT基础架构支持业务流程的能力与IT服务管理在提供端到端IT服务过程中的作用,其涵盖了业务管理系统、外包管理、持续改进及信息和通讯技术等方面,来实现商业利益。
  IT 服务管理的核心内容包含在服务提供与服务支持两本ITIL文档中。
  服务支持流程和功能台的基本内容:
  * 服务台
  * 事故管理
  * 事故管理
  * 问题管理
  * 配置管理
  * 变更管理
  * 发布管理
  服务提供流程的基本内容:
  * 服务级别管理
  * IT服务的财务管理
  * 能力管理
  * IT服务的持续性管理
  * 可用性管理

服务提供与服务支持包括的流程和功能台如下:
服务台(Service Desk)
  描述——服务台,即通常所指的帮助台和呼叫中心,是一种服务职能而不是管理流程。在IT服务管理中,服务台起着纽带的作用。对服务提供方而言,服务台是“过滤器”和“扩音器”,它可以处理很多客户的询问和请求,节约了资源,并及时向客户和用户传递有关服务的各种情况;对客户和用户而言,服务台是“寻呼机”和“导航器”,在碰到任何问题或疑问时,只需通知和联系服务台,然后再由服务台指导和协调下一步的处理工作。
  目标——为用户提供单一的联系点;为实现业务目标提供高质量的支持服务;降低提供和使用IT服务的总体成本;提高了用户的满意度;协助发现商业机会;优化了支持服务的投资和管理;为业务、流程和技术的全面变革提供支持。
  主要任务
  * 接受客户请求(可以通过电话、电子邮件和传真等);
  * 记录并跟踪事故和客户意见;
  * 及时通知客户其请求的当前状况和最新进展;
  * 根据服务级别协议,初步评估客户请求,尽力解决它们或将其安排给有关人员解决;
  * 根据服务级别协议的要求,监督规章制度的执行情况并在必要时对其进行修改;
  * 对客户请求从提出直至终止和验证的整个过程进行管理;
  * 在需要短期内调整服务级别时及时与客户沟通;
  * 协调二线支持人员和第三方支持小组;
  * 提供管理方面的信息和建议以改进服务品质;
  * 根据用户的反馈发现IT服务运作中产生的问题;
  * 发现客户培训和教育方面的需求;
  * 终止事故并与客户一道确认事故的解决情况。

事故管理(Incident Management)
  描述——尽管现在的系统已经越来越面向用户,对用户更加友好,最终用户依然需要明确定义一种联系方式对发生的事故进行管理。事故管理最主要关注的是服务级别快速稳定地恢复。事故(Incident)是任何不符合标准操作且已经引起或可能引起服务中断和服务质量下降的事件。
  目标——在尽可能小地影响组织及用户业务的情况下使IT系统尽快恢复到服务级别协议所定义的服务级别,以确保最好的服务质量和可用性级别。
  主要任务
  * 及时识别并跟踪发生的事故
  * 对事故进行分类并提供初步支持
  * 对事故进行调查与分析识别引发事故的潜在原因
  * 解决事故并恢复服务
  * 跟踪和监督所有事故的解决过程,并随时进行沟通

问题管理(Problem Management)
  描述——指负责解决IT服务运营过程中遇到的所有问题的流程。结构化、系统化的问题管理方法能够迅速查明事故发生的潜在原因并找到解决此事故的方法或防止其再次发生的措施。因此,健全的问题管理关注预防性措施和引发事故的潜在因素的识别。
  目标——寻找发生问题的根本原因,根据优先级定义首先解决关键性问题,并防止与这些事故相关的事故再次发生,增加支持人员解决问题的能力。
  主要任务
  * 识别和记录问题
  * 对问题归类,主要关注影响业务的问题
  * 调查问题的根本原因
  * 解决问题
  * 终止问题

配置管理(Configuration Management)
  描述——配置管理是识别和确认系统的配置项,记录和报告配置状态和变更请求、检验配置项的正确性和完整性等活动构成的过程。应用系统的服务级别主要依靠内部结构。严格的配置管理对于应用系统的全部潜在完成是必须的,它还能为有效的规划和监控资源提供必要的信息。
  目标——配置管理有多层目标:
  * 计量组织和服务中所使用的所有IT资产和配置项的价值
  * 核实有关IT基础架构的配置记录的正确性并纠正发现的错误
  * 提供准确的配置信息和相关文档以支持其它服务管理流程(事故管理、问题管理、变更管理和发布管理)
  主要任务
  * 识别相关信息的需求 (健全的配置管理的目的、范围、目标、策略和程序)
  * 与配置项所有者一起识别和标识配置项,有效的文档、版本及相互关系
  * 在中心配置管理数据库中记录配置项
  * 建立程序和文档标准以确保只有被授权及可辨别的配置项被记录和可追溯的历史记录是有效的
  * 确保数据的永久状态(配置状况报告)
  * 对CDMB中记录的配置项进行审验

变更管理(Change Management)
  描述——随着信息技术的快速发展和企业竞争的加剧,为核心业务提供的服务可能受到中断的影响。可靠的变更管理就是对在最短的时间内完成基础架构的任一部分或服务的任一方面的变更进行规划和监督的过程,旨在将对原有系统、新建系统、基础架构和服务产生的风险减少到最低程度。
  目标——确保在变更实施的过程中使用标准的方法和步骤,从而以最快的速度实施变更,将由变更所导致的业务中断的影响减少到最低。
  主要任务
  * 记录和筛选变更请求(RFC)
  * 对RFC进行分类并划分优先级
  * 评价RFC对基础架构和其他服务的影响,及非IT流程与不实施RFC的影响
  * 实施RFC所需要的资源
  * 获得实施RFC的正式批准
  * 变更进度安排
  * 实施RFC
  * 评审RFC的实施

发布管理(Release Management)
  描述——由于操作系统的异构、地址位置的不同以及实施发布管理的补丁频繁发布,只有经过测试和被授权的应用系统才能发布已经变的越来越重要了。发布管理是指对经测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。
  目标——确保只有正确的、被授权的和经过测试的系统组件(软件、硬件及相关文档)才能被正确、按时安装。
  主要任务
  * 制定发布计划
  * 设计发布测试及执行测试的程序以鉴定是否合格
  * 制定首次运行计划
  * 通知并培训可能的客户
  * 结束发布
  * 实施前后对组件进行审计
  * 安装及分发

服务级别管理(Service Level Management)
  描述——健全的服务级别管理是定义、协商、订约、检测和评审提供给客户的服务质量水准的流程。有关所提供的服务和这些服务的质量水准记录在服务级别协议中,服务级别协议规定了服务双方(用户和内、外部服务提供商)各自的责任、权利和义务,是IT服务成功运营的重要保障。
  目标——确保组织所需的IT服务质量按服务级别协议规定的质量提供,同时在成本范围内得以维持并持续提高
  主要任务
  * 记录服务级别需求(SLR)
  * 通过建立或更新服务质量计划(SQP)、与第三方服务商签订外包合同和运营级别协议(OLA)来确保按服务级别协议规定的质量提供
  * 签署服务级别协议(SLA)
  * 监控提供的服务水平
  * 提高服务质量、
  * 建立和维护服务目录

IT服务的财务管理(Financial Management for IT Services)
  描述——对费用及成本重新分配进行正确管理以提高财务资源的有效性
  目标——帮助IT部门在提供服务的同时加强成本效益核算,以合理利用IT资源、提高效益。
  主要任务
  * 预算编制
    确定成本中心
    计算标准成本
    与真正的成本价值、服务成本及成本分配相比较
  * 会计核算
    为记录会计账目设定成本核算表和程序
    汇总并分配实际成本
    汇总实际服务成本和成本再分配
    对收入与支出进行监控
  * 成本再分配
    为成本再分配确定程序
    建立价格列表
    准备发票

能力管理(Capacity Management)
  描述——指在成本和业务需求的双重约束下,通过配置合理的服务能力来确保服务的持续提供和IT资源的正确管理以发挥最大效能。健全的能力管理包括以下三个子流程:
  * 业务能力管理
  * 服务能力管理
  * 资源能力管理
  目标——确保以合理的成本及时地提供有效的IT服务以满足组织当前及将来的业务需求
  主要任务
  * 定义、规划及管理业务需求
  * 提供用于服务的资源
  * 监控资源的性能,如果必要,须进行调整
  * 规划和实施提升能力计划
  * 编制和维护能力计划

IT服务持续性管理(IT Service Continuity Management)
  描述——通过减少灾难或突发事件产生的负面影响来减少核心业务中断的时间
  目标——在灾难发生的情况下,确保服务运营所需的IT技术和服务实施能够在要求和约定的时间内恢复
  主要任务
  * 根据整个业务持续管理确定IT持续性计划的需求与战略
  * 确定IT服务的持续性计划
  * 管理持续性过程(培训、测试、评审、变更管理和持续提高过程)
  * 紧急情况下业务持续管理与恢复

可用性管理(Availability Management)
  描述——对系统的可用性进行持续监控与改进以减少业务中断的时间并提高服务的可用性
  目标——确保IT服务的设计符合业务所需的可用性级别
  主要任务
  * 可用性需求分析
  * 确定可用性预期目标
  * 确定测量方法
  * 编制可用性计划
  * 确定实际的可用性计划
  * IT服务可用性的改进


 

责任编辑: admin