工具
您所在的位置:  首页 > ITSS> 工具

ITSS工具

发布时间:2018-08-15 17:20:48

一、IT 运维服务工具概述

顾名思义,IT 运维服务工具主要是为广大 IT 信息环境的使用、维护者们提供的一组专门用于简化、优化运维工作的工具,以帮助我们提高运维管理的效率,进而提高运维管理的水平,它可以是软件产品,也可以是硬件产品。

运维服务工具产品划分为两个大类:核心业务工具和关键支撑工具, 其中,核心业务工具又可分为三个管理域:资源管理域、服务管理域、用户管理域。

如图 1 所示:

 ITSS工具1.jpg

 图 1   IT 运维服务工具产品整体框架图

 

 

二、核心业务工具介绍

 

从之前的 IT 运维服务工具产品整体框架图可以看出,核心业务工具主要涵盖了三个方面:资源管理、服务管理、用户管理,下面就从这三个方面逐一进行介绍。

2.1.资源管理域

资源管理域主要是对组成 IT 信息环境的各类基础资源对象进行管理,管理范围涵盖网络、系统、业务、应用等。

资源管理域的管理对象主要有硬件资源管理、通用软件资源管理、应用资源管理。管理手段通常采用自动化监控工具来进行,监控工具目前基本分为两部分:一部分为传统的 IT 资源管理工具,另一部分为云化 IT 资源管理工具。

2.1.1.硬件资源管理

l  服务器设备

实现对服务器设备相关性能进行有效监控,及时发现故障。监控的范围包括服务器本身工作状态及其部件的工作状态和性能指标,如 CPU、磁盘、内存、网卡、硬件状况(如物理硬盘、物理内存、电源、风扇、温度)等。

l  网络设备

实现对信息系统内部及与外部系统连接的设施、网络状态进行有效监控,保持正常运行。网络设备包括路由器、交换机、防火墙和负载均衡设备等。

l  链路管理

网络链路作为连接网络中各硬件设备端口之间的物理通道,通过监控链路的状态, 能使管理员很清楚的掌握整个网络的流量分布和负荷情况。链路所处的网络可能包括局域网、城域网、广域网及 VPN 专用网。

链路监控的指标一般包括进出流量、丢包率、错包率,最小、峰值和平均带宽等。

l  智能终端

智能终端通常是指有独立数据分析和处理能力的终端设备,一般包括移动设备(手机、Pad、终端),智能摄像头,甚至智能家居设备。这些终端设备一般都提供了可供管理的接口或协议,通过这些协议和接口,监控系统可以将智能终端作为监控对象列入管理。

l  桌面设备

实现对常见的桌面设备的状态、性能等信息的监控,并对桌面设备的软件分发、补丁管理、资产管理、应用程序管理和远程控制等运行情况进行有效监控,桌面设备包括打印机、扫描仪、IP 电话等。

监控指标通常包括:进程监控、外设监控、日志审计等。

l  存储设备

实现对各类存储设备进行监测,包括有存储设备的磁盘使用情况、操作情况、作业情况、通道卡和 CACHE 等相关资源的监测,全面掌握存储设备的性能和工作状态信息。

监控指标通常包括:文件系统监控、性能监控、容量监控、负载监控、状态监控等。

2.1.2.通用软件资源管理

l  操作系统

实现对主机及服务器搭载的操作系统进行有效监控,及时发现操作系统性能问题。操作系统监控通常包括 WINDOWS 系统、UNIX 系统、LINUX 系统、AIX、Solaris、麒麟操作系统等;支持对系统 CPU、内存、磁盘、网络接口流量、系统关键进程、系统状态等进行监控。

l  中间件

中间件是一类连接软件组件和应用的计算机软件,它包括一组服务。以便于运行在一台或多台机器上的多个软件通过网络进行交互。该技术所提供的互操作性,推动了一致分布式体系架构的演进,该架构通常用于支持并简化那些复杂的分布式应用程序,它包括 web 服务器、事务监控器消息队列软件等。

监控系统需要实现对各类中间件的性能、状态和故障进行监控,通常包括东方通中间件、神州数码 ESB、WebSphere、Weblogic、TOMCAT、JBOSS、IBM MQ、Tuxedo、

Apache、Resin 等。

l  数据库

数据库作为 IT 业务的核心组件之一,是监控管理中需要密切关注的对象,数据库目前主要分为关系型和非关系型数据库(NOSQL)。关系型数据库主要包括达梦数据库、

Oracle、Sysbase、SQL Server、Mysql、DB2 等;非关系型数据库包括 MongoDB、Oracle BDB、Cassandra、HBase 等。

监控系统需实现对各类数据库的性能、状态、进程数等主要指标进行有效监控。

2.1.3.应用资源管理

实现对 IT 环境内的各种应用服务的性能、状态等信息进行有效监控,应用服务包括 IIS、Web、FTP、标准邮件服务、DNS 服务等。

2.2.服务管理域

在对组成 IT 信息环境的基础资源进行监控管理之后,为了将运维管理工作做精、做好,通常都会考虑进行服务管理工作,服务管理主要包括运营支撑管理和业务应用管理。

服务管理域主要分为运营支撑管理和业务与应用管理两大类工具,其中运营支撑管理工具可细分为过程管理工具、资产管理工具、配置管理工具、服务报告与 BI 工具、服务能力管理工具、服务自动化工具。

2.2.1.运营支撑管理类工具

运营支撑管理工具主要包括六个部分:过程管理工具、配置管理工具、资产管理工具、服务报告与 BI 工具、服务能力管理工具、服务自动化工具。

2.2.1.1.过程管理工具

IT 服务过程管理(简称过程管理)实现了从技术管理到服务过程的流程化管理, 解决了传统 IT 管理以技术管理为中心的问题。过程管理以“流程”为主线,以标准化为框架,以管理为核心,有机结合了流程、人员和技术三要素,为组织的业务战略落地提供了强有力的 IT 保障。IT 服务过程管理由服务支撑和服务交付两大子系统组成。

其中,为了确保 IT 部门的服务质量,符合 IT 服务级别协议(SLA)的要求,确保用户获得适当的服务,以支持组织的业务功能,服务支撑管理提供了面向最终用户的服务台及 IT 服务运营层次的流程,即事件(故障)管理、问题管理、配置管理、变更管理和发布管理等常用功能。

2.2.1.2.配置管理工具

配置管理是 IT 服务管理的核心和基础,确保所有 IT 设备/系统及其配置信息得到有效完整的记录和维护,包括各 IT 设备/系统之间的物理和逻辑关系,从而为实现有效服务管理奠定基础,能够帮助员工可迅速正确判断故障,找出有效解决方案,从而确保系统的可用性。提供一个统一的流程来管理 IT 生产环境中的所有组成部份,以确保:

l  所有配置元素被识别和记录下来。

l  配置元素的当前和历史状态得到汇报。

l  配置元素记录的完整性得到维护和确认。

l  提高 IT 环境的稳定性。

2.2.1.3.资产管理工具

在配置管理的基础上,依据财务管理制度约定,为配置项增加资产属性和管理信息, 将组织中的个人计算机(软件/硬件)、各种信息产品、工具和备品、租借品等 IT 资产的信息通过数据库进行一体化管理。

通过将 IT 资产信息与人、物、财、场地等资源的结合,实现资产在 IT 运维管理过程中生命周期管理,从而与组织机构中资产管理系统形成信息对接,使得高效率的资产管理和企业运营得以实现。

2.2.1.4.服务报告与 BI 工具

服务报告与 BI 工具主要是通过对已经收集到的历史记录进行分析和挖掘,进而得出一些对 IT 运维管理工作有益的报告和报表。

2.2.2.业务与应用管理类工具

业务与应用管理类工具主要是通过对业务或应用的实时状态及历史趋势进行监测和分析,通过提醒、告警、报表等方式,帮助 IT 运维人员提高对业务和应用服务水平。

2.2.2.1.客户管理工具

客户管理工具目前主要有业务关系管理工具,使用此类工具地目的主要是为了更好地了解客户需求,并对客户提出的需求和不满给予及时的跟踪反馈,更好的提供交付服务,保障服务的整体质量。

2.2.2.2.业务关系管理

 业务管理管理流程是为了更好的了解客户需求,对客户提出的需求和不满给予及时的跟踪反馈,更好的提供交付服务,保障服务的整体质量。

业务关系管理的目的是有效管理用户对 IT 服务的期望,了解服务需求,提升服务水平,不断提高用户满意度。

2.3.关键支撑工具

 关键支撑工具在本名录中主要列举了常见的几种运维服务关键支撑工具,例如:知识管理工具、安全管理工具、数据管理工具、采集管理工具等。这些工具的使用贯穿了各个管理域的活动当中,不是一个孤立的管理活动,所以我们在这把他们另列出来。

2.3.1.知识管理工具

通过汇集各种知识来源,并经过分类加工和审核控制,最终将知识收录到知识库中并发布,并反馈给运维人员学习使用,达到知识共享目的,提供运维工作效率,降低运维技术难度。

对 IT 运维工作中运维案例、经验总结、技术文档、工作规范和制度流程等知识进行收集管理,为 IT 运维工作提供技术和管理方面的知识支撑。

2.3.2.安全管理工具

 在运维工作过程中如何快速安全的接入企业内部 IT 业务系统而不用担心数据安全、信息安全的问题。如何集中安全认证授权运维人员账号,并审计运维人员的操作,是系统设计者和运维人员共同关注的问题。IT 运维管理系统的设计和实现主要的目的提高服务质量,在有限资源的情况下能最大化的实现信息安全和 IT 运营绩效,首先要建立一套完善的信息安全管理体系,并以这个体系为基础构建出一个安全、高效 IT 运维支撑平台。

2.3.3.数据管理工具

在运维的工作当中,数据管理工具最直接的表现就是通过数据分析辅助决策支撑, 决策分析数据包括:

1)        质量数据;

2)        合规性数据;

3)        运营水平数据;

4)        运营要素数据。

基于这些数据分析,决策管理提供了服务运营规划、服务质量管理、服务审计管理、服务运营分析的闭环管理逻辑。其中服务质量数据与合规性数据来自于服务对象的各类状态管理系统(如 IT 资源管理系统)、服务主体的服务流程、工单与记录管理系统(如

ITSM 服务管理系统),以及服务相关方的主观评定。运营水平数据包括:

1)        服务满意度数据;

2)        服务运营成本数据;

3)        服务运营效率数据;

4)        服务运营能力数据;

5)        服务运营风险数据。

运营要素数据包括:

1)        人员要素分析数据;

2)        过程要素分析数据;

3)        技术要素分析数据;

4)        资源要素分析数据。

决策管理框架如图图 1   决策管理框架所示。

 ITSS工具2.jpg

图 1   决策管理框架图

在此管理框架下,运营规划往往并没有通过管理工具推进工作,所以决策管理相关工具至少包括:

1)        服务质量评价管理工具;

2)        服务审计管理工具;

3)        服务运营分析管理工具。

基于市场情况,目前通用型的决策管理工具市场可见服务质量评价管理工具和服务审计管理工具;服务运营分析管理工具更多的是基于数据分析工具,根据用户实际业务情况进行较大量二次开发形成,往往不具有通用性。本名录在决策管理工具领域重点介绍前两类工具。

2.3.3.1.服务质量评价管理工具

 服务质量评价管理类工具在某些行业也被称为指标管理平台。这类工具通常都会依据某类质量标准,对相关质量指标进行分析,形成决策管理的依据。在信息技术服务领域可以依据的标准通常为ISO 9001、《信息技术服务 质量评价指标体系》,以及各个行业或企业的自有标准。这其中,《信息技术服务 质量评价指标体系》是国家 ITSS 组织牵头制定的信息技术服务质量管理标准,并以此为基础在国际上形成了 ISO/IEC 25011 草案,特别适合作为信息技术服务质量管理的标准依据。

服务质量管理类工具通常的功能技术架构包括如下几个方面:

l  质量数据的采集管理,通常质量相关的原始数据会来自于信息技术系统的监控管理平台和服务过程管理平台,采集管理会提供与监控管理平台、服务过程管理平台之间的数据接口,以保证获取到准确的客观性质量管理数据,同时采集管理还会提供主观性数据的获取通路;

l  质量数据的处理服务,从采集管理获得的原始质量数据在这个功能模块中被处理,通常提供一些处理策略的管理能力,由确定的策略对原始数据进行提取,获得对决策有价值的信息;

l  服务质量的评价服务,将数据处理服务形成的质量相关信息以某种恰当的方式呈现出来,完成对于服务商或服务产品的质量评价,为决策管理提供支撑。

2.3.3.2.服务审计管理工具

服务审计管理类工具用于记录服务人员的操作行为,并对其违规操作进行告警和报表分析。这类工具通常会与身份认证、授权系统集成在一起,确保所有的服务操作都能够被审计系统记录下来,所有的服务操作都有明确的责任人和责任时间记录。这些操作记录根据审计管理的目标可以在操作时被控制,也可以在操作后被审计。

服务审计管理类工具可以被分为两类:

1)   完全的事后审计工具,这类工具通常仅仅是一套管理信息系统,系统内嵌审计指标集和审计规则,通过人工填写指标值、审计人员抽检等方式完成审计工作。这类工具的特点是适用范围广,几乎能够应对任何类型的审计工作。

2)   具有阻断违规操作能力的审计工具,这类工具本身带有技术支撑和监控能力, 同样内嵌审计指标集和审计规则集,同时服务人员对信息技术系统的所有操作均通过这种工具提供的技术手段完成,通过统一认证、授权和记录系统能够将所有的系统操作与自然人映射到一起,提供了不可抵赖性和具体到人的责任归属管理能力。这类工具的特点是通常与安全运维挂钩,但是能够通过一些简单的服务流程和报表管理为决策管理提供支撑性数据。

2.3.4.采集工具

采集工具通过各种采集方式(包括标准采集协议、仿真、日志收集等)、以一定的采集间隔从被管对象处获取原始数据,并经过分类、加工和审核控制,最终将数据存储起来,以供其他工具使用。

采集工具的主要管理目标就是从被管对象上获取基础管理数据,进行分类、存储之后供其他工具调用;其主要价值在于为其他工具提供数据处理、分析的基础,由此,采集工具能否提供准确、及时、充足的基础数据就成为评价其优劣的一个重要标准。