当前位置:文档之家› 项目运维交接管理指导规范-V1.0

项目运维交接管理指导规范-V1.0

项目运维交接管理指导规范-V1.0
项目运维交接管理指导规范-V1.0

Confidential

拓维信息系统股份有限公司项目运维交接管理指导规范

2011.03

Written By TALKWEB

Talkweb 拓维信息系统股份有限公司?1996,2011

All Rights Reserved

目录

1. 文档说明 (4)

1.1. 文档目标 (4)

1.2. 适用范围 (4)

1.3. 术语 (4)

2. 一般规则 (5)

2.1. 交维通用流程 (5)

2.2. 交维启动应具备的条件 (6)

2.3. 交维资料的查验 (6)

2.4. 交维系统的查验 (6)

2.5. 软/硬件交维 (6)

2.6. 人员招聘及管理 (7)

2.7. 代码管理 (7)

3. 运维范围及要求 (7)

3.1. 设备管理 (7)

3.2. 应用管理 (7)

3.3. 业务管理 (7)

3.4. 桌面管理 (7)

3.5. 其它日常任务 (8)

4. 日常运维作业计划 (8)

4.1. 故障检查 (8)

4.2. 能力检查 (8)

4.3. 可用性检查 (9)

4.4. 业务数据检查 (9)

4.5. 安全检查 (9)

4.6. 配置检查 (10)

5. 资源配置 (10)

5.1. 一线运维角色 (10)

5.2. 人员配置 (12)

5.3. 设备及办公环境配置 (13)

5.4. 非驻地运维 (13)

6. 能力交接 (13)

6.1. 培训计划 (13)

6.2. 能力考核计划 (13)

7. 运维相关技术与工具 (13)

7.1. 自助服务 (14)

7.2. 监控工具 (14)

7.3. 诊断工具 (14)

7.4. 远程控制工具 (14)

7.5. 流程控制工具 (14)

7.6. 知识管理工具 (14)

7.7. 业务管理集成工具 (14)

8. 运维制度 (15)

8.1. 运维工作时间安排 (15)

8.2. 交接班安排 (15)

8.3. 办公网络设备管理制度 (15)

8.4. 机房硬件维护管理制度 (15)

8.5. 安全管理 (15)

8.6. 重要期间运维保障 (16)

8.7. 例行维护规定 (16)

9. 服务流程 (16)

9.1. 服务请求管理 (16)

9.2. 事件管理 (16)

9.3. 问题管理 (17)

9.4. 变更管理 (17)

9.5. 需求管理 (17)

9.6. 发布与部署管理 (17)

10. 交维输出文档 (18)

10.1. 项目知识文档 (18)

10.2. 实施与运维内部交接记录单 (19)

10.3. 服务合同 (19)

1.文档说明

1.1.文档目标

本文档作为指导实施与运维交接的参考规范,其目的是使项目从实施阶段到运维阶段能有一个平稳过渡,运维人员具有清晰地职责分工和任务分配,同时通过有效的监控措施以及标准的服务流程为系统稳定、可靠的运行提供强有力的保障。

1.2.适用范围

本文档适用于拓维项目实施和运维交接所涉及的部门。

1.3.术语

交维:是指项目从实施阶段过渡到运维阶段的交接过程,一般始于项目实施后期,运维人员开始进驻并参与了解项目信息,直到项目实施末期或运维前期实施团队完成能力以及相关资料交接,并且运维团队能够独立完成运维任务为止。

2.一般规则2.1.交维通用流程

2.2.交维启动应具备的条件

运维人员一般需要在系统实施的后期就进驻现场并开始熟悉系统,因此在项目开始启动阶段,实施团队就需要把握好运维人员进入实施团队的时间点,并制定相应计划。交维工作大部分情况下会在终验完成前就启动。交维启动必须具备以下条件之一:

1)系统已完成初验;

2)系统上线完成;

3)系统实施已全部或大部分完成,并且满足客户需求,预期距完成项目终

验时间基本符合运维人员培训交接周期;

4)运维人员已具备独立运维能力(如已有运维人员的情况);

2.3.交维资料的查验

实施人员需要提交的项目相关资料包括需求、设计、测试、部署、培训、运维手册等,具体请参考项目知识文档一节。

2.4.交维系统的查验

针对需要进入运维交接的系统,运维人员需要对其进行基本的核查、验收。根据查验标准,需要确认项目满足各项查验技术要求。查验细节,请参考对应项目的查验标准模板。其主要包括以下三方面内容:

●查验范围(主要包括软、硬件及其相关各类组件)

●查验指标(主要包括功能、性能以及配置项)

●查验方法(主要包括各项指标的具体查验方法)

2.5.软/硬件交维

实施方需要提供项目所涉及的软、硬件清单和详细配置说明,同时,需要指明各类设施的采购方、归属方、保管方、运维责任方等。

2.6.人员招聘及管理

目前运维人员招聘工作由实施方项目经理配合运维部要求进行代招,人员招聘时间点应该由实施方项目经理提出招聘申请,运维部进行确认。交维完成之前运维人员的管理由实施方负责,交维完成后由运维部统一负责。

2.7.代码管理

对于交维后的代码管理,请参照公司目前版本管理相关流程。

3.运维范围及要求

3.1.设备管理

项目是否涉及对网络设备、服务器、防火墙等各类硬件设备运行状况进行实时监控,并提供相应的维护管理。如是,需要提供详细的任务说明。

3.2.应用管理

项目是否涉及对各种应用软件如数据库、中间件、应用服务器等各种通用或特定服务的监控管理。如是,需要提供详细的任务说明。

3.3.业务管理

项目是否涉及业务系统运行情况的监控,业务系统更新、发布管理,以及业务数据管理、业务过程的操作(比如:生产计划、指挥调度)等。如是,需要提供详细的任务说明、流程、操作步骤等。

3.4.桌面管理

项目是否涉及提供企业内部桌面系统的管理和维护工作。如是,需要提供详细的任务说明、流程、操作步骤等。

3.5.其它日常任务

除以上管理内容以外,是否还有其他日常工作内容需要特别声明。比如: 用户需求收集、跟踪、反馈

配合售前、市场进行相关支持工作

客户回访

4.日常运维作业计划

日常运维作业计划是用以保证系统正常运行的重要措施,运维人员根据制定的作业计划周期性或持续执行日常运维作业。日常依据作业计划所执行的任务主要包括以下几类,项目需要根据需求确定相应的作业计划要求。

4.1.故障检查

作业计划工作中需要执行部分作业,来发现故障,例如:

●检查各个核心应用的主要功能;

●检查主机运行状况和日志;

●检查数据库运行状况和日志;

●检查中间件运行状况和日志;

●检查网络设备运行状况和日志;

●检查存储设备运行状况和日志;

●检查防病毒、入侵检测、防火墙、VPN运行状况和日志;

●检查应用软件运行状况和日志;

故障检查类的作业计划,在发现故障时会触发事件管理流程;

4.2.能力检查

作业计划工作中需要执行部分作业,对各类资源的处理能力的使用情况进行检查,例如:

●检查服务器cpu和内存占用情况;

●检查存储设备空间使用情况;

●检查网络带宽占用情况;

●检查网络设备端口占用情况;

●检查机房、机柜占用情况;

●检查软件许可权使用情况;

●检查业务的发展情况;

●检查数据的增长情况;

4.3.可用性检查

作业计划工作中需要执行部分作业,对可用性情况进行检查,例如:

●检查服务器性能超阀值情况;

●检查数据库性能超阀值情况;

●检查中间件性能超阀值情况;

●检查网络设备性能超阀值情况;

●检查存储设备性能超阀值情况;

●检查防病毒、入侵检测、防火墙、VPN性能超阀值情况;

●检查应用软件性能超阀值情况;

4.4.业务数据检查

对各种业务系统的数据进行稽核、比对。

4.5.安全检查

作业计划工作中需要执行部分作业,对IT环境安全性进行检查,例如:

●病毒库定期升级作业;

●对发现病毒日志进行分析;

●检查防火墙系统、入侵检测系统发现的安全事件;

●定期对用户的接入IT环境的权限进行审核;

安全检查是企业信息安全管理的一部分,也是信息安全落实到日常运维中的

一个具体举措。

4.6.配置检查

作业计划工作中需要执行部分作业,对配置进行核查,例如:

●定期审核配置项属性以及配置项之间的关系,以确保其与实际的物理环

境保持一致。配置审核活动需要对配置项信息与配置项物理存在性进行

双向验证。

配置核查与发现是配置管理的一部分,也是配置管理落实到日常运维中的一个具体举措。

5.资源配置

根据运维工作内容需要确定所需人员和设备。

5.1.一线运维角色

以下是针对目前运维项目中一线运维团队可能涉及到的各类角色进行说明,不同角色可能是由不同人担当,也可能多个角色由同一人担当,或角色不存在。

5.1.1.运维组长

负责运维团队人员及日常事务管理。及时处理各类故障,并将运维情况及时通报给相关主管人员,及时完成上级交派的各项运维任务。其主要职责如下:

●全面负责项目运维工作,并严格按照客户方及公司要求的标准的运维流

程进行运维工作;

●掌握必要的技术运维技能,满足日常运维工作的需求;

●建立标准的运维流程,方便公司对运维进行更好的管理;

●良好的学习能力,不断的提高自身技术、管理水平;

●每周、每月、每年对运维工作进行总结,及时上报主管领导;

●做好各类文档的制定和管理工作;

5.1.2.服务台

服务台在服务支持中扮演着一个极其重要的角色。服务台可以理解为服务流程的“前台”,它可以在不需要联系特定技术人员的情况下处理大量的客户请求。对用户而言,服务台是他们的唯一连接点,确保他们找到帮助其解决问题和请求的相关人员。

作为与用户联系的“前台”,服务台首先对来自用户的服务请求进行初步处理。当它预计无法在满足服务级别的前提下有效处理这些请求,或是这些请求本身就是它所无法解决的时候,它就将这部分请求转交给二线支持或三线支持来处理。这样可以有效地降低其他IT服务支持部门的负担,提高了IT服务运作的整体效率,降低了IT服务运作的成本。

服务台的主要任务不仅负责记录、处理事故、问题和客户的咨询,同时还为其它活动和流程提供接口。比如:客户变更请求。服务台日常主要职责如下: 响应用户呼叫。即对于用户发出的错误报告、服务请求、变更请求等事件进行记录和处理。这是服务台的最主要工作。

提供信息。服务台是为用户提供IT服务信息的主要来源,一般可以采用布告栏、Email、屏幕消息等方式为用户提供有关错误、故障或新增服务

等方面的信息。

客户需求管理和客户关系管理。服务台不仅仅是客户请求响应中心,同时也是客户关系管理中心。因此服务提供方应采取必要的措施和使用适

当的技术对服务台进行有效的管理,从而使服务台可以准确迅速地了解

客户的需求,改善客户体验,提高客户满意度。这些措施和技术包括结

构化询问技术、详细了解客户和跟踪客户、维护客户数据库和在客户中

推广服务台等。

供应商联络。在IT服务运作出现故障或因客户提出新的服务请求而需进行有关变更时,服务台通常需要负责与供应商进行联络以维修或替换有

关的软硬件组件。

日常运作管理。服务台承担的日常运作管理任务包括数据备份与恢复、磁盘空间管理、建立新用户、管理用户口令等。

基础架构监控。利用相关工具对IT基础架构的运作情况进行监控,一旦

检测到故障已经发生或即将发生,就应立即评估这种故障对关键设备可

能产生的影响,并在必要时将检测到的故障报告事故管理部门。

5.1.3.运维工程师

对业务运行情况进行不间断监控,及时处理各类突发事件,各类故障,并将运维情况及时通报给运维主管人员,及时完成上级交派的各项运维任务。其主要职责如下:

●全面负责运维工作,并严格按照公司的标准的运维流程进行运维和服务

器管理等工作;

●掌握必要的技术运维技能,满足日常运维工作的需求;

●良好的学习能力,不断的提高自身运维技术水平;

●每周、每月、每年对运维工作进行总结,上报主管领导;

5.2.人员配置

根据项目运维需要以及相应角色设置进行人员配置,主要包括四方面的人员:

●运维人员(一线支持)

●需求及实施接口人员(二线支持)

●运维专家(三线支持)

●第三方厂商(三线支持)

其中只有运维人员(一线支持)是项目日常主要维护人员,其它人员主要是根据项目运维需要可以及时寻求支持的人员(需要与对应人员进行责任、优先级、响应时间要求等方面的确认),需要提供对应的联系方式/渠道。

如二、三线支持人员出现调动,需由项目研发部及时安排空缺填补,并通知运维部对应项目的运维主管。如一线支持无法及时联系到对应的二线支持人员,由运维主管按照升级机制寻求二线支持人员的上一级主管安排资源。

5.3.设备及办公环境配置

根据项目运维需要进行办公设备及办公环境配置。

5.4.非驻地运维

如果项目运维人员不需要常驻客户方,将由运维部进行人员统一协调分配。

6.能力交接

为保证系统在运维阶段能够得到有效的运行、维护和更新,在项目由实施团队交由运维团队运维的过程中,实施团队需要根据项目运维需要进行有针对性的技能、知识的系统培训,完成系统能力交接,使运维团队成员掌握项目相关知识,并且能够胜任该项目的运维工作,达到能独立解决运维过程中所出现的各类系统相关问题。

6.1.培训计划

实施团队需要和运维团队一起协商制定能力交接的培训计划。

6.2.能力考核计划

为了确认运维团队成员是否真正足够掌握相关的运维知识和技能,需要制定对应能力考核计划。

7.运维相关技术与工具

为保证运维工作能准确、高效的执行,根据项目需要提供相应的技术、工具。比如监控工具、流程管理工具、自动化工具等。在提高效率的同时,减少由于手工误操作所带来的隐患。

7.1.自助服务

通过提供自助服务方便用户获取需要的信息,比如在网页上提供帮助菜单,用户可以通过帮助菜单查找所需要的信息、问题的原因、解决方案等。这样可以缩短用户解决问题的时间,同时也可以减少运维团队收到的咨询类请求的数量。

7.2.监控工具

通过提供各类监控工具,使运维团队可以方便、及时、准确掌握系统的运行现状。提高效率的同时,还可以减少由于手工误操作带来的隐患。

7.3.诊断工具

自动诊断分析工具可以帮助运维人员迅速定位、分析问题症结所在,缩短人为调查、分析时间,从而达到使系统能够尽快恢复正常。

7.4.远程控制工具

远程控制可以帮助运维人员控制、访问远端机器,以便他们进行问题诊断,配置修改等等。

7.5.流程控制工具

针对运维管理过程中所涉及到的一些管理流程,如果通过电子化的流程工具(比如基于工作流的服务管理流程工具)将促进这些流程的实现。

7.6.知识管理工具

通过有效的知识管理工具来实现运维知识、经验的记录和共享。比如:wiki 7.7.业务管理集成工具

通过提供(与)业务管理工具集成,从而实现对业务系统、数据有效管理。

8.运维制度

为保证运维工作的有效执行,需要制定对应的运维管理制度,其主要包括以下几个方面,需要根据项目的实际需要进行制定。

8.1.运维工作时间安排

工作时间分为日常上班时间(包括轮班)和节假日上班时间安排,需要根据项目实际需要进行安排。

注:如客户方有特别工作时间安排,以服从客户方安排为主,并告知直接主管人员,以进行合理的资源调配。

8.2.交接班安排

为了防止出现交接班时遗留的故障处理不及时等情况,建立交接班遗留问题处理机制,可以通过交接班遗留问题表实现问题的有效交接。

8.3.办公网络设备管理制度

运维人员所使用的办公网络设备如由客户方提供,应严格遵守客户方对于办公网络设备的管理制度。如由公司(拓维)提供,应严格遵守公司相关规定。

8.4.机房硬件维护管理制度

严格遵守客户方的机房环境及硬件维护管理制度。

8.5.安全管理

根据项目需要,确定安全需求、制定安全政策和策略,主要是从政策、策略和方法的角度阐述如何进行安全管理。

8.6.重要期间运维保障

为保证特定重要期间系统的稳定运行,需要制定特定运维保障。

8.7.例行维护规定

为了保障系统稳定运行,以及满足系统新需求的上线,有时需要进行例行维护(比如:停机、数据整理)。为保证例行维护的正确执行,减少错误发生几率,因此,需要根据项目实际需要制定相应的维护规定。

9.服务流程

在项目的运维过程中,为实现运维人员对于咨询、请求、故障处理、变更、发布等工作执行规范化操作,需要根据项目实际协商制定相应的服务处理流程。其主要包括,但不限于以下流程。完整的运维流程说明可以参考运维流程指导规范。

9.1.服务请求管理

服务请求流程是对来自用户的低风险、低成本的例行请求进行处理的流程,包括服务请求记录、审批、执行、关闭等环节。服务请求如:信息咨询、建议、非系统类投诉、重置密码、桌面服务请求等等。

9.2.事件管理

事件管理流程是指对IT生产环境中导致IT服务的非计划性中断或IT服务质量下降,以及对IT服务已造成影响或潜在影响的事件进行管理。其目标是尽可能快地恢复正常的服务运营,最小化对业务运营的负面影响,确保达到尽量好的服务质量和可用性水平。因此,事件管理重在以恢复服务为首要目的,可能因为暂时无法在容许的时间范围内查明事件根本原因并解决,而采取临时解决方案。事件的来源包括IT用户或IT客户报告的事件、监控系统自动发现/转发的事件,

以及运维人员发现的事件等。

9.3.问题管理

问题管理流程是确定某一事件或具有相同症状的一组事件的根本原因,制定和实施解决方案,从而防止事件再次发生的管理流程。

9.4.变更管理

变更管理负责业务需求单、系统变更单的具体实施落实,包括变更方案、进度计划的制定、变更的审批、实施方案制定及审批、变更执行、验证测试等工作,其中功能开发类变更和系统维护类变更通过发布与部署管理完成变更到实际生产环境的部署。通过对系统变更的控制,降低变更实施风险,提高系统稳定性。

典型的变更如新功能开发、软件版本升级、硬件扩容、系统核心参数修改等。

一个业务需求单可能对应多个系统的变更单。

9.5.需求管理

需求管理流程是对需求提出人提出的需求进行记录、分析、审批、跟踪、变更控制,对需求实施结果进行评估的管理流程。

通过需求管理,保证业务需求清晰、可行,从而可以及时、准确地响应和支撑,并确保从需求提出到最终实现全过程是可跟踪、可追溯的。

同时,通过明确IT需求管理流程的角色职责、各活动之间的接口,缩短IT 需求处理历时,提高IT需求处理的及时率,规范IT需求的管理。

需求的实现过程是通过变更管理流程进行控制的。

9.6.发布与部署管理

发布与部署管理负责将通过测试验证后的变更按业务需要及技术要求、发布策略限制分批部署到生产环境,它包括发布包的设计与组建、发布包的测试、用户培训的组织、发布的业务准备、实际部署后的验证测试以及IT资源配置状态的更新等环节。

10.交维输出文档10.1.项目知识文档

10.2.实施与运维内部交接记录单

由实施部(交接人)与运维部(接收人)共同完成交接记录单,具体格式请参考模板《实施运维内部交接记录单》。

10.3.服务合同

由市场部、咨询策划部、项目管理部、实施部与运维部、以及客户方等责任相关人共同确认并签订运维服务合同。

项目运维管理办法

项目运维管理办法 一、目的 为了更好的服务与客户,加强对公司运维项目的统一管理,对项目维护活动、维护过程等相关事宜进行规范,特制定本管理办法。 二、适用范围 公司所有运行维护项目组及相关干系人。 三、职责 1、销售部:负责对服务合同进行管理,包括合同签订、合同范围及合同条款的管理; 2、技术部:负责对项目的实施、管理、监控等,负责调查客户满意度、向相关人员反馈问题、跟进问题处理情况; 3、商务:负责硬件采购及相关备件的管理。 四、运维服务对象与类型 1、运维服务对象 运维服务对象是运维服务的主体,按客户要求所提供的运维服务相关的信息技术资产。运维服务对象包括应用系统、软件平台、硬件平台、数据。 1)、应用系统; 指由相关信息技术基础实施组成的,完成用户特定业务功能的系统。 2)、软件平台: 指安装运行在计算机硬件中,构成应用系统的软件程序,如系统软件、支持性软件、应用软件等。软件平台包括:数据库软件、操作系统、系统运行平台。 3)、硬件系统: 硬件系统是指构成应用系统的硬件关联设备。

4)、数据:指应用系统支持业务运行过程中产生的数据和信息。 2、运维服务类型 根据合同的要求及相关工作目标、工作内容、交付结果将运维服务方式分为完善性维护、适应性维护和预防性维护三大类。 1)、完善性维护 针对平台业务系统原有的功能进行扩充性完善,使系统对新业务具有包容性支持,以满足客户需求,确保系统现有功能的最大发挥。 2)、适应性维护 当客户业务需求发生变化是,且供需双方对系统业务更改事宜协调确认后,运维项目组对软件系统进行业务调整,以适应用户生产的管理需要。 3)、预防性维护 定期丢业务系统进行例行巡检,挖掘并消除系统中各种影响系统高效运行的隐患,同时优化系统各方面性能,使系统高质量的运行。 五、项目维护过程 1、服务协调升级管理机制 1)、首问责任制 公司实现首问责任制,受理客户问题反馈的第一任,为首位责任人;首问责任人须将问题清晰纪录,并将问题转达至问题所属项目经理或该项目负责人。 2)、管理升级 a、系统运维实施项目经理负责制; b、当问题处理超出合同范围,项目尽力应当将问题反馈至上级或销售部,由销售部人员进行协调; c、当客户反馈的问题属于合同范围内,但超出项目经理范围时,项目经理应当第一时间反应给上级总监,由上级总监协调;

信息化软件运维管理办法

XXXXXXXXXX 有限公司 信息化软件运维管理制度 文件编号: 编制部门: 版本版次: 生效日期:2018--1 页数:页 审核:XXX编制/修订:

文件使用单位:XXXXXXXXX有限公司各中心、各子公司签批形式:■ 0A工作流□纸质 三、编制/修订记录: 1. 目的 为规范XXXXXXXX有限公司(以下简称公司)信息化系统的运行维护管理工作,确保信息系统的安全可靠运行,切实提高业务效率和服务质量,使信息系统更好服务于业务运营和管理,特制订本管理办法。 2. 适用范围 本管理办法适用于公司及控股公司的信息系统,各控股公司可根据本办法制定相应的实施细则。 3. 术语与定义 3.1信息化软件的维护内容分为基础软件维护、应用软件、配套网络维护三部分:3.1.1基础软件指运行于计算机主机智商的操作系统、数据库软件、中间件等公共软件; 3.1.2应用软件指运用计算机系统之上,直接提供服务或业务的专用软件; 3.1.3配套网络指保证信息系统相互通信和正常运行的网络组织,包括联网 所需的交换机、路由器、防火墙等网络设备和局域网内连接网络设备的网线、传输。 3.2运行维护管理的基本任务: 3.2.1进行信息系统的日常运行和维护管理,实施监控系统运行状态,保证系统 各类运行指标符合相关规定; 3.2.2迅速而准确地定位和排除各种故障,保证信息系统正常运行,确保所承载的各类应用和业务正常。 3.2.3进行系统安全管理,保证信息系统的运行安全和信息的完整、准确; 3.2.4在保证系统运营质量的情况下,提高维护效率,降低维护成本。 4. 职责 4.1信息系统的运行维护管理遵循在统一的领导下,分级管理和维护的模式。作 为信息中心,牵头组织实施信息系统的维护管理工作。。 4.2 信息系统的维护管理分为两个层面:管理层面和操作层面。在管理层面,信息管理中心,负责公司信息系统的维护管理。在操作层面,各部门是操作软件的维护部

系统运维管理制度

系统运维管理制度

运维管理制度 系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。

IT运维服务要求规范

IT运维服务规范 一、总则 (3) 二、参考标准 (3) 三、术语、定义和缩略语 (3) 3.1.术语和定义 (3) 3.1.1IT运维服务 (3) 3.1.2IT运维服务管理流程 (4) 3.1.3IT运维服务支撑系统 (4) 3.2.略语 (4) 四、编制原则和方法 (4) 五、IT运维服务管理体系 (5) 5.1IT运维服务管理对象 (7) 5.2IT运维活动角色及IT运维管理组织结构 (7) 5.2.1IT运维活动角色 (7) 5.2.2IT运维管理组织结构 (8) 5.3IT运维服务管理流程 (8) 5.3.1服务台 (8) 5.3.2事件管理 (8) 5.3.3问题管理 (9) 5.3.4配置管理 (9) 5.3.5变更管理 (9) 5.3.6发布管理 (9) 5.3.7服务级别管理 (9) 5.3.8财务管理 (10) 5.3.9能力管理 (10) 5.3.10可用性管理 (10) 5.3.11服务持续性管理 (10) 5.3.12知识管理 (10) 5.3.13供应商管理 (10) 5.4IT运维服务支撑系统 (11) 5.4.1IT运维服务支撑系统分类 (11) 5.4.2IT运维服务支撑系统基本技术要求 (11) 5.5IT运维服务 (12) 5.5.1IT运维服务分类 (12) 5.5.1.1IT基础设施运维服务 (12) 5.5.1.2IT应用系统运维服务 (12) 5.5.1.3安全管理服务 (12)

5.5.1.4网络接入服务 (12) 5.5.1.5内容信息服务 (12) 5.5.1.6综合管理服务 (12) 5.5.2IT运维服务的质量指标 (13) 六、IT运维服务和管理能力评估与提升途径 (13) 6.1IT运维服务和管理成熟度 (13) 6.2IT运维服务和管理成熟度提升途径 (14)

运维交接流程

运维交接流程 Version 2.0 二零一四年四月

一、运维交接流程 开发团队将软件项目交接给运维团队进行项目运维,该过程是一个责任过度的过程,需要严格的规范以及流程进行支撑。该部分叫做运维交接流程。 交接过程中,提交的软件文档一般包含需求说明书,概要说明书,详细设计说明书,数据字典,测试报告,试运行情况报告分析,部署文档等,必须保持项目实际情况与文档一致性。 运维团队测试包含功能测试,用户测试,业务逻辑测试,集成测试,压力测试,需要在流程中填写相关的测试总结以及上传测试报告,不合格需要说明不合格原因。 以上过程需要在严格的规范下进行,不然,流程会因为只是个形式而失败,达不到预期效果。 二、交接规范 新项目需稳定运行3个月以上时间才能交接给运维组 新项目交接给运维组必须对接手维护的同事做系统业务培训 项目交接必须提供: 系统release版本 《项目需求文档.doc》 《项目操作手册.doc》 《项目维护手册.doc 》 《项目常见问题处理.doc 》 《项目详细设计文档.doc 》 《项目数据字典》 三、软件测试验收 软件验收为系统验收的核心。对软件质量、软件的可维护性、软件的易用性和软件项目的实施周期起到“一锤定音”的作用。 (一)测试环境下的测试验收 1、初次测试 依据系统功能列表中的功能进行逐个测试,测试中记录以下情况:功能是否实现,功能

是否符合要求,测试时间。 系统测试类型有以下几方面: (1)功能测试:功能测试就是对产品的各功能进行验证,根据功能测试用例,逐项测试,检查产品是否达到要求的功能。 1)从软件的功能是否全面; 2)软件功能是否正确; 3)程序和数据是否与产品需求说明及用户文档的全总说明相对应。 (2)可靠性测试:指软件在规定的时间和条件下不出现故障,持续运行的能力。 1)软件不应存在导致软件无法运行、崩溃或导致数据破坏、缺损的重大缺陷; 2)测试一般包括成熟性、容错性、易恢复性、数据是否具有校验机制等方面。 (3)容错性测试:评价软件是否拥有异常处理手段;对关键操作、不可恢复的操作或可能引起灾难性后果的操作应有明确的提示,并请求用户确认。 (4)易用性测试:指软件的易用程度。 1)用户学习、操作软件的难易程度; 2)数据编辑、检索、输出的方便程度和灵活程度; 3)易理解程度、易浏览性、可操作性。 (5)可维护性测试: 1)指用户根据自己的要求、使用环境对软件进行个性化定制的可能性、难易程度和灵活程度; 2)运行出错后,用户自己发现、诊断、修改错误的可行性与工作量。 (6)性能测试:性能测试主要测试软件的运行速度和对资源的消耗。通过调整系统所依赖的软硬件配置、网络拓补结构、工作站点数、数据量和服务请求数来测试软件的移植性、运行速率、稳定性和可靠性。重点关注以下几点: 1)时间特性; 2)资源特性; 3)网络特性。 (7)可移植性测试:通过硬件兼容性测试、软件兼容性测试和数据兼容性测试来考察软件的跨平台、可移植的特性。重点掌握以下几点: 1)兼容性:操作系统兼容性、异构数据库兼容性、新旧数据转换、异种数据兼容性、硬件兼容性等; 2)适应性:在适应目前需求的基础上,为将来可预见和不可预见的性能扩充留有余地; 3)可扩充性:新功能、新业务的增加能够在不影响系统运行的情况下实现。 (8)安全性测试:通过非法登陆、漏洞扫描、模拟攻击等方式检测系统的认证机制、加密机制、防病毒功能等安全防护策略的健全性。重点掌握以下几点: 1)软件使用的安全性; 2)数据的存储、传输和访问安全; 3)安全测试期间,测试人员假扮非法入侵者,采用各种办法试图突破防线。 (9)用户管理测试:对系统进行用户添加,授权等一系列操作发现任何问题都记录下来形成文档,然后对用户进行权限变更、删除等一系列操作,文档记录问题发现时间、问题描述、问题原因、解决方法、解决时间等(详细情况填写问题记录)。将发现问题由建设方提出解决方案,由用户确定后进行修改。 (10)界面实现情况测试:界面要符合现行标准和用户习惯。软件企业可以形成自己的特色,但要确保整个软件风格一致。界面测试要从友好性、易操作性、美观性、布局合理、分类科学、标题描述准确等方面入手。重点掌握以下几点:

运行维护管理规范

1. 运行维护管理规范 运行维护管理(以下简称运维管理)是信息主管部门对信息化设备、系统进行的日常管理、系统故障处理等作业操作,其目标是保障信息服务能够在用户可接受水平上提供持续可用的服务。 本规范的制定将指导本单位在信息化建设项目建设过程中、以及建设完成后进行运维管理的工作流程,本单位以及相关服务外包商应严格遵守。 1.1. 运维管理流程规范 本单位运维管理总体服务流程规范如下: 主要服务工作包括响应服务、主动服务两类。 1.1.1. 响应式服务 响应式服务是指,用户向服务提供者提出服务请求,由服务提供者对用户的请求做出响应,解决用户在使用、管理过程中遇到的问题,或者解决系统相关故障。 响应式服务采用首问负责制。第一首问为本单位信息中心。信息中心负责接受用户服务请求,并进行服务问题的初步判断。如果问题能够解决则直接给客户反馈,否则提交到首问服务外包商。对于明确的问题,信息中心将问题直接提交到相应的服务外包商。 首问外包服务商在信息中心的支持下,负责对问题进行排查,力争将问题精确定位到某具体环节。问题定位后将其转发给相应的服务外包商。如果问题范围较大,涉及到多个服务外包商时,由信息中心进行协调,在首问外包服务商统一指导下进行联合作业,直至问题解决完毕。 问题处理完成后,由责任服务外包商、首问服务外包商填写相应服务表单,并由首问外包服务商提交给信息中心,信息中心再向最终用户反馈。 各服务外包商(包括首问服务外包商)响应式服务流程规范如下:服务外包商首先通过电话/电子邮件/远程接入等手段进行远程解决,如果能够解决问题,则由工程师负责填写服务单,季度汇总后提交信息中心签字备案。 远程方式解决无效时,服务外包商工程师进行现场工作。根据故障状况,工程师现场能解决问题的,及时解决用户的问题;如不能,则由信息中心协调其他相关服务外包商进行联合故障排查,直至问题解决。如果问题仍然存在,则由各方领导相互协商,共同商讨解决办法。

(完整版)信息服务管理规范(运维)

大连软件行业规范 DSIA02022007 信息服务管理规范 第三部分计算机信息系统运营 和维护管理规范 (试行) 2007年12月26日发布 2008年1月25日施行 大连软件行业协会

前言 《信息服务管理规范》依据《ISO/IEC20000:2005“信息技术——服务管理”》标准,及其它国家和行业相关法律、法规制订。本规范为《信息服务资费标准》的引导性文件。 《信息服务管理规范》分为10部分: 第一部分:总则 第二部分:计算机信息系统集成管理规范 第三部分:计算机信息系统运营和维护管理规范 第四部分:软件服务管理规范 第五部分:数据加工和处理管理规范 第六部分:内容和增值服务管理规范 第七部分:数据库服务管理规范 第八部分:电子商务服务管理规范 第九部分:信息化工程监理规范 第十部分:其它专业类服务管理规范 本部分为《信息服务管理规范》的第三部分。 本部分起草人:郎庆斌、林华英、王永丹 本规范专家组:郎庆斌、孙鹏、刘玉贞、王小庚、孙毅、杨莉 本规范由大连市信息产业局提出并归口。 本规范召集单位:大连软件行业协会

目录 第三部分计算机信息系统运营和维护管理规范 (4) 1 适用范围 (4) 2 规范性引用文件 (4) 3 定义和术语 (4) 3.1 服务台 (4) 3.2 事件 (4) 3.3 问题 (4) 3.4 突发事件 (4) 4 要求 (4) 5 运营和维护服务类型 (5) 5.1 基础服务 (5) 5.2 性能优化服务 (5) 5.3 增值服务 (5) 6. 运营和维护服务内容 (5) 6.1 基础服务内容 (5) 6.1.1 物理环境管理和维护 (5) 6.1.2 网络基础设施管理和维护 (5) 6.1.3 数据存储设施 (5) 6.1.4 系统平台管理 (6) 6.1.5 应用系统管理和维护 (6) 6.1.6 数据管理和维护 (6) 6.1.7 安全管理和维护 (6) 6.1.8 子网管理和维护 (7) 6.1.9 桌面管理 (7) 6.1.10 操作管理 (7) 6.2 性能优化服务内容 (7) 6.2.1 系统平台性能评估 (7) 6.2.2 应用系统性能评估 (7) 6.2.3 数据存储和通信安全评估 (7) 6.2.4 系统整体安全性能评估 (7) 6.2.5 系统安全平台性能评估 (7) 6.2.6 业务整合 (7) 6.3 增值服务内容 (8) 6.3.1 规划管理 (8) 6.3.2 可用性管理 (8) 6.3.3 核心应用管理 (8) 6.3.4 安全管理 (8) 6.3.5 投资保护 (8) 6.3.6 系统运营策略和应用拓展 (8) 7 服务台管理 (8) 7.1 服务台功能 (8) 7.2 服务台流程 (8)

公司运维服务规范

某公司运维服务规范 第一章总则 第一条为保障公司运维工作有序开展,规范运维工作和人员的服务要求,避免人为操作不当引起的重大、关健运维事故,根据电信公司及公司维护管理办法要求,特制定本规范。 第二条本规范是公司运行维护管理的基本依据,维护岗位人员必须严格遵照执行。 第三条本规定的最终解释权在技术质量管理部。 第二章适用范围 第四条本规定所指的系统是指公司及各部门承接的运维项目中涉及的范围,按合同约定包括:网络设备、服务器、操作系统、应用系统、数据及保障项目正常运行的各项辅助设施。 第五条本规定适用于对各部门运维分管领导、运维管理员、运维项目经理及成员等各维护岗位人员(包括各部门外包员工)的运维管理要求。 第三章运维服务要求 第六条运维岗位人员要具备良好的工作作风和严谨的工作态度,服从管理,认真负责,坚守岗位,在问题面前不推诿、不拖拉、不盲目、不蛮干,要冷静分析、沉着处理。 第七条遵照公司各项运维管理制度及客户运维工作要求,严格执行维护工作服务规范,确保人员、系统及各项设施安全。具体要求

包括: (一)、基本维护要求 1、遵守客户业务管理和现场管理要求。 2、周期性的维护工作应经客户审批同意后方可实施。 3、因故障修复、功能升级等引起的系统版本升级和割接工作应经客户测试通过后方可实施。 4、未经客户同意,各维护岗位人员不得私自对客户的在线系统进行数据变更、数据统计、应用程序变更、系统参数调整、硬件设备调整。 5、维护外包人员须经业务和管理培训,明确岗位职责,通过部门考核确认后方可上岗。在客户现场以理想公司员工身份执行维护工作,遵循各项运维管理制度。 6、定期检查所维护系统的安全状况,为客户提出合理的预防处理措施。 (二)、故障响应/处理制度 1、遵照公司(故障控制管理办法)要求,在接到故障报修通知后,及时与用户取得联系后进行排障,故障排除后填写故障修复信息。 2、各维护岗位人员应确保通讯工作24小时畅通。 3、严格执行故障处理和处理逐级上报制度。 (三)、信息记录(维护资料管理) 1、建立健全系统维护文档和记录资料库,相关资料由各部门妥

公司应用系统运维移交管理办法

华北电网有限公司信息系统运维移交管理办法 第一章总则 第一条为进一步规范华北电网有限公司(以下简称“公司”)应用系统运维移交工作,确保运维移交期间公司应用系统稳定运行,应用系统移交后运维各项工作能够有效衔接,明确工作责任,规范移交流程,特制订本管理办法。 第二条运维移交是指业务系统从试运行移交到正式生产运行,从移交部门代为 运行维护转为信息运维中心正式运维。 第三条本办法是公司应用系统运维移交的基本要求。 第四条本办法适用于公司各部门以及直属供电(电力)公司、超高压公司、建设分公司、供应链管理中心(以下简称“各单位”)。 第二章职责分工 第五条公司信息化领导小组对公司信息系统运维移交工作实行统一领导,信息系统运维移交工作由公司信息管理中心、牵头业务部门、信息运维中心、实施单位共同完成。 系统运维移交工作职责分工: (一)公司信息管理中心负责信息系统运维移交的审核和批准及安全测评工作,系统的运维移交需报公司信息化领导小组审批。 (二)牵头业务部门负责组织相关业务部门、实施单位执行相关申请工作,进行

系统运维移交的审核、许可及测评等工作。 信息系统实施单位和信息运维中心共同负责完成信息系统运维移交的申请、知识转 移、交接确认等相关工作。 第三章交接前应具备的条件 第六条业务系统移交生产运维前必须测试正常、稳定运行、文档齐备,满足条件后方可申请移交,包括但不限于以下条件: (一)上线试运行期间需连续运行不少于3 个月。 (二)通过上线试运行验收。 (三)完成试运行报告并通过审查。 (四)具备必备的文档并通过审查。 (五)运行维护报告:含维护记录。 (六)完成对运行维护人员的知识转移。 (七)紧急情况恢复测试(可选):服务器瘫痪、网络故障、应用服务器故障等的解决办法,备用应急方案启动测试。 (八)系统备份策略明确、备份系统正常,且进行过恢复测试。 (九)提供详细的日常运行维护制度或规程。 第七条移交方应成立移交小组,移交小组应由系统初始实施人员构成,并有足够的技术力量。 第八条在系统正式交接前,系统移交部门应与信息运维中心指定相应的运维团队或者运维责任人,完成相关制度和文档的准备。 第四章运维交接流程 第九条系统上线后,移交方应根据本运行移交标准,结合应用系统及试运行情况,制订应用系统移交工作计划(可参照《应用系统移交工作计划》), 并与信息运维中心共同讨论确定,最终

运维管理办法

运维管理办法 目录 1. 总则 ................................................. 1. 2. 系统运维管理办法..................................... 1.. 3. 数据库运维管理办法................................... 2.. 4. 备份运维管理办法..................................... 2.. 5. 巡检管理办法......................................... 3.. 6. 请示报告制度......................................... 4.. 1. 总则 第1条为了加强运行维护管理保障业务系统稳定可靠地运行,制定本运行维护基本管理办法。 第2条实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。 第3条完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。 2. 系统运维管理办法 1. 指定专人作为系统管理员,对系统的运行、管理、维护和安全负责,并按照规定 负责系统和数据的备份与恢复。 2. 定时对系统进行监控和健康性检查,分析系统运行和资源使用情况,进行必要的 优化、调整和修正,及时消除隐患。 3. 及时处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最

大限度的保护好系统数据 4. 具有系统权限人员调离工作岗位或离职,应立即修改其保管的用户密码,或删除 该用户。 3. 数据库运维管理办法 1. 对数据库的变更必须有记录,并且可以回滚。 2. 无用表和字段要及时清理 3. 数据库进行修改、删除数据时要提前备份 4. 设置对数据库的自动备份,以便在发生故障时,能尽快恢复数据,并定期检查备 份计划的执行情况。 5. 指定专人定期进行备份数据的恢复校验。 6. 做好数据库操作审计,以便对操作有据可查。 4. 备份运维管理办法 4.1. 目的 建立有效的数据备份和恢复机制,确保各系统备份工作按照计划正常完成,保证各应用系统的数据安全。 4.2. 备份制度 1. 正式使用的应用系统、操作系统日志、数据库系统、网络配置等信息必须定期进 行有效备份且具有可复原性。 2. 备份数据必须定期、完整、真实有效的转储到永久性介质上,并且明显标识。

系统运维管理-运维服务目录管理规范

运维服务目录管理规范 文件编号: ITSS-运维服务目寻管理规范-V1.0 版本历史 编制人: 审批人:

目录 目录------------------------------------------------------------------------------------------ 2 1. 概述-------------------------------------------------------------------------------------- 3 1.1. 目的 ----------------------------------------------------------------------------- 3 1.2. 范围 ----------------------------------------------------------------------------- 3 2. 角色与职责----------------------------------------------------------------------------- 3 2.1. 公司管理层-------------------------------------------------------------------- 3 2.2. 相关部门----------------------------------------------------------------------- 3 3. 服务目录的管理 ---------------------------------------------------------------------- 4 3.1. 建立服务目录----------------------------------------------------------------- 4 3.2. 监控服务目录----------------------------------------------------------------- 4 3.3. 更新服务目录----------------------------------------------------------------- 4 3.3.1. 定期更新 -------------------------------------------------------------- 4 3.3.2. 不定期更新 ----------------------------------------------------------- 5

IT基础设施运维管理规范

IT基础设施运维管理规范 文件编号:版本号: 一、总则 为了规范本部门的运维管理工作,使得相关工作具有持续改善性及相互协作性,能够支撑公司系统的健康可靠的运行,由此制定本规范。 本规范适用于信息管理中心技术保障部所有岗位人员。 二、部门职能 (1)负责信息化基础设施的技术保障,包括网络、电话、机房、服务器系统、数据安全等技术支持; (2)负责所有服务器系统的技术运维工作 (3)负责核心数据库的性能调优及技术运维工作 (4)负责各种网络设施、线路的技术运维保障工作 (5)负责其他设施的运维保障工作,如机房设施、一卡通、考勤机等智能化设施。 (6)负责信息化安全的建设与执行; 三、岗位职责 (1)经理: 负责信息化基础设施的技术保障,包括,电脑终端、网络、电话、机房、服务器系 统、数据安全等技术支持; 负责信息化安全的建设与执行; 负责本部门的组织管理,包括,修订组织职责、架构编制、岗位职级、分工授权等; 负责本部业务制度流程规范的制定和监督执行;

负责本部团队建设,包括,新员工入职、员工培训、绩效考核、员工心政、团队活 动等; 负责本部门工作管理,包括,预算编制与管控、计划管理、汇报管理、会议管理等; (2)系统工程师: 负责所有服务器系统的技术运维工作 负责核心数据库的性能调优及技术运维工作 (3)网络工程师: 负责各种网络设施、线路的技术运维保障工作 负责其他设施的运维保障工作,如机房设施、一卡通、考勤机等智能化设施(4)安全工程师: 负责信息化安全的建设与执行; (5)其他说明事项: 系统工程师、DBA、网络工程师、安全工程师,以下统称运维工程师; 权限控制:除负责基础设施的网络工程师,其余工程师不得拥有进入数据中心机房 的权限。网络工程师不得拥有系统工程师的管理权限。 各岗位周期性工作清单见附一。 四、管理对象 IT基础设施管理对象包括网络、电话、机房、服务器、系统、信息安全等,具体内容如下: (1)网络:XXXX运营中心、JJJJ工业园、WWWW工业园、数据中心、北京办事处的网络建设与维护。 (2)电话:XXXX运营中心、JJJJ工业园、WWWW工业园的电话网络建设与维护。 (3)机房:数据中心机房的建设与日常维护。 (4)服务器:服务器软硬件的采购、建设与日常维护。 (5)系统:操作系统、数据库、应用系统、虚拟化的日常维护。 (6)信息安全:信息安全建设与维护。

项目移交运维管理办法

项目移交运维管理办法 2009年3月

一、目标 编制项目移交运维管理办法的目标是梳理项目移交运维的一般流程,规范项目移交运维工作,最终保证我局信息化业务系统正常稳定运行。 二、适用范围 项目在正式上线并且稳定运行一个月后,在最终验收前项目建设部门发起将该项目移交给运维部门维护时适用本管理办法。 三、参与对象在项目移交运维工作中,主要的参与对象是四个角色:项目建设部门移交审核人、项目负责人、运维移交审核人、系统维护负责人。 (一)项目负责人 项目负责人指的是项目建设部门负责项目实施的工作人员。项目在移交运维过程中,项目负责人与运维部门要密切合作,共同保证项目的顺利移交,并且在项目移交后继续协助办理项目的付款手续工作。在移交过程中,其职责主要为: 1.向系统维护负责人提供完整的项目相关资料,组织完成必要的系统管理培训,交待项目建设的重点与难点及需要注意解决的问题,讲明本项目与其它业务系统的关系等; 2.与系统维护负责人共同完成项目移交运维手续的办理。 3.配合系统维护负责人,完成已移交项目的验收组织工作。 (二)系统维护负责人 系统维护负责人指的是接手项目后续管理运维,包括在系统免维期这段时间中对系统环境的熟悉以及监督开发公司对在免维期

系统出现的问题故障及时解决,保持系统的稳定运行,及时更新技术文档内容,以便在免维期结束后能协助开发公司平滑过渡到运维公司负责维护系统,确保用户在此过程中不受影响的技术人员。同时负责在项目支付尾款的时候提交该项目运维服务和运行质量报告,作为尾款支付的依据之一。在移交过程中,其职责主要为: 1.接收项目负责人移交的相关文档资料; 2.掌握接手项目基本情况; 3.参加或组织相关的业务培训和技术培训; 4.与项目负责人共同完成项目移交运维手续的办理,负责已移交项目的验收工作。 (三)移交审核人 移交审核人由项目建设部门以及运维部门领导担任,包括项目建设部门移交审核人以及运维移交审核人,负责对项目移交运维工作监督审核,并将审核结果反馈给相关责任人(如审核通过则要反馈给审批人),主要职责为: 1.审核项目建设部门移交负责人提交的项目移交运维工作单(见附录),并进行评估; 2.按照项目移交运维工作单中的移交计划组织移交实施工作。 四、移交流程 (一)总体流程 项目移交运维的整个过程可以划分三个阶段:移交准备阶段、移交实施阶段和移交确认阶段。这三个阶段在时间上前后相继,原则上单个项目移交总体时间控制在一个月内。

云计算中心运维管理制度

云计算中心运维管理制度 现代信息中心已成为人们日常生活中不可缺少的部分,因此信息中心机房设备的运行正常与否就非常关键。在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。这就给运维是否到位提出了严格要求。 1 运维在机房中的地位 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理是,为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统地计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负合规性、可用性、经济性、服务性等四大目标。 在信息中心机房配备有运维人员,但大都是“全才”的,即什么都管,尤其是对供电系统大都是由主机运维的人员代管。当电源系统出故障时,此代管人员一问三不知,甚至连配电柜门都没开过。这实际上就是把机房的运维放在了一个次要的地位。 当然也有的地方有所分工,看似重视,实际上也没得到真正地重视。比如说机房设备长时间一直运行正常,这时如果运维人员提出要增添运维方面的测量设备,有的领导就认为多余,很难得到批准。但他不知道机房设备所以长时间一直运行正常,正是由于这些运维人员的细心维护和努力保养所获得的。并不是这些人员每天闲着无事可干,他们的这些工作一般是领导看不见的。比如同样多款的UPS在同样的环境条件下,在某卫星地面站就极少出故障,而在同系统别的地方机房同一家同规格的机器就故障连连。原来是前者的运维人员每天都在细心观察和分析机器面板LCD上显示的数据,一旦发现异常苗头及时采取措施;而后者只限于每天抄写这些数据就算完成任务,使异常苗头不断积累,以致于导致故障。比如断路器在额定闭合状态发现触点处温度高了,就要检查是不是电流过大到超过额定值,如果不是就要检查触点接触是否牢靠,是否需要再紧固一下。这样一来,故障隐患就排除了。如果一直不管不问久而久之就会导致跳闸而使系统崩溃。这都是一些小的动作,都是在巡查中顺便做的事情。所以同是运维人员在巡查,但前者在做事而后者只是走马观花。这就是数据中心可靠与不可靠的区别。 运维人员就像幼儿园的保育员和老师。孩子交到幼儿园后,起主要作用的就是保育员和老师,这时保育员和老师就是主体。机器就好比是幼儿园的孩子,孩子是否健康成长,机器是否正常运行,除去本身的健康(可靠性质量)状况外,那就是运维人员的责任了。由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性,除基于ITIL(IT基础设施库)的常规数据中心运维管理理念之外,以下运维管理方面的内容,需要我们加以重点关注。 2 云计算数据中心运维管理的要点 (1)理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象一般可分成5大类: ①机房环境基础设施 这里主要指的是为保障数据中心所管理的设备正常运行所必需的网络通信、供配电系统、环境系统、消防系统和安保系统等。这部分设备对于用户来说几乎是透明的,比如大多数用户都不会忽略数据中心的供电和制冷。因为这类设备如果发生意外,对依托于该基础设施的应用来说是致命的。 ②数据中心所应用的各种设备 这些设备包括存储、服务器、网络设备和安全设备等硬件资源。这类设备在向用户提供IT 服务过程中提供了计算、存传输和通信等功能,是IT服务最核心的部分。 ③系统与数据 这部分包括操作系统、数据库、中间环节和应用程序等软件资源,还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样“看得见,摸得着”,但却是IT服务的逻辑载体。 ④管理工具 这部分包括基础设施监控软件、IT监控软件、工作流管理平台、报表平台和短信平台等。 这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象的工作情况,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证数据中心如何管理好与其直接相关的资源,从而间接地提升了可用性与可靠性。 ⑤人员管理 人员管理包括数据中心在内的技术人员、运维人员、管理人员以及提供服务的厂商人员的管理。 人员一方面作为管理的主体负责管理数据中心的运维对象,另一方面也作为管理的对象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。 (2)定义各运维对象的运维内容 云计算数据中心资源管理所涵盖的范围很广,包括环境管理、网络管理、设备管理、软件管理、存储介质管理、防病毒管理、应用管理、日常操作管理、用户密码管理和员工管理等。这就需要对每一个管理对象的日常维护工作内容有一个明确的定义,定义操作内容、维护频度、对应的责任人,要做到有章可循,责任人可追踪。实现对整个系统全生命周期地追踪管理。 (3)建立信息化的运维管理平台系统和IT服务管理系统 云计算数据中心的运维管理应从数据中心的日常监控入手,事件管理、变更管理、应急预案管理和日常维护管理等方面全方位地进行数据中心的日常监控。实现提前发现问题、消除隐患,首先要有完整的、全方位实时有效的监控系统,并着重监控数据的记录和技术分析。 数据中心的业务可以概括为:通过运行系统来向客户提供服务。没有信息系统的支撑来运行

系统运维管理 IT基础设施运维管理规范

IT 基础设施运维管理规范 文件编号:运维-002-V1.0 目录 运维管理规范--------------------------------------------- 2 1. 目的--------------------------------------------------- 2 2. 适用范围----------------------------------------------- 2 3. 规范性引用及参考--------------------------------------- 3 4. 本文术语,定义和缩略语--------------------------------- 3 5. 基本要求----------------------------------------------- 4 5.1运维管理原则 -------------------------------------- 4 5.2制度和流程管理 ------------------------------------ 5 5.3 文档管理------------------------------------------ 5 5.4设备和软件管理 ------------------------------------ 5 5.5供应商管理 ---------------------------------------- 5 5.6督促检查 ------------------------------------------ 6 6. 运行维护----------------------------------------------- 6 6.1日常操作及监控分析 -------------------------------- 6 6.2 数据与介质管理------------------------------------ 7 6.3机房管理 ------------------------------------------ 7 6.4 网络管理------------------------------------------ 8

系统运维管理制度

运维管理制度 系统运维管理制度( 试行 ) (2018年 8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用 性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、 流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系 1

运维管理制度 统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持 续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准 / 规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 第二条本实施细则以 ITIL/ISO20000为基础,以信息化项目的运维为目标,以管 理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的 PDCA 循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换 策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程 中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术 参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监 督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。

系统运维管理系统-计算机信息系统运营和维护管理系统要求规范

信息服务管理规范 计算机信息系统运营和维护管理规范

前言 《信息服务管理规范》依据《ISO/IEC20000:2005“信息技术——服务管理”》标准,及其它国家和行业相关法律、法规制订。本规范为《信息服务资费标准》的引导性文件。《信息服务管理规范》分为10部分: 第一部分:总则 第二部分:计算机信息系统集成管理规范 第三部分:计算机信息系统运营和维护管理规范 第四部分:软件服务管理规范 第五部分:数据加工和处理管理规范 第六部分:内容和增值服务管理规范 第七部分:数据库服务管理规范 第八部分:电子商务服务管理规范 第九部分:信息化工程监理规范 第十部分:其它专业类服务管理规范

目录 前言------------------------------------------------------------ 2目录------------------------------------------------------------ 3第三部分计算机信息系统运营和维护管理规范----------------------- 5 1 适用范围-------------------------------------------------- 5 2 规范性引用文件-------------------------------------------- 5 3 定义和术语------------------------------------------------ 5 3.1 服务台---------------------------------------------- 5 3.2 事件------------------------------------------------ 6 3.3 问题------------------------------------------------ 6 3.4 突发事件-------------------------------------------- 6 4 要求------------------------------------------------------ 6 5 运营和维护服务类型---------------------------------------- 6 5.1 基础服务-------------------------------------------- 6 5.2 性能优化服务-------------------------------------------- 7 5.3 增值服务------------------------------------------------ 7 6. 运营和维护服务内容--------------------------------------- 7 6.1 基础服务内容---------------------------------------- 7 6.2 性能优化服务内容----------------------------------- 11 7 服务台管理--------------------------------------------------- 13 7.1 服务台功能----------------------------------------- 13 7.2 服务台流程----------------------------------------- 14 7.3 优先级--------------------------------------------- 14 8 运营和维护管理体系--------------------------------------- 15 9. 运营管理------------------------------------------------ 16 9.1 运营管理目标--------------------------------------- 16 9.2 需求分析------------------------------------------- 16 9.3 运营计划------------------------------------------- 16

相关主题
文本预览
相关文档 最新文档