当前位置:文档之家› IT运维管理守则(故障及处理)

IT运维管理守则(故障及处理)

IT运维管理守则(故障及处理)
IT运维管理守则(故障及处理)

精心整理

2019年-9月

IT 运维手册

第二篇 硬件篇

一计算机章

㈤常见问题

1主机

⑴无法正常开机

①硬盘灯亮

多为显示器或LCD 统。

I 可更换同型号电源线,排查故障。

II 内存问题

拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS 设置解决。

精心整理

2019年-9月

III 灰尘问题

笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。

IV 主板问题

主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方⑵无法正常上网

①网络设置问题

此原因较多出现于需手动指定②DNS I IP 地址来访问,如果可以访问,则为DNS 出错或DNS 服务TSP 提供的DNS 服务器地址,也可用其它地方可正常使用DNS 服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP 协议-属性-使用下面的DNS 服务器地址)。不用的ISP 有不同的DNS 地址。有时候则是路由器或网卡的问题,无法与ISP 的DNS 服务连接,这种情况可重启路由器或重新设

...

置路由器。

II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。

③IE浏览器本身的问题

IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。

④网络防火墙问题

如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。

2显示器

⑴无图像显示

①开机无反应

I检查电脑的外部接线是否接好,把各个连线重新插一遍,看故障是否排除。

II如果故障依旧,接着打开主机箱查看机箱内有无多余金属物,或主

...

精心整理

2019年-9月

板变形造成的短路,闻一下机箱内有无烧焦的糊味,主板上有无烧毁的芯片,CPU 周围的电容有无损坏等。

III 如果没有,接着清理主板上的灰尘,检查显卡等硬件是否有松动,然后检查电脑是否正常。

IV 如果故障依旧,则故障可能由内存、显卡、CPU 、主板等设备引起。②未检测到信号

问题, ⑵蓝屏

CPU 或即可。

②如果电脑在光驱读盘时被非正常打开导致蓝屏,则蓝屏故障是由于被误操作引起的,此故障一般将光盘重新放入光驱,再关上光驱托盘即可。

③如果电脑在带电插拔某设备时发生蓝屏,则蓝屏与带电插拔设备有关,一般重新启动电脑即可恢复。

...

④如果电脑在使用某一个应用程序软件时发生蓝屏,则蓝屏故障可能

是由此程序软件引起的,一般将程序软件卸载,再重新安装即可排除故障;如果不行,则可能是程序软件本身有错误,不能使用。

⑤如果电脑在进入系统后就出现蓝屏,引起蓝屏故障的原因可能较多,需要逐步进行排除。先用杀毒软件查杀病毒,排除病毒造成的蓝屏故障,如果故障排除,则是病毒造成的蓝屏故障。

⑥如果故障依旧,重新启动电脑,然后再用安全模式启动电脑,启动后退出系统再重新启动到正常模式,如果排除则是系统错误造成的蓝屏故障。

二网络章

㈡实际操作

2网络运维常用工具

①驱动精灵

驱动精灵是一款集驱动管理和硬件检测于一体的、专业级的驱动管理和维护工具。驱动精灵为用户提供驱动备份、恢复、安装、删除、在线更新等实用功能。另外除了驱动备份恢复功能外,还提供了Outlook地址簿、邮件和 IE 收藏夹的备份与恢复。并且有多国语言界面供用户选择。

利用驱动精灵的驱动程序备份功能,在电脑重装前,将电脑中的最新

版本驱动程序通通备份下载,待重装完成时,再试用它的驱动程序还原功

...

精心整理

2019年-9月

能安装,便可节省驱动程序安装的时间。驱动精灵对于手头上没有驱动盘的用户十分实用,用户可以通过本软件将系统中的驱动程序提取并备份出来。

②360硬件大师

360硬件大师是一款专业易用的硬件工具,准确的硬件检测可协助辨电脑优化等功能。

㈢常见网络问题及解决方案

1①IP 地址”,启动计算机时,计算机所以计算机启动的速度会降低,加长。可在本地连接的属性中删除不必要的协议和服务,对局域网的一般应用而言,有TCP/IP 协议,MICROSOFT 网络用户,MICROSOFT 网络的文件和打印机三个网络组建即可。

2网络中的某台计算机挪动后,线路连接出现中断,将水晶头用手按住时,

...

网络连通情况为时断时续。计算机Ping本机地址成功,Ping外部地址不通,使用测线仪对网络线路进行测量,发现部分用于传输数据的主要芯线不通。

①拔下水晶头,检查水晶头与网卡接口,若网卡RJ-45接口中的部分弹簧片松动,导致网卡接口与RJ-45头没有连接好,用镊子将弹簧片复位,再行接入后故障即可排除。

②采用网络测线仪对双绞线两端接头进行测试,必要时可让两端双绞线脱离配线架、模块或水晶头直接进行测量确诊,以防因连接问题造成误诊,确诊后即可沿网络路由对故障点进行人工查找。如果有专用网络测试仪就可直接查到断点处与测量点间的距离,从而更准确地定位故障点。对线路断开的处理,通常可将双绞线、铜芯一一对应缠绕连接后,加以焊接并进行外皮的密封处理,也可将断点的所有芯线断开,分别压制进入水晶头后用对接模块进行直接连接。如果无法查找断点或无法焊接,在保证断开芯线不多于4根的情况下也可在两端将完好芯线线序优先调整为1、2、3、6,以确保信号有效传输。在条件许可的情况下,也可用新双绞线重新进行布设。

五视频会议系统

㈠宝利通视频会议系统

3常见问题

...

精心整理

2019年-9月

⑴系统不响应遥控器

①遥控器中没有电池、电池电量不足或电池耗尽;

②遥控器中电池安装不正确;

③红外传感器接收不到遥控器信号或遥控器信号受到干扰; ⑵拿起遥控器,监视器屏幕保持黑屏

①监视器电源线未插入;

②监视器为正确连接到系统。

㈡科达视频会议系统

3常见问题

3米以上,且没有麦克风正对着与远端会场联络,请其检查并降低音量。

③当召开多级级联的会议、主会场发言时,分会场没有闭音。

当召开多级级联的会议、主会场发言时,最好要求分会场将本地麦克风闭音或主会场将各分会场远端闭音。

...

⑵终端开启后没有声音输出。

①音频输入线路异常。

用一个已确认正常工作的音频输入设备连接到终端之后再听声音。

②音频输出线路异常。

用一个已确认正常工作的音频输入设备连接到输出设备,确认输出线路和音箱等音频输出设备正常。

③终端的音量是否太低或为静音状态。

通过遥控器改变声音大小或静音状态。

第五篇制度篇

三各单位

㈠信息化管理工作制度

㈡信息化管理岗位职责

...

运维制度及流程

运行维护管理制度 2017年8月

目录3 3 3 5 6 6 7 8 8 9 9

1、总则 第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维部全体人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 3、运维部工作职责 一、负责网站运维和技术支持 (一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。 (二)负责网站栏目和应用系统的使用培训和操作使用指南编

写,对用户使用过程中出现问题的沟通和解决; (三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。 (四)网站设备和软件操作规程和应用管理制度的制定,并负责监督执行。 (五)网站设备和软件安装、调试和验收,使用培训和维修保养。 (六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。 (七)网站技术服务外包管理,主要包括技术外包开发、运行服务托管和空间域名管理。 (八)负责网站管理系统及设备保密口令的设置和保存,保密口令设置后报中心主任备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。 (九)负责网站新程序、新系统和网站改版升级方案技术的设计开发。 二、负责网站信息和技术安全 (一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。 (二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。

系统运维管理制度

系统运维管理制度

运维管理制度 系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。

IT运维服务要求规范

IT运维服务规范 一、总则 (3) 二、参考标准 (3) 三、术语、定义和缩略语 (3) 3.1.术语和定义 (3) 3.1.1IT运维服务 (3) 3.1.2IT运维服务管理流程 (4) 3.1.3IT运维服务支撑系统 (4) 3.2.略语 (4) 四、编制原则和方法 (4) 五、IT运维服务管理体系 (5) 5.1IT运维服务管理对象 (7) 5.2IT运维活动角色及IT运维管理组织结构 (7) 5.2.1IT运维活动角色 (7) 5.2.2IT运维管理组织结构 (8) 5.3IT运维服务管理流程 (8) 5.3.1服务台 (8) 5.3.2事件管理 (8) 5.3.3问题管理 (9) 5.3.4配置管理 (9) 5.3.5变更管理 (9) 5.3.6发布管理 (9) 5.3.7服务级别管理 (9) 5.3.8财务管理 (10) 5.3.9能力管理 (10) 5.3.10可用性管理 (10) 5.3.11服务持续性管理 (10) 5.3.12知识管理 (10) 5.3.13供应商管理 (10) 5.4IT运维服务支撑系统 (11) 5.4.1IT运维服务支撑系统分类 (11) 5.4.2IT运维服务支撑系统基本技术要求 (11) 5.5IT运维服务 (12) 5.5.1IT运维服务分类 (12) 5.5.1.1IT基础设施运维服务 (12) 5.5.1.2IT应用系统运维服务 (12) 5.5.1.3安全管理服务 (12)

5.5.1.4网络接入服务 (12) 5.5.1.5内容信息服务 (12) 5.5.1.6综合管理服务 (12) 5.5.2IT运维服务的质量指标 (13) 六、IT运维服务和管理能力评估与提升途径 (13) 6.1IT运维服务和管理成熟度 (13) 6.2IT运维服务和管理成熟度提升途径 (14)

实验数据库的建立和维护

实验 2 :数据库的建立和维护实验 本实验需要 2 学时。 一、实验目的 要求学生熟练掌握使用SQL 、Transact-SQL 和SQL Server 企业管理器建立数据库、表、修改数据库、表和删除数据库和表的操作。 二、实验内容和步骤 1.创建数据库 1)在企业管理器中创建数据库姓名_数据库名,要求: ●数据库姓名_数据库名初始大小为10MB,最大大小为50MB,数据库自动增长,增长方式是按5%比例增 长; ●日志文件初始大小为2MB,最大可增长到5MB,按1MB增长; ●数据库的逻辑文件名和物理文件名均采用默认值; ●(分别为姓名_数据库名和e:\姓名\data\姓名_数据库名.mdf ●事务日志的逻辑文件名和物理文件名也采用默认值。 ●(分别为姓名_数据库名_LOG和e:\姓名\data\姓名_数据库名_LOG.ldf) 2)②使用T-SQL语句创建数据库姓名_数据库名_2,要求同1; Create database 姓名_数据库名_2 On (name=STUDENT_01_data, filename='e:\姓名\data\姓名_数据库名_2.mdf', size=10, maxsize=unlimited, filegrowth=10%) log on (name=student1_log, filename='e:\姓名\data\姓名_数据库名.mdf', size=2, maxsize=5, filegrowth=1) 2.创建表 以上面创建的数据库为例,创建表。创建表实际上就是创建表结构,再向表中输入数据。既可以使用企业管理器创建表,也可以用Transact-SQL命令创建表。

公司运维服务规范

某公司运维服务规范 第一章总则 第一条为保障公司运维工作有序开展,规范运维工作和人员的服务要求,避免人为操作不当引起的重大、关健运维事故,根据电信公司及公司维护管理办法要求,特制定本规范。 第二条本规范是公司运行维护管理的基本依据,维护岗位人员必须严格遵照执行。 第三条本规定的最终解释权在技术质量管理部。 第二章适用范围 第四条本规定所指的系统是指公司及各部门承接的运维项目中涉及的范围,按合同约定包括:网络设备、服务器、操作系统、应用系统、数据及保障项目正常运行的各项辅助设施。 第五条本规定适用于对各部门运维分管领导、运维管理员、运维项目经理及成员等各维护岗位人员(包括各部门外包员工)的运维管理要求。 第三章运维服务要求 第六条运维岗位人员要具备良好的工作作风和严谨的工作态度,服从管理,认真负责,坚守岗位,在问题面前不推诿、不拖拉、不盲目、不蛮干,要冷静分析、沉着处理。 第七条遵照公司各项运维管理制度及客户运维工作要求,严格执行维护工作服务规范,确保人员、系统及各项设施安全。具体要求

包括: (一)、基本维护要求 1、遵守客户业务管理和现场管理要求。 2、周期性的维护工作应经客户审批同意后方可实施。 3、因故障修复、功能升级等引起的系统版本升级和割接工作应经客户测试通过后方可实施。 4、未经客户同意,各维护岗位人员不得私自对客户的在线系统进行数据变更、数据统计、应用程序变更、系统参数调整、硬件设备调整。 5、维护外包人员须经业务和管理培训,明确岗位职责,通过部门考核确认后方可上岗。在客户现场以理想公司员工身份执行维护工作,遵循各项运维管理制度。 6、定期检查所维护系统的安全状况,为客户提出合理的预防处理措施。 (二)、故障响应/处理制度 1、遵照公司(故障控制管理办法)要求,在接到故障报修通知后,及时与用户取得联系后进行排障,故障排除后填写故障修复信息。 2、各维护岗位人员应确保通讯工作24小时畅通。 3、严格执行故障处理和处理逐级上报制度。 (三)、信息记录(维护资料管理) 1、建立健全系统维护文档和记录资料库,相关资料由各部门妥

运行维护管理规范

1. 运行维护管理规范 运行维护管理(以下简称运维管理)是信息主管部门对信息化设备、系统进行的日常管理、系统故障处理等作业操作,其目标是保障信息服务能够在用户可接受水平上提供持续可用的服务。 本规范的制定将指导本单位在信息化建设项目建设过程中、以及建设完成后进行运维管理的工作流程,本单位以及相关服务外包商应严格遵守。 1.1. 运维管理流程规范 本单位运维管理总体服务流程规范如下: 主要服务工作包括响应服务、主动服务两类。 1.1.1. 响应式服务 响应式服务是指,用户向服务提供者提出服务请求,由服务提供者对用户的请求做出响应,解决用户在使用、管理过程中遇到的问题,或者解决系统相关故障。 响应式服务采用首问负责制。第一首问为本单位信息中心。信息中心负责接受用户服务请求,并进行服务问题的初步判断。如果问题能够解决则直接给客户反馈,否则提交到首问服务外包商。对于明确的问题,信息中心将问题直接提交到相应的服务外包商。 首问外包服务商在信息中心的支持下,负责对问题进行排查,力争将问题精确定位到某具体环节。问题定位后将其转发给相应的服务外包商。如果问题范围较大,涉及到多个服务外包商时,由信息中心进行协调,在首问外包服务商统一指导下进行联合作业,直至问题解决完毕。 问题处理完成后,由责任服务外包商、首问服务外包商填写相应服务表单,并由首问外包服务商提交给信息中心,信息中心再向最终用户反馈。 各服务外包商(包括首问服务外包商)响应式服务流程规范如下:服务外包商首先通过电话/电子邮件/远程接入等手段进行远程解决,如果能够解决问题,则由工程师负责填写服务单,季度汇总后提交信息中心签字备案。 远程方式解决无效时,服务外包商工程师进行现场工作。根据故障状况,工程师现场能解决问题的,及时解决用户的问题;如不能,则由信息中心协调其他相关服务外包商进行联合故障排查,直至问题解决。如果问题仍然存在,则由各方领导相互协商,共同商讨解决办法。

(完整版)信息服务管理规范(运维)

大连软件行业规范 DSIA02022007 信息服务管理规范 第三部分计算机信息系统运营 和维护管理规范 (试行) 2007年12月26日发布 2008年1月25日施行 大连软件行业协会

前言 《信息服务管理规范》依据《ISO/IEC20000:2005“信息技术——服务管理”》标准,及其它国家和行业相关法律、法规制订。本规范为《信息服务资费标准》的引导性文件。 《信息服务管理规范》分为10部分: 第一部分:总则 第二部分:计算机信息系统集成管理规范 第三部分:计算机信息系统运营和维护管理规范 第四部分:软件服务管理规范 第五部分:数据加工和处理管理规范 第六部分:内容和增值服务管理规范 第七部分:数据库服务管理规范 第八部分:电子商务服务管理规范 第九部分:信息化工程监理规范 第十部分:其它专业类服务管理规范 本部分为《信息服务管理规范》的第三部分。 本部分起草人:郎庆斌、林华英、王永丹 本规范专家组:郎庆斌、孙鹏、刘玉贞、王小庚、孙毅、杨莉 本规范由大连市信息产业局提出并归口。 本规范召集单位:大连软件行业协会

目录 第三部分计算机信息系统运营和维护管理规范 (4) 1 适用范围 (4) 2 规范性引用文件 (4) 3 定义和术语 (4) 3.1 服务台 (4) 3.2 事件 (4) 3.3 问题 (4) 3.4 突发事件 (4) 4 要求 (4) 5 运营和维护服务类型 (5) 5.1 基础服务 (5) 5.2 性能优化服务 (5) 5.3 增值服务 (5) 6. 运营和维护服务内容 (5) 6.1 基础服务内容 (5) 6.1.1 物理环境管理和维护 (5) 6.1.2 网络基础设施管理和维护 (5) 6.1.3 数据存储设施 (5) 6.1.4 系统平台管理 (6) 6.1.5 应用系统管理和维护 (6) 6.1.6 数据管理和维护 (6) 6.1.7 安全管理和维护 (6) 6.1.8 子网管理和维护 (7) 6.1.9 桌面管理 (7) 6.1.10 操作管理 (7) 6.2 性能优化服务内容 (7) 6.2.1 系统平台性能评估 (7) 6.2.2 应用系统性能评估 (7) 6.2.3 数据存储和通信安全评估 (7) 6.2.4 系统整体安全性能评估 (7) 6.2.5 系统安全平台性能评估 (7) 6.2.6 业务整合 (7) 6.3 增值服务内容 (8) 6.3.1 规划管理 (8) 6.3.2 可用性管理 (8) 6.3.3 核心应用管理 (8) 6.3.4 安全管理 (8) 6.3.5 投资保护 (8) 6.3.6 系统运营策略和应用拓展 (8) 7 服务台管理 (8) 7.1 服务台功能 (8) 7.2 服务台流程 (8)

数据库运维管理规范

数据库运维管理规范 龙信思源(北京)科技有限公司 一、总则 为规范公司生产系统的数据库管理与配置方法,保障信息系统稳定安全地运行,特制订本办法。 二、适用范围 本规范中所定义的数据管理内容,特指存放在系统数据库中的数据,对于存放在其她介质的数据管理,参照相关管理办法执行。 三、数据库管理员主要职责 3、1、负责对数据库系统进行合理配置、测试、调整,最大限度地发挥设备资源优势。负责数据库的安全运行。 3、2、负责定期对所管辖的数据库系统的配置进行可用性,可靠性,性能以及安全检查。 3、3、负责定期对所管辖的数据库系统的可用性,可靠性,性能以及安全的配置方法进行修订与完善。

3、4、负责对所管辖的数据库系统运行过程中出现的问题及时处理解决。 3、5、负责对所管辖数据库系统的数据一致性与完整性,并协助应用开发人员、使用操作等相关人员做好相关的配置、检查等工作。 3、6、负责做好数据库系统及数据的备份与恢复工作。 四、数据库的日常管理工作 4、1、数据库管理的每日工作 (1)检查所有的数据库实例状态以及所有与数据库相关的后台进程。 (2)检查数据库网络的连通与否,比如查瞧监听器(listener)的状态、网络能否ping通其它的计算机、应用系统的客户端能否连通服务器等等。 (3)检查磁盘空间的使用情况。如果剩余的空间不足 20% ,需要删除不用的文件以释放空间或申请添加磁盘。 (4)查瞧告警文件有无异常。 (5)根据数据库系统的特点,检查其它的日志文件中的内容,发现异常要及时加以处理。 (6)检查cpu、内存及IO等的状态。 (7)检查备份日志文件的监控记录,确定自动备份有无成功完成。对于数据库的脱机备份,要确信备份就是在数据库关闭之后才开始的,备份内容就是否齐全。运行在归档模式下的数据库,既要注意归档日志文件的清除,以免磁盘空间被占满,也必须注意归档日志文件的保留,以备恢复时使用。

故障管理和故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月

目录 第一章目的 (3) 第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9)

第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。 第二章工程运维中心在95013业务维护管理中的职责 a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。

数据库维护保养管理方案计划规范标准

数据库运维管理规范龙信思源(北京)科技有限公司

一、总则 为规范公司生产系统的数据库管理和配置方法,保障信息系统稳 定安全地运行,特制订本办法。 二、适用范围 本规范中所定义的数据管理内容,特指存放在系统数据库中的数据,对于存放在其他介质的数据管理,参照相关管理办法执行。 三、数据库管理员主要职责 3.1.负责对数据库系统进行合理配置、测试、调整,最大限度地发 挥设备资源优势。负责数据库的安全运行。 3.2.负责定期对所管辖的数据库系统的配置进行可用性,可靠性, 性能以及安全检查。 3.3.负责定期对所管辖的数据库系统的可用性,可靠性,性能以及 安全的配置方法进行修订和完善。

3.4.负责对所管辖的数据库系统运行过程中出现的问题及时处理解决。 3.5.负责对所管辖数据库系统的数据一致性和完整性,并协助应用开发人员、使用操作等相关人员做好相关的配置、检查等工作。 3.6.负责做好数据库系统及数据的备份和恢复工作。 四、数据库的日常管理工作 4.1.数据库管理的每日工作 (1)检查所有的数据库实例状态以及所有与数据库相关的后台进程。 (2)检查数据库网络的连通与否,比如查看监听器(listener)的 状态、网络能否ping通其它的计算机、应用系统的客户端能否连通服 务器等等。 (3)检查磁盘空间的使用情况。如果剩余的空间不足 20% ,需要删除不用的文件以释放空间或申请添加磁盘。 (4)查看告警文件有无异常。 (5)根据数据库系统的特点,检查其它的日志文件中的内容,发现 异常要及时加以处理。 (6)检查cpu、内存及IO等的状态。 (7)检查备份日志文件的监控记录,确定自动备份有无成功完成。 对于数据库的脱机备份,要确信备份是在数据库关闭之后才开始的, 备份内容是否齐全。运行在归档模式下的数据库,既要注意归档日志

问题与故障处理流程图

NGBOSS3.0系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义 标准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障 管理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通 知故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到 标准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级 至故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。

●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤, 监督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员 现场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过 程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相 关领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。 ●记录问题处理过程,登记故障问题管理列表中的相关处理信息。 ●负责故障处理完成后,整理并填写故障分析报告,并按时提交。 ●总结及优化类似故障的处理步骤,为后续故障处理提供依据。 ●根据故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分 析。

系统运维管理-运维服务目录管理规范

运维服务目录管理规范 文件编号: ITSS-运维服务目寻管理规范-V1.0 版本历史 编制人: 审批人:

目录 目录------------------------------------------------------------------------------------------ 2 1. 概述-------------------------------------------------------------------------------------- 3 1.1. 目的 ----------------------------------------------------------------------------- 3 1.2. 范围 ----------------------------------------------------------------------------- 3 2. 角色与职责----------------------------------------------------------------------------- 3 2.1. 公司管理层-------------------------------------------------------------------- 3 2.2. 相关部门----------------------------------------------------------------------- 3 3. 服务目录的管理 ---------------------------------------------------------------------- 4 3.1. 建立服务目录----------------------------------------------------------------- 4 3.2. 监控服务目录----------------------------------------------------------------- 4 3.3. 更新服务目录----------------------------------------------------------------- 4 3.3.1. 定期更新 -------------------------------------------------------------- 4 3.3.2. 不定期更新 ----------------------------------------------------------- 5

IT基础设施运维管理规范

IT基础设施运维管理规范 文件编号:版本号: 一、总则 为了规范本部门的运维管理工作,使得相关工作具有持续改善性及相互协作性,能够支撑公司系统的健康可靠的运行,由此制定本规范。 本规范适用于信息管理中心技术保障部所有岗位人员。 二、部门职能 (1)负责信息化基础设施的技术保障,包括网络、电话、机房、服务器系统、数据安全等技术支持; (2)负责所有服务器系统的技术运维工作 (3)负责核心数据库的性能调优及技术运维工作 (4)负责各种网络设施、线路的技术运维保障工作 (5)负责其他设施的运维保障工作,如机房设施、一卡通、考勤机等智能化设施。 (6)负责信息化安全的建设与执行; 三、岗位职责 (1)经理: 负责信息化基础设施的技术保障,包括,电脑终端、网络、电话、机房、服务器系 统、数据安全等技术支持; 负责信息化安全的建设与执行; 负责本部门的组织管理,包括,修订组织职责、架构编制、岗位职级、分工授权等; 负责本部业务制度流程规范的制定和监督执行;

负责本部团队建设,包括,新员工入职、员工培训、绩效考核、员工心政、团队活 动等; 负责本部门工作管理,包括,预算编制与管控、计划管理、汇报管理、会议管理等; (2)系统工程师: 负责所有服务器系统的技术运维工作 负责核心数据库的性能调优及技术运维工作 (3)网络工程师: 负责各种网络设施、线路的技术运维保障工作 负责其他设施的运维保障工作,如机房设施、一卡通、考勤机等智能化设施(4)安全工程师: 负责信息化安全的建设与执行; (5)其他说明事项: 系统工程师、DBA、网络工程师、安全工程师,以下统称运维工程师; 权限控制:除负责基础设施的网络工程师,其余工程师不得拥有进入数据中心机房 的权限。网络工程师不得拥有系统工程师的管理权限。 各岗位周期性工作清单见附一。 四、管理对象 IT基础设施管理对象包括网络、电话、机房、服务器、系统、信息安全等,具体内容如下: (1)网络:XXXX运营中心、JJJJ工业园、WWWW工业园、数据中心、北京办事处的网络建设与维护。 (2)电话:XXXX运营中心、JJJJ工业园、WWWW工业园的电话网络建设与维护。 (3)机房:数据中心机房的建设与日常维护。 (4)服务器:服务器软硬件的采购、建设与日常维护。 (5)系统:操作系统、数据库、应用系统、虚拟化的日常维护。 (6)信息安全:信息安全建设与维护。

系统运维管理 IT基础设施运维管理规范

IT 基础设施运维管理规范 文件编号:运维-002-V1.0 目录 运维管理规范--------------------------------------------- 2 1. 目的--------------------------------------------------- 2 2. 适用范围----------------------------------------------- 2 3. 规范性引用及参考--------------------------------------- 3 4. 本文术语,定义和缩略语--------------------------------- 3 5. 基本要求----------------------------------------------- 4 5.1运维管理原则 -------------------------------------- 4 5.2制度和流程管理 ------------------------------------ 5 5.3 文档管理------------------------------------------ 5 5.4设备和软件管理 ------------------------------------ 5 5.5供应商管理 ---------------------------------------- 5 5.6督促检查 ------------------------------------------ 6 6. 运行维护----------------------------------------------- 6 6.1日常操作及监控分析 -------------------------------- 6 6.2 数据与介质管理------------------------------------ 7 6.3机房管理 ------------------------------------------ 7 6.4 网络管理------------------------------------------ 8

系统运维管理系统-计算机信息系统运营和维护管理系统要求规范

信息服务管理规范 计算机信息系统运营和维护管理规范

前言 《信息服务管理规范》依据《ISO/IEC20000:2005“信息技术——服务管理”》标准,及其它国家和行业相关法律、法规制订。本规范为《信息服务资费标准》的引导性文件。《信息服务管理规范》分为10部分: 第一部分:总则 第二部分:计算机信息系统集成管理规范 第三部分:计算机信息系统运营和维护管理规范 第四部分:软件服务管理规范 第五部分:数据加工和处理管理规范 第六部分:内容和增值服务管理规范 第七部分:数据库服务管理规范 第八部分:电子商务服务管理规范 第九部分:信息化工程监理规范 第十部分:其它专业类服务管理规范

目录 前言------------------------------------------------------------ 2目录------------------------------------------------------------ 3第三部分计算机信息系统运营和维护管理规范----------------------- 5 1 适用范围-------------------------------------------------- 5 2 规范性引用文件-------------------------------------------- 5 3 定义和术语------------------------------------------------ 5 3.1 服务台---------------------------------------------- 5 3.2 事件------------------------------------------------ 6 3.3 问题------------------------------------------------ 6 3.4 突发事件-------------------------------------------- 6 4 要求------------------------------------------------------ 6 5 运营和维护服务类型---------------------------------------- 6 5.1 基础服务-------------------------------------------- 6 5.2 性能优化服务-------------------------------------------- 7 5.3 增值服务------------------------------------------------ 7 6. 运营和维护服务内容--------------------------------------- 7 6.1 基础服务内容---------------------------------------- 7 6.2 性能优化服务内容----------------------------------- 11 7 服务台管理--------------------------------------------------- 13 7.1 服务台功能----------------------------------------- 13 7.2 服务台流程----------------------------------------- 14 7.3 优先级--------------------------------------------- 14 8 运营和维护管理体系--------------------------------------- 15 9. 运营管理------------------------------------------------ 16 9.1 运营管理目标--------------------------------------- 16 9.2 需求分析------------------------------------------- 16 9.3 运营计划------------------------------------------- 16

系统运维管理资产管理规范

系统运维管理资产管理规范 版本历史 编制人: 审批人: 目录 一、要求内容.................................................... 二、实施建议.................................................... 三、常见问题.................................................... 四、实施难点.................................................... 五、测评方法.................................................... 六、参考资料.................................................... 一、要求内容 a)应编制并保存与信息系统相关的资产清单,包括资产责任部门、重要程度和所处位置等内容; b)应建立资产安全管理制度,规定信息系统资产管理的责任人员或责任部门,并规范资产管理和使用的行为;

c)应根据资产的重要程度对资产进行标识管理,根据资产的价值选择相应的管理措施; d)应对信息分类与标识方法作出规定,并对信息的使用、传输和存储等进行规范化管理。 二、实施建议 编制各部门的信息资产清单可以了解各部门信息资产的管理情况,同时也是信息资产风险评估的基础,资产清单记录的内容越详细对资产的管理越有帮助;对于信息资产的管理同样需要建立管理制度,内容应包括资产的分类、分级、标识、使用、保管等内容。 三、常见问题 多数企业没有信息资产的清单,没有单独针对信息资产管理的要求。 四、实施难点 在信息资产管理初期需要对员工进行适当的培训使之了解哪些资产属于信息资产,对信息资产的安全管理有哪些好处。 五、测评方法 形式访谈,检查。对象安全主管,资产管理员,信息资产清单,信息分类分级文档,资产安全管理制度。 实施 a)应访谈安全主管,询问是否指定信息资产管理的责任人员或部门,由何部门/何人负责;

信息系统运维管理制度

信息系统运维管理制度 为了规范公司信息系统的管理维护,确保系统硬、软件稳定、安 全运行,结合公司实际,制定本制度。制度包括信息机房管理、服务 器管理、信息系统应用管理、信息系统变更管理、信息系统应用控制。 一、信息机房管理 1、硬件配备及巡检 1.1、各单位信息机房按规定配备防静电地板、UPS、恒温设备、温湿度感应器、消防设备、防鼠设施等相关基础设施。 1.2、各单位机房管理人员应定期(如每月或每季度)对机房硬 件设备设施进行巡检,以保证其有效性。 1.3、各单位机房应建立相关的出入登记、设备机历登记、设备 巡检、重大故障等记录,并认真填写。 2、出入管理 2.1、严禁非机房工作人员进入机房,特殊情况需经信息中心批准,并认真填写登记表后方可进入。 2.2、进入机房人员应遵守机房管理制度,更换专用工作鞋。 2.3、进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。

3、安全管理 3.1、操作人员随时监控中心设备运行状况,发现异常情况应立 即按照应急预案规程进行操作,并及时上报和详细记录。 3.2、未经批准,不得在机房设备上随意编写、修改、更换各类 软件系统及更改设备参数配置; 3.3、软件系统的维护、增删、配置的更改,必须按规定详细记 入相关记录,并对各类记录和档案整理存档。 3.4、机房工作人员应恪守保密制度,不得擅自泄露信息资料与 数据。 3.5、机房内严禁吸烟、喝水、吃食物、嬉戏和进行剧烈运动, 保持机房安静。 3.6、严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如U盘、移动硬盘等),做到先杀病毒后使用。 3.7、机房严禁乱拉接电源,应不定期对机房内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。 4、操作管理 4.1、机房的工作人员不得擅自脱岗,遇特殊情况离开时,需经机房负责人同意方可离开。 4.2、机房工作人员在有公务离开岗位时,必须关闭显示器;离开岗位1小时以上,必须关闭主机及供电电源。 4.3、每周对机房环境进行清洁,以保持机房整洁;每季度进行一次大清扫,对机器设备检查与除尘。

运维管理办法(完整资料).doc

【最新整理,下载后即可编辑】 运维管理办法 目录 1.总则 (3) 2.系统运维管理办法 (3) 3.数据库运维管理办法 (3) 4.备份运维管理办法 (3) 5.巡检管理办法 (3) 6.请示报告制度 (4)

1.总则 第1条为了加强运行维护管理保障业务系统稳定可靠地运行,制定本运行维护基本管理办法。 第2条实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计 好的程序进行。 第3条完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。 2.系统运维管理办法 1.指定专人作为系统管理员,对系统的运行、管理、维护和 安全负责,并按照规定负责系统和数据的备份与恢复。 2.定时对系统进行监控和健康性检查,分析系统运行和资源 使用情况,进行必要的优化、调整和修正,及时消除隐患。 3.及时处理系统运行过程中出现的异常问题和软硬件故障, 并采取必要措施,最大限度的保护好系统数据。 4.具有系统权限人员调离工作岗位或离职,应立即修改其保 管的用户密码,或删除该用户。 3.数据库运维管理办法 1.对数据库的变更必须有记录,并且可以回滚。 2.无用表和字段要及时清理 3.数据库进行修改、删除数据时要提前备份 4.设置对数据库的自动备份,以便在发生故障时,能尽快恢 复数据,并定期检查备份计划的执行情况。 5.指定专人定期进行备份数据的恢复校验。 6.做好数据库操作审计,以便对操作有据可查。

4.备份运维管理办法 4.1.目的 建立有效的数据备份和恢复机制,确保各系统备份工作按照计划正常完成,保证各应用系统的数据安全。 4.2.备份制度 1.正式使用的应用系统、操作系统日志、数据库系统、网络 配置等信息必须定期进行有效备份且具有可复原性。 2.备份数据必须定期、完整、真实有效的转储到永久性介质 上,并且明显标识。 3.定时检查备份文件中是否存在备份失败的记录,如果有失 败记录,需要检查故障原因,并进行排除。 4.备份计划设置要满足业务对数据安全性的要求 5.巡检管理办法 5.1.目的 定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。 5.2.巡检基本要求 1.对硬件设备进行定期巡检,是确保系统稳定运行的重要措 施,巡检工作包括例行巡检、节假日和重要事件前的巡检 2.维护人员应根据工作计划,对维护的设备定期进行预防性 巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要

运维部门管理规范(201111)

运维部门管理规范 v1.0.201403 一、组织结构 运维部门组织结构图 组织结构说明: 运维部门,下设三个室:数据库管理室、硬件管理室、应用系统管理室; 原技术支持部下维护组成员,根据实际职责分工以及技能特点,分别转入到数据库管理室、硬件管理室及数据库管理室中,详见“附:运维中心编制人员规划”。 二、部门和主要岗位职责 2.1.部门职责 1)根据项目需要,整理项目硬件配置,进行询价; 2)新平台的网络架构设计、硬件配置、系统施工; 3)公司各平台系统、数据库日常维护; 4)负责保障全公司所有平台的系统、数据库、网络稳定安全运行; 5)协助业务单位实施平台的重大升级/割接;

6)各平台信息安全扫描,系统漏洞修复; 7)技术支持质量检测; 8)协助宽连学院实施技术支持技能提升培训; 2.2.主要岗位职责 ●系统部高级经理 1)负责部门战略规划和目标实现,制定并完善部门管理制度; 2)对公司所有平台的系统、数据库支撑工作总负责,保障所有平台的系统、数据库、网 络稳定安全运行; 3)对业务单位平台的重大升级/割接提供技术指导; 4)牵头公司系统、数据库技术难题攻关工作。 ●系统部系统组技术经理 1)负责公司所有平台的系统、网络支撑工作,保障所有平台的系统、网络稳定安全运行; 2)牵头或直接解决公司平台的系统、网络方面的问题; 3)协助业务单位实施平台上系统、网络方面的重大升级/割接; 4)负责对组内人员进行技术指导; 5)协助技术管理部对公司所有平台定期进行信息安全质量检查。 ●系统部数据库组技术经理 1)负责公司所有平台的数据库支撑工作,保障所有平台的数据库稳定安全运行; 2)牵头或直接解决公司平台的数据库方面的问题; 3)协助业务单位实施平台上数据库方面的重大升级/割接; 4)负责对组内人员进行技术指导。 ●系统工程师 1)公司各平台系统日常维护; 2)项目硬件施工; 3)协助各平台实施系统方面的重大升级/割接; ●网络工程师 1)公司各平台网络日常维护; 2)项目硬件施工; 3)协助各平台实施网络方面的重大升级/割接;

相关主题
文本预览
相关文档 最新文档