当前位置:文档之家› 运维故障处理指导手册

运维故障处理指导手册

运维故障处理指导手册
运维故障处理指导手册

一.OLT-上联(同一台OLT下用户故障)

联系网管,协助网管一起处理

●OLT上联口亮

检查OLT至ODF架光纤跳线

检查光衰

协同网管和相关抢修队处理

●OLT上联口不亮

检查OLT至ODF架光纤跳线

检查光衰

协同网管和相关抢修队处理

二.ONU-OLT(同一OLT PON口下用户故障)联系网管,协助网管一起处理

●ONU PON口亮

检查ONU是否注册

检查光衰

协同网管和相关抢修队处理

●ONU PON口不亮

检查ONU与OLT的连接是否正确

联系网管,更换PON口

更换分光器

检查光衰

协助网管和抢修队处理

三.用户端-ONU(同一ONU或交换机下用户故障)1.用户上联端口亮

●交换机上联端口不亮。

检查交换机至ONU连接是否正确。

更换交换机上联端口

更换交换机对应的ONU端口

检查交换机配置

更换交换机至ONU的网线

更换交换机

更换ONU

●交换机上联端口亮

检查交换机至ONU网线

检查交换机端口状态和配置

检查ONU端口状态和配置

更换交换机

更换ONU

2.用户上联端口不亮。

●检查用户电脑网卡至交换机连接是否正确;

●更换上联端口

●更换网线

●更换上联设备

四.用户端

1.用户电脑问题

●错误代码630 ,提示没有合适的网卡或驱动错误原因:硬件错误,可能是网

卡损坏或网卡驱动失效造成,或者未安装网卡解决方法:检查网卡是否工作,

网络线路是否插好,重新安装网卡驱动程序并确定网卡工作正常。

●错误650 问题:远程计算机没有响应,断开连接原因:网卡故障,非正常关

机造成网络协议出错解决:检查网卡,删除所有网络组件重新安装网络。

●错误678 问题:远程计算机没有应答原因:出现此类现象原因很多,主要是

硬件没有正确连接。解决:检查连接是否正确

●错误769 :无法连接到指定目标。问题:这是指你电脑的网络设备有问题解

决方法:打开“我的电脑”→“控制面版”→“网络连接”,查看本地连接的

是否处在“禁用”状态,是的话只需双击本地连接,看到状态变为“已启用”

即可。若是连本地连接都没有的话,重装网卡驱动,如仍未解决,更换网卡。

●使用第三方拨号软件出现故障。解决办法:使用Windows自带的PPPoE拨号

连接。

2.账号问题

●错误691 问题:输入的用户名和密码不对,无法建立连接。原因:用户名和

密码错误,重新输入账号密码尝试,致电客服查询。

3.路由器问题

●电脑直连网络正常,经过路由器后网络故障。错误原因:路由器配置错误或路

由器故障。解决办法:检查路由器配置或恢复出厂值后重新配置:如不能解决

问题,更换路由器。

4.应用问题

先了解用户是否使用了路由器,是否多台电脑共享上网,如果是,则先单机测试

●打不开网页

个别页面,一般是服务器问题或骨干路由问题

如有路由器,单机测试

查看域名解析是否正常

检查DNS设置

检查浏览器设置或更换浏览器

检查病毒

重装系统

●打开网页慢、下载速度慢或观看视频卡(建议携带手提上门)

所有站点都慢

a.单机上网,检查相关设置(代理、线程数、并发数等),检查病毒,PING 网关查看延时和丢包率,查看用户上联端口状态

b.多台共享,单机测试,正常则检查其他电脑是否有病毒,是否在下载或者在观看视频;不正常则按单机上网处理

个别站点慢

建议用户去其他相同类型的网站,如网站具有代表性(多个用户报障)则

上报网管处理。

●游戏卡

检查是否用户端问题(病毒、系统、硬件、路由器、多台电脑上网等)

收集服务器IP地址,路由跟踪等信息,上报网管处理。

●其他应用问题,按网管要求收集正确详细的信息反馈回网管,并协助网管解决。

常见咨询:

1、什么是宽带?

宽带指速率在2M以上的带宽,能完全满足用户对语音、数据、图像、视频等方面应用的需求。鹏博士公司采用光纤传输的以太网接入技术,是目前最成熟、最广泛的接入技术。

2、你们公司是电信还是网通?

我们不属于电信也不属于网通,是独立的一家宽带运营商,不同公司。

3、相较于其他宽带运营商,你们鹏博士宽带有哪些特点?

鹏博士宽带采用的是以太无源光(EPON)接入技术。直接的光纤与双绞线接入,为客户提供高品质的宽带应用服务1.千兆高速带宽,保证用户带宽和业务质量。2、多业务接入,可以为用户提供数据、语音、视频(VOD,IPTV,CATV)的可选组合服务,建立三网合一等综合多媒体的通信业务平台。3、扁平化的网络结构,不仅减少了网络层次,而且优化了网络性能。

4、用鹏博士宽带要不要拨号,怎么样上网?

需要拨号,我司客服工程师在安装时会为您设置好,每次开电脑时您只需要点击宽带连接拨号即可上网。

5、走明线是否会影响家庭装修的美观?

请您放心,鹏博士有很大的用户群体,我们的安装工程师有非常丰富的安装经验。您登记后,我们的安装工程师会先到您家里,对现场的情况进行实地勘察,并根据您的要求,拿出最好的方案,不影响您家庭的装修,保证让您满意。

6、使用鹏博士宽带浏览互联网时,是否收取电话费?

不需要,因为我司上网并没有经过电话交换网接入Internet,只占用宽带网络资源,所以只需交纳使用月租费。

7、你们宽带安装是否很麻烦?

安装我司宽带很方便快速,因为我司是采用的是最流行、最成熟的技术,而

且超五类双绞线比其他传输介质易于安装。

8、我电脑的本地连接怎么出现一个感叹号?

答:请问您是否有连接路由上网,若是单机上网本地连接出现感叹号是正常的,不会影响您上网的正常使用,您只需要用宽带连接拨号即可。

9、新装系统后,我上不了网,怎么办?

您好,这可能与您新装系统后没有重新创建拨号有关。(X P 系统的PP PO E认证)您在电脑网上邻居重新创建一个新连接,再试一下。(其它操作系统详见培训资料——P PP O E认证设置的内容)

10、我们小区也有电信的宽带,他们的网络质量比你们好多啦?

您好,电信的宽带虽然不错,但是他的价格是比我们高的,如果您家用的话使用鹏博士就非常优惠了,性价比服务都是不错的,并且我们免费提供网络报修维护、快速上门处理。

21、我的电脑硬件出问题了,你们帮处理吗?

对不起,我们是宽带网络运营商,您现在反映的是电脑硬件的问题,不属于我们的维护范围,建议您可以先和您购买电脑的销售商联系一下。

22、上网时防火墙总是提示有人扫描用户的电脑,这是为什么?有影响吗?

大多数据情况下,这些数据包不是有人恶意攻击用户的电脑,而有可能是某台电脑中病毒后发出的广播包,也有可能是某些网络爱好者通过工具进行某段IP地址端口扫描,一般情况下,如果该用户已安装了最新的操作系统补丁及防火墙软件,是不会对其上网有影响的,所以不必担心扫描会有什么问题。况且防火墙有这个提示,表示它还是有很强的防御功能,用户电脑是安全的。

23、脱机工作状态下网页不可用是怎么回事,一般有哪些原因造成?

1)IE设置成了脱机工作状态,点击左上角文件—脱机工作(将勾去掉)

2)网站不存在,网站名错误

3)网络不通,需要连接网络

24、XP需要设置拨号连接,右键网上邻居属性没有网络任务也没有创建一个

新的连接,怎么办?

用鼠标右键点击我的电脑—属性—高级—性能的设置—视觉效果—自定义—在文件夹中使用常见任务前面打上勾即可,网络任务跟创建一个新的连接就可在网上邻居显示出来.

25、为什么我的QQ地理位置显示在其他城市?

这是由于腾讯的数据库数据不准确导致的,您实际获取到的IP绝对是所在地的,这种情况可以通过报告正确的地理位置来改正,也可拨打腾讯客服处理。

26、一到晚上你们的网速怎么就慢了,白天速度正常?

由于晚上属上网高峰期,上网的人数增多,例如您打开网页时多人同时访问同一服务器,会造成对方服务器拥挤,便会产生比平时上网速度相对较缓慢的现象,我司提供的带宽是没有改变的。

运维制度及流程

运行维护管理制度 2017年8月

目录3 3 3 5 6 6 7 8 8 9 9

1、总则 第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维部全体人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 3、运维部工作职责 一、负责网站运维和技术支持 (一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。 (二)负责网站栏目和应用系统的使用培训和操作使用指南编

写,对用户使用过程中出现问题的沟通和解决; (三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。 (四)网站设备和软件操作规程和应用管理制度的制定,并负责监督执行。 (五)网站设备和软件安装、调试和验收,使用培训和维修保养。 (六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。 (七)网站技术服务外包管理,主要包括技术外包开发、运行服务托管和空间域名管理。 (八)负责网站管理系统及设备保密口令的设置和保存,保密口令设置后报中心主任备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。 (九)负责网站新程序、新系统和网站改版升级方案技术的设计开发。 二、负责网站信息和技术安全 (一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。 (二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。

运维部服务规范手册V2.1

上海伯乔信息科技有限公司 运维部服务规范手册 @ ~

版本历史 备注 版本/状态作者参与者、 起止日期 2011-8-29创建 、 增加运维流程、去掉部分 2011-9-16 表单 2011-10-12优化板块和界面 文档中特殊符号注解: 表示注解。 表示同个标题下不同项目或步骤 : 目录 目录 1服务文化 (3) 服务宗旨: (3) 服务理念: (3) 2服务总则 (4) 两个愿景: (4) 四项要求: (4) 七大不准 (4) 3运维规范 (5) , 24小时响应机制 (5) 远程排障规范 (5)

服务电话接听流程规范 (6) 接听电话 (6) 上门服务流程规范 (7) 生成上门服务单(见附表1) (7) 上门服务流程规范 (8) 交单归档 (17) 售前技术支持规范 (17) 售前技术支持的准备工作 (18) < 售前工作注意事项 (18) 拜访结束,填写表单 (19) 售前后续工作 (19) 售后培训服务规范 (20) 售后培训环境部署 (20) 售后讲师培训工作规划 (20) 培训体系优化 (21) 运维流程 (21) 4附表 (22) " 1服务文化 1.1服务宗旨: 愈精致、愈宽容、愈贴心

1.2服务理念: 激情、创造、分享、奉献 2服务总则 2.1两个愿景: 用我们的诚心满足客户服务需求,让伯乔客户感动用我们的专业提升客户使用价值,让伯乔品牌增值2.2— 2.3四项要求: 服装整洁,注重仪表 关注客户,真诚服务 操作规范,行为专业 乐于沟通,耐心指导 2.4七大不准 不准对客户的需求置之不理 不准代替客户在服务单据上签名 不准接受客户任何形式的馈赠 不准无故失约 :

公司运维服务规范

某公司运维服务规范 第一章总则 第一条为保障公司运维工作有序开展,规范运维工作和人员的服务要求,避免人为操作不当引起的重大、关健运维事故,根据电信公司及公司维护管理办法要求,特制定本规范。 第二条本规范是公司运行维护管理的基本依据,维护岗位人员必须严格遵照执行。 第三条本规定的最终解释权在技术质量管理部。 第二章适用范围 第四条本规定所指的系统是指公司及各部门承接的运维项目中涉及的范围,按合同约定包括:网络设备、服务器、操作系统、应用系统、数据及保障项目正常运行的各项辅助设施。 第五条本规定适用于对各部门运维分管领导、运维管理员、运维项目经理及成员等各维护岗位人员(包括各部门外包员工)的运维管理要求。 第三章运维服务要求 第六条运维岗位人员要具备良好的工作作风和严谨的工作态度,服从管理,认真负责,坚守岗位,在问题面前不推诿、不拖拉、不盲目、不蛮干,要冷静分析、沉着处理。 第七条遵照公司各项运维管理制度及客户运维工作要求,严格执行维护工作服务规范,确保人员、系统及各项设施安全。具体要求

包括: (一)、基本维护要求 1、遵守客户业务管理和现场管理要求。 2、周期性的维护工作应经客户审批同意后方可实施。 3、因故障修复、功能升级等引起的系统版本升级和割接工作应经客户测试通过后方可实施。 4、未经客户同意,各维护岗位人员不得私自对客户的在线系统进行数据变更、数据统计、应用程序变更、系统参数调整、硬件设备调整。 5、维护外包人员须经业务和管理培训,明确岗位职责,通过部门考核确认后方可上岗。在客户现场以理想公司员工身份执行维护工作,遵循各项运维管理制度。 6、定期检查所维护系统的安全状况,为客户提出合理的预防处理措施。 (二)、故障响应/处理制度 1、遵照公司(故障控制管理办法)要求,在接到故障报修通知后,及时与用户取得联系后进行排障,故障排除后填写故障修复信息。 2、各维护岗位人员应确保通讯工作24小时畅通。 3、严格执行故障处理和处理逐级上报制度。 (三)、信息记录(维护资料管理) 1、建立健全系统维护文档和记录资料库,相关资料由各部门妥

软件系统运维手册(完整资料).doc

【最新整理,下载后即可编辑】 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (4) 4.1系统服务程序的构成 (4)

4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 ..................................................................... 7 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12) 1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服

务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下: 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序:

(完整版)中国铁塔动环常见告警处理指导手册

中国铁塔动环常见告警处理指导手册一、FSU离线告警 告警名称:FSU离线; 告警解释:FSU和铁塔集团平台连接通讯中断; 原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)VPN服务器连接不上;7)SIM卡被盗、欠费或故障。平台处理方法:查询历史告警记录,如频繁离线或长时间离线,需现场检查。 现场处理方法: 第一步检查供电: 1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电; 2)现场检查FSU指示灯不亮设备没有供电。 原因分析:FSU供电异常。 解决方案: 1)检查整个基站是否停电,如停电则通知相关人员取电; 2)检查FSU供电空开是否跳闸及通电线路是否正常。 第二步检查无线模块: 检查无线模块指示灯都不亮或都常亮。

原因分析:无线模块供电异常或无线模块故障。 解决方案: 1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。 2)确认供电正常,则更换无线模块进行测试。 下站建议:下站时建议随身带上一套可以成功拨号的无线网卡和SIM 卡,下站的时候作对比验证,快速确认是SIM卡问题,还是无线模块问题。 第三步FSU检查 通过EISUConfig软件登陆FSU设备,点击设备诊断管理。 1)信号强度弱:通过设备软件登录设备,如信号强度小于15。

解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部) 2)铁塔VPN网络连接异常:铁塔VPN网络提示连接异常 3)铁塔网管未注册:铁塔网管提示连接异常(正常显示连接正常)解决方案: 确认总部平台正常,重启FSU(等待程序连接)。如重启后未恢复,联系厂家专业人员。 平台恢复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。 二、电源配套告警 2.1开关电源类告警: 2.1.1开关电源通信状态告警 告警名称:开关电源通信状态告警; 告警解释:开关电源和FSU之间的通讯中断; 原因分析:开关电源和FSU之间的通讯中断 平台处理方法:无 现场处理方法:检查开关电源屏幕是否显示正常,和FSU的监控线连接是否正常。

故障管理和故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月

目录 第一章目的 (3) 第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9)

第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。 第二章工程运维中心在95013业务维护管理中的职责 a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。

问题与故障处理流程图

NGBOSS3.0系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义 标准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障 管理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通 知故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到 标准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级 至故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。

●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤, 监督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员 现场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过 程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相 关领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。 ●记录问题处理过程,登记故障问题管理列表中的相关处理信息。 ●负责故障处理完成后,整理并填写故障分析报告,并按时提交。 ●总结及优化类似故障的处理步骤,为后续故障处理提供依据。 ●根据故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分 析。

日常运维操作手册汇总

《日常运维操作手册》 ? 一、查看硬盘可用容量 双击“我的电脑”打开资源管理器,右击我们将要查看的盘符。例如:我们要查看D盘,只需要在相关的D盘上右击―属性即可看到如下图1-1所示

图1-1 从上图1-1中可以看出D盘的己用空间为9.66GB,而可用空间仅为109MB。 二、监视系统资源 根据运维报告指示,一般需要对服务器的处理器(CPU)、内存、网卡及IIS等在系统运行过程中表现的性能状况进行监测。 监测指标分析 I D 计数器名称说明 1 %Processor T ime 指处理器执行非闲置线程时间的百分比;通俗一点讲就是CPU使用率。计数器会自动记录当前所有进程的处理器时间。 2 Page/sec 指为解析硬页错误从磁盘读取或写入磁盘的页数(是P ages Input/sec和Pages Output/sec 的总和)。 3 Network Inter face Bytes To tal/sec为发送和接收字节的速率,包括帧字符在内。判定网络连接是否存在瓶颈。 4Current Co nnections 检测WEB服务的用户连接情况。 1.建立性能监测后台运行计数器 1)打开开始-程序-管理工具-性能,找到“性能日志和警报”下的“计数器日志”。

新建一个计数器,右击右边空白区域“新建”,如下图2-1所示. 图2-1 2)在新建计数器日志的名称输入容易理解的名称,如:新性能。下图2-2所示. 图2-2 3)输入计数器名称后,可进入如下图2-3所示图面。其中计数器的日志内容会 在默认情况下记录到“C:\PerfLogs\新性能_000001.blg”下(文件名称的定义后面有详细说明并且可定制)。

运行维护中心作业指导书

运行维护中心作业指导书 (商业、住宅类) 汇编 编制:审核 会签:批准: 发布日期:年月日实施日期:年月日

目录 运行维护人员岗位职责 ------------------------------------------------------------------------------------------------------ 2配电室管理操作规程-------------------------------------------------------------------------------------------------------- 14 弱电系统管理操作规程 ---------------------------------------------------------------------------------------------------- 16 柴油发电机管理操作规程 ------------------------------------------------------------------------------------------------- 19 二次供水管理操作规程 ---------------------------------------------------------------------------------------------------- 22 空调管理操作规程 ----------------------------------------------------------------------------------------------------------- 24 电梯管理操作规程 ----------------------------------------------------------------------------------------------------------- 28 设备设施管理办法 ----------------------------------------------------------------------------------------------------------- 33 给排水系统管理操作规程 ------------------------------------------------------------------------------------------------- 37 装饰装修施工管理办法 ---------------------------------------------------------------------------------------------------- 39 土建维修操作规程 ----------------------------------------------------------------------------------------------------------- 45 水电维修操作规程 ----------------------------------------------------------------------------------------------------------- 50

IT运维手册故障及处理

IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网

①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。

运维手册_数据库_DataGuard日常运维手册

文档标识 文件状态:[] 草稿 [√] 正式发布 [ ] 正在修改 Oracle RAC+DataGuard 运维手册 版本:1.0.0 编制周光晖2015年01月20 审核 批准年月日 生效日期:年月日

修订历史记录 日期版本修订说明作者

目录 第一章引言 (3) **. 编写目的 (3) **. 定义、首字母缩写词和缩略语 (4) 第二章......................................................................................................... D ATA G UARD状态查询4 **. 检查主备库的D ATA G UARD状态信息 (4) **. 检查进程 (4) **. 检查归档状态 (4) **. 检查最后应用的日志S EQUENCE (5) **. 查看是否使用实时应用 (5) **. 检查GAP (5) **. 检查保护模式 (5) **. 相关视图 (6) 第三章................................................................................................................... SWITCHOVER 6 **. 确认主库状态是否支持切换操作 (6) **. 执行主库转换 (7) **. 关闭并MOUNT新备库 (7) **. 确认老备库状态 (7) **. 切换目标备库为主库 (7) **. 打开新主库 (8) **. 启动新备库的日志应用 (8) **. 开启新备库的ADG (8) 第一章引言 1.1. 编写目的 本文档描述了Oracle 11gR2 RAC+ADG操作手册。包含RAC DOWN机测试,日常查询状态,启停RAC等指令同时包含oracle 11g R2 ACTIVE DATAGUARD 的日常维护指令。

系统运维管理制度

系统运维管理制度

运维管理制度 系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。

运维服务能力管理手册

运维服务能力管理手册 Revised at 2 pm on December 25, 2020.

运维服务能力 管理手册 审核:XXX 批准:XXXX 版本.修改号: 受控状态:受控 编号:XXXXX XX年X月X日发布 XX年X月X日实施 XXXXXXXXX有限公司

目录

运维服务能力管理手册发布令 为了进一步提升XXXXXXXXXX有限公司信息技术运行维护服务能力,规范公司信息技术运行维护服务的能力管理行为,进而为客户提供更优质的信息技术运行维护服务,依据信息技术服务相关标准的要求,结合公司自身信息技术运行维护服务能力的实际情况,编制了XXXXXXXXXX有限公司信息技术运行维护服务能力管理手册(简称运维服务能力管理手册)。 本运维服务能力管理手册阐述了公司信息技术运维护服务能力管理的方针和目标,并对公司信息技术运维护服务能力管理体系提出了具体的要求。 本手册适用公司自研和集成产品运维服务(基础环境运维服务、硬件运维服务、软件运维服务)。 本手册是公司信息技术运维服务能力管理的法规性文件,是指导公司建立并实施运维服务能力管理体系的纲领和行动准则,也是公司对所有客户的承诺,具有严肃性和权威性。 本手册按规定的程序编制、审核、批准完毕,准予2015年4月15日起正式发布,即日起生效运行,本公司全体员工必须遵照执行。 总经理:XXXX XX年X月XX日 任命书 依据—2015标准要求,兹任命XXXX先生为本公司信息技术运维服务能力管理体系的管理者代表,其职责和权限为: ?负责组织建立公司的信息技术运维服务能力管理体系,并保持体系的良好运行;

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务就是否正常、查日志就是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但就是原因还未定位。 经理过来了解情况:“系统恢复了不?”、“故障影响就是什么?”、“交易中断了不?”…… 运维人员赶紧敲键盘,写sql,瞧交易量;敲键盘,写命令,瞧系统资源、情况…… 最终,定位到问题原因就是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅就是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案就是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

itop运维综合管理平台使用手册

xxxx运维综合管理平台 操作手册 xxxx(天津)科技有限公司

变更记录

目录 1.平台介绍 1.概述 xxxx运维综合管理平台是为了业务需要进行开发,适用于IT服务的日常运维管理。它基于ITSS最佳实践,适应符合ITSS最佳实践的流程,同时它又很灵活,可以适应一般的IT服务管理流程。 xxxx运维综合管理平台的功能包括: ?记录IT配置项(如服务器、应用程序、网络设备、虚拟机、联系人、位置、VLAN 等)及其各个配置项之间的关联关系; ?管理事件、用户请求和变更审批与执行等; ?归档IT服务及与外部供应商的合约,包括SLA(服务级别协议);

?手动或脚本方式导出所有信息; ?批量导入或同步/联调所有来自外部平台的数据; xxxx运维综合管理平台基于Apache/IIS、MySQL和PHP,它可以在任何支持这些程序的操作平台上运行,如Windows、Linux(Debian、Ubuntu和Redhat)、Solaris和MacOSX 等。此外,由于平台是基于B/S架构的应用程序,不需要在用户电脑上部署任何客户端,只需要一个简单的Web浏览器(IE8+、+、Chrome或Safari5+)即可使用。 2.平台架构 平台架构如下图所示: 图平台架构图 技术架构如下图: 图技术架构图 1.1展示层 平台展现层,即为用户提供了一个统一集中的访问平台,使得用户可以更关注于实际业务,方便企业决策。通过门户技术,每个用户都拥有自己独立的访问视图,方便用户在各个模块和流程之间快速切换,平台提供仪表盘,可以提供用户可以快速查看IT服务健康状况窗口; 图功能展示界面 平台提供五种访问视图,即服务台、自助服务中心、服务管理中心、管理控制台和移动客户端。 ?服务台: -服务目录; -用户咨询投诉; -客户个性化工作流程;

运维部服务规范手册

上海伯乔信息科技有限公司运维部服务规范手册

版本历史 版本/状态作者参与者起止日期备注 2011-8-29创建 2011-9-16增加运维流程、去掉部 分表单 2011-10-12优化板块和界面 文档中特殊符号注解: 表示注解。 表示同个标题下不同项目或步骤 目录 目录 1服务文化 ....................................................... 错误!未定义书签。 服务宗旨:.............................................. 错误!未定义书签。 服务理念:.............................................. 错误!未定义书签。2服务总则 ....................................................... 错误!未定义书签。 两个愿景:.............................................. 错误!未定义书签。 四项要求:.............................................. 错误!未定义书签。 七大不准................................................ 错误!未定义书签。3运维规范 ....................................................... 错误!未定义书签。 24小时响应机制 ......................................... 错误!未定义书签。 远程排障规范............................................ 错误!未定义书签。 服务电话接听流程规范.................................... 错误!未定义书签。 接听电话................................................ 错误!未定义书签。 上门服务流程规范........................................ 错误!未定义书签。

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一 例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、 查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但 是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中 断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化 呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做 “ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、 制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方 案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。

确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或 工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更 等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系 统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更 大部份故障是由于变更导致,确定故障现象后,如果有应的变更,有助于从变 更角度出现分析是否是变更引起,进而快速定位故障并准备好回切等应急方案。 是否可缩小范围 一方面应用系统提倡解耦,一支交易会流经不同的应用系统及模块;另一方面,故障可能由于应用、系统软件、硬件、网络等环节的问题。在排查故障原因时 应该避免全面性的排查,建议先把问题范围缩小到一定程序后再开始协调关联 团队排查。 关联方配合分析问题

itop运维综合管理平台使用手册

xxxx运维综合管理平台 操作手册V1.0 xxxx(天津)科技有限公司

变更记录

目录 1.平台介绍 (4) 1.概述 (4) 2.平台架构 (4) 2.1展示层 (5) 2.2功能层 (7) 2.3技术层 (8) 2.4外部接口层 (8) 1.xxxx运维综合管理平台软件功能 (9) 2.1服务台 (9) 2.2自助服务中心 (10) 2.3配置管理模块 (11) 2.4事件管理模块 (13) 2.5问题管理模块 (17) 2.6变更管理模块 (19) 2.7服务管理模块 (22)

1.平台介绍 1.概述 xxxx运维综合管理平台是为了业务需要进行开发,适用于IT服务的日常运维管理。它基于ITSS最佳实践,适应符合ITSS最佳实践的流程,同时它又很灵活,可以适应一般的IT服务管理流程。 xxxx运维综合管理平台的功能包括: ?记录IT配置项(如服务器、应用程序、网络设备、虚拟机、联系人、位置、VLAN 等)及其各个配置项之间的关联关系; ?管理事件、用户请求和变更审批与执行等; ?归档IT服务及与外部供应商的合约,包括SLA(服务级别协议); ?手动或脚本方式导出所有信息; ?批量导入或同步/联调所有来自外部平台的数据; xxxx运维综合管理平台基于Apache/IIS、MySQL和PHP,它可以在任何支持这些程序的操作平台上运行,如Windows、Linux(Debian、Ubuntu和Redhat)、Solaris和MacOS X等。此外,由于平台是基于B/S架构的应用程序,不需要在用户电脑上部署任何客户端,只需要一个简单的Web浏览器(IE 8+、Firefox 3.5+、Chrome或Safari 5+)即可使用。 2.平台架构 平台架构如下图所示:

(完整版)运维手册(可编辑修改word版)

XX体检系统 维护手册修订记录

XX软件股份有限公司

目录 1概述 (3) 1.1系统结构 (3) 1.2数据库分布 (4) 2运维环境介绍 (4) 2.1服务器配置及端口互通关系 (4) 2.2开发运行环境 (5) 2.2.1数据库 (5) 2.2.2插件(软件) (6) 2.2.3系统运行所需JDK (6) 2.2.4网络 (6) 3基本维护 (6) 3.1业务软件安装 (6) 3.2新增功能页面 (6) 3.3配置文件参数配置 (7) 3.4数据库维护 (7) 4账户信息 (7) 4.1登录服务器 (7) 4.2数据库 (7) 4.3其他问题 (7)

关键词: 摘要:本手册对系统运行环境、主要配置文件、系统新数据录入方法等进行了介绍,说 明了主要运维工作的处理,以及常见问题的处理。 1概述 1.1 系统结构 系统采用的结构描述 业务平台结构图 用户 预约网站、A A P P P P体检系统检验系统影像系统portal bs_tjxt bslis52bs_tjxt_photo

Portal Bs_tjxt bslis52 bs_tjxt_photo 1.2 数据库分布 数据分布图 portal 为门户系统数据库 bs_tjxt 为体检系统数据库 bslis52 为检验数据库 bs_tjxt_photo 为影像数据库 1.3 数据接口 各系统之间的数据调用关系如下图所示: 数据调用关系图 1、体检-检验接口:体检系统登记人员信息,产生检验项目信息与检验条码后,将 这些信息插入 bslis52 数据库里的l_jytmxx 表。检验系统得到检验项目的结果后,生成 结果视图 vi_tj_result,体检系统的项目与该视图结果进行对照后获取检验结果。 2、体检-影像接口: 影像系统体检系统检验系统 bs_tjxt_photo portal bs_tjxt bslis52

现场运维故障处理手册

1现有的低压集抄原理及采集方案 1.1电力线载波通信原理 1.1.1电力线载波(PLC) 电力线载波(PLC)是电力系统特有的、基本的通信方式,电力线载波通讯是指利用现有电力线,通过载波方式将模拟或数字信号进行高速传输的技术。由于使用坚固可靠的电力线作为载波信号的传输媒介,因此具有信息传输稳定可靠,路由合理、可同时复用远动信号等特点,是唯一不需要线路投资的有线通信方式。 1.1.2电力线载波的特点: 1、配电变压器对电力载波信号有阻隔作用,所以电力载波信号只能在一个配电变压器区域范围内传送; 2、三相电力线间有很大信号损失(10 dB -30dB)。通讯距离很近时,不同相间可能会收到信号。一般电力载波信号只能在单相电力线上传输; 3、不同信号藕合方式对电力载波信号损失不同,藕合方式有线-地藕合和线-中线藕合。线-地藕合方式与线-中线藕合方式相比,电力载波信号少损失十几dB,但线-地藕合方式不是所有地区电力系统都适用; 4、电力线存在本身固有的脉冲干扰。目前使用的交流电有50HZ和60HZ,其周期为20ms和16.7ms,在每一交流周期中,出现两次峰值,两次峰值会带来两次脉冲干扰,即电力线上有固定的100HZ或120HZ脉冲干扰,干扰时间约2ms,因此干扰必须加以处理。有一种利用波形过0点的短时间内进行数据传输的方法,但由于过0点时间短,实际应用与交流波形同步不好控制,现代通讯数据帧又比较长,所以难以应用;

5、电力线对载波信号造成高削减。当电力线上负荷很重时,线路阻抗可达1欧姆以下,造成对载波信号的高削减。实际应用中,当电力线空载时,点对点载波信号可传输到几公里。但当电力线上负荷很重时,只能传输几十米。 1.2低压集抄系统方案说明 1.2.1低压集抄系统工作原理 集中抄表系统是指利用微电脑技术,通信技术和数字信号处理技术,通过通信介质自动实现电能量数据采集、存储、传输和处理的系统。根据采用通讯载体的不同,目前主要有专线通信技术、无线通信技术和电力线载波通信技术。 利用电力线作为通信介质实现电力线载波集中抄表系统是完成电力行业自动抄表的最佳解决方案。如图 1 所示,安装在用户电能表侧的采集器模块(采集器)或直接使用的载波电能表,采集并存储电能表数据,并与采集终端或集中器进行双向通讯,集中器再通过GPRS/PSTN/GSM/RJ45 等方式的传输媒介将电能数据发送至系统主站。同时,也可实现手持抄表器对现场电能表、采集器、集中器的数据抄读和参数设置。

相关主题
文本预览
相关文档 最新文档