运维服务工具应用情况说明
- 格式:doc
- 大小:144.50 KB
- 文档页数:10
系统运维工作说明书及售后服务承诺、]2017年11月目录1 概述 (1)服务范围和服务内容 (1)服务目标 (1)2系统现状 (1)应用系统 (1)系统功能 (1)3服务方案 (3)系统的软件bug修复 (3)业务流程 (3)3.. 流程说明 (3)定时备份xxxxxxx系统的业务数据 (4)备份业务流程 (4)备份业务流程说明 (4)按需更新xxxxxxx系统(不包含系统迁移) (5)更新流程 (5)更新业务说明 (5)及时处理xxxxxxx系统的异常数据 (6)异常数据处理流程 (6)异常数据处理说明 (6)及时解决xxxxxxx系统的咨询或培训 (7)系统咨询或培训流程 (7)系统咨询或培训说明 (7)4服务响应 (8)日常服务响应时间 (8)事故分级响应服务时间 (8)服务报告 (9)运维保障资源库建设 (9)项目管理 (9)1 概述服务范围和服务内容本次服务范围为XXXXX有限公司XXXXXX系统,软件系统位于?XXXXXXX机房内,服务内容为XXXXXX应用软件系统的系统运维工作,不包括服务器操作系统的运维及网络运维、专业安全服务等。
服务目标及时修复xxxxxxx系统的软件bug定时备份xxxxxxx系统的业务数据按需更新xxxxxxx系统(不包含系统迁移)及时处理xxxxxxx系统的异常数据及时解决xxxxxxx系统的咨询或培训2系统现状应用系统xxxxxxx系统等日常工作均在基于内网在不同应用系统上得以实现,其中优惠券类业务需要外网权限。
OS端是安卓系统,应用服务器是使用的centos系统,客户端使用的windows 和安卓系统。
系统功能xxxxxxx系统L2级系统运维的内容如下。
3服务方案 系统的软件bug 修复业务流程微信营销及支付系统bug 管理流程修复阶段提交bug验证阶段跟踪阶段关闭bug启云星航延长壳牌提交bug判断是否为系统bugBug 修复内部验证验证bug 关闭bug是否再现开始结束3.. 流程说明xxxx 公司(以下简称甲方)业务人员在实际业务的进行中,按照正常操作步骤进行操作,出现异常情况,请立即通过邮件的方式告知启xxxx 公司(以下简称乙方)。
系统运维年度服务报告范文模板及概述说明1. 引言1.1 概述本篇文章旨在撰写《系统运维年度服务报告》,对过去一年的系统运维服务进行全面回顾和总结。
通过该报告,我们将详细介绍我们团队在系统运维方面所做的工作,并展示我们在提高稳定性、提升效率、优化用户体验等方面取得的成果。
1.2 文章结构本文主要分为三个部分:引言、正文和结论。
引言部分将概述本篇文章的目的和结构安排,正文部分将从服务概览、运维工作亮点和持续改进措施三个方面详细描述过去一年的工作内容,结论部分将总结回顾我们的成果,并展望未来发展。
1.3 目的编写此份年度服务报告有以下几个目的:首先,向公司内外相关人员展示我们团队过去一年来在系统运维方面所做的努力和取得的成就;其次,总结过去一年中存在的问题和挑战,并分享针对这些问题所采取的改进措施;最后,为未来项目规划提供参考意见,并表达对合作伙伴及相关人员的诚挚感谢与歉意。
通过本份年度服务报告,我们希望能够让读者更好地了解我们团队的工作情况,同时也希望这份报告能够为其他运维团队提供一定的借鉴和启示。
让我们一同回顾过去,展望未来!2. 正文:2.1 服务概览在过去的一年里,系统运维团队为公司提供了全面的服务支持。
我们主要负责保障公司所有的信息技术系统正常运转,并及时响应和解决各类技术问题。
本节将对过去一年的服务概况进行总结。
首先,我们维护并更新了公司内部所有关键系统的硬件设备和软件版本,确保其安全性、可靠性和高效性。
我们采用了定期巡检、监控等手段,以及灵活的维护计划,使得系统故障率得到明显降低。
其次,在系统运行自动化方面,我们加强了日常例行操作的自动化程度。
通过引入自动化工具和脚本编写,例如使用Ansible来配置服务器环境、使用Jenkins 进行持续集成等方式,大大提高了工作效率,并减少人为因素带来的错误。
另外,在容量规划方面,我们根据业务需求和历史数据分析预测,对存储资源、网络带宽等进行合理规划和调整。
【版权声明】©2015-2016 腾讯云版权所有本文档著作权归腾讯云单独所有,未经腾讯云事先书面许可,任何主体不得以任何形式复制、修改、抄袭、传播全部或部分本文档内容。
【商标声明】及其它腾讯云服务相关的商标均为腾讯云计算(北京)有限责任公司及其关联公司所有。
本文档涉及的第三方主体的商标,依法由权利人所有。
【服务声明】本文档意在向客户介绍腾讯云全部或部分产品、服务的当时的整体概况,部分产品、服务的内容可能有所调整。
您所购买的腾讯云产品、服务的种类、服务标准等应由您与腾讯云之间的商业合同约定,除非双方另有约定,否则,腾讯云对本文档内容不做任何明示或模式的承诺或保证。
文档目录文档声明 (2)登录Windows云服务器 (4)Windows机器登录有公网IP的Windows云服务器 (4)控制台VNC登录Windows云服务器 (7)外网登录无公网IP的Windows云服务器 (10)Windows格式化数据盘 (13)Windows云服务器数据盘分区和格式化 (13)Linux重装为Windows后读取原EXT类型数据盘 (40)Windows环境配置 (42)安装配置IIS及PHP (42)配置高性能电源管理 (67)正版激活 (69)系统更新 (72)更新 Virtio 网卡驱动 (76)关机相关 (79)WIndows恢复模式 (82)Windows2003系统续用 (84)Windows 云服务器修改SID操作说明 (87)Windows程序安装 (89)上传文件到Windows云服务器 (89)登录Windows云服务器Windows机器登录有公网IP的Windows云服务器1. 获取云主机管理员帐号及初始密码登录到云服务器时,需要使用管理员帐号和对应的密码。
用户购买云服务器后,会通过消息中心的通知消息,告知用户管理员账号及初始密码。
管理员账号:服务器的操作系统不同,管理员帐号也会不一样,如下所示:SUSE/CentOS/Debian:rootWindows:Administratorubuntu:ubuntu初始密码:初始密码由系统随机分配,一个订单对应的服务器有一个初始密码,请及时修改密码。
关于*******管系统运维总结一、系统情况说明:1、“系统部署设备数量、类型”填报该系统所配置设备数量(服务器、存储、接口机等需管理设备)2、“系统故障类型”系统故障类型分:硬件环境故障(设备、断网等)、软件系统配置异常故障、数据差错率等。
若有补充,请补充说明。
二、20**年运维情况报告1、本系统运维主要工作内容(1)每天以远程和访问的形式检查应用服务器、数据库服务器等其它服务器是否运行正常、备份数据库并写每天的日志《工作日志xls》和填写每天的《日常检查.xlsx》、每周会总结工作写周报等记录每日工作的内容,以确保系统及相关设备运行正常。
(2)随时根据******中心和各个地市出纳的情况,对相关部门人员和单位机构进行调整,尤其是新增加和调动的**人员。
对于市公司出纳提出的需求和系统性问题,提交公司进行评估并找到好的方法进行解决。
(3)根据***提供的信息,对一些需在监管系统增加***等情况,与***沟通并按照***的要求进行调试。
(4)每年*********制定出新的预算指标和相关要求,需跟***和***运维进行沟通,对相应的***和***进行调整。
(5)解决各个地市出纳在日常工作中遇到的业务问题、单据问题等各种问题和提供一些有效的处理方法,尤其是金额比较大的业务,要经过和***沟通后进行相应处理。
对地市出纳提出的小需求进行相关配置。
2、20**年运维工作量化说明(1)运行保障:每天检查应用服务器、数据库服务器其它服务器是否运行正常、备份数据库等信息确保系统相关设备运行正常。
(2)故障排除:在系统系统遇到登录问题、相关设备出现异常进行排除。
(3)技术支持、系统优化和业务应用支持:根据机房电力维护情况,对相关服务和机器进行技术支持;解决日常业务问题、单据支付问题和提供一些有效的处理方法;根据公司的更新补丁情况,按期对系统进行打补丁。
(4)运维日志及报告记录:每天以远程和访问的形式检查应用服务器、数据库服务器、密码服务器、五家银行前置机是否运行正常、备份数据库并写每天的日志《工作日志.xls》和填写每天的《日常检查.xlsx》、每周会总结工作写周报等记录每日工作的内容。
信息技术服务运行维护服务能力成熟度符合性评估实施细则为做好ITSS.1-2015《信息技术服务运行维护服务能力成熟度模型》(以下称《运维服务能力成熟度》)的符合性评估工作,提高信息系统运行维护服务能力,保证信息系统运行维护服务质量,中国电子工业标准化技术协会信息技术服务分会(以下称ITSS分会)依据《信息技术服务标准(ITSS)符合性评估管理办法(试行)》等规定制定本实施细则。
一、适用范围(一)本实施细则原则上仅适用于信息技术服务供方单位的《运维服务能力成熟度》符合性评估;(二)《运维服务能力成熟度》分为四个等级,即基本级(以下称四级)、拓展级(以下称三级)、改进(协同)级(以下称二级)、提升(量化)级(以下称一级),四个等级的符合性评估都应符合本实施细则的要求。
二、组织管理(一)ITSS分会负责组织《运维服务能力成熟度》符合性评估活动,并确认符合性评估结果;(二)行业级评估机构在全国范围受理《运维服务能力成熟度》一、二、三、四级的符合性评估申请。
地方级评估机构在本地区受理《运维服务能力成熟度》三、四级的符合性评估申请;(三)一、二、三级申请单位应选择一名独立评估人员作为评估组成员参与评估活动。
三、申请条件(一)申请一级的单位应具备下列基本条件:1、具有独立法人地位;2、已按照《运维服务能力成熟度》一级特征和关键指标建立了运维服务能力体系,且已有效运行六个月以上;3、能够提供运维服务能力管理、人员、资源、技术和过程等有效证据;4、持有《信息技术服务标准ITSS符合性证书》(运维服务能力成熟度二级)满一年以上。
(二)申请二级的单位应具备下列基本条件:1、具有独立法人地位;2、已按照《运维服务能力成熟度》二级特征和关键指标建立了运维服务能力体系,且已有效运行三个月以上;3、能够提供运维服务能力管理、人员、资源、技术和过程等有效证据;4、持有《信息技术服务标准ITSS符合性证书》(运维服务能力成熟度三级)满一年以上。
设备运行维护工作总结汇报尊敬的领导和各位同事:我很荣幸能够在这里向大家汇报我们设备运行维护工作的总结情况。
在过去的一段时间里,我们团队经过不懈努力,取得了一定的成绩,也遇到了一些挑战。
在这篇文章中,我将对我们的工作进行总结,并提出一些建议,希望能够得到大家的支持和帮助。
首先,让我们来看一下我们在设备运行维护方面取得的成绩。
在过去的几个月里,我们团队积极响应公司的号召,加强了设备的日常维护工作。
我们严格执行维护计划,及时清洁和润滑设备,确保设备的正常运行。
同时,我们也加强了设备的故障排查和修复工作,及时处理了一些设备故障,保证了生产的顺利进行。
此外,我们还对设备进行了定期的检查和保养,确保设备的安全性和稳定性。
通过我们的努力,设备的故障率得到了明显的降低,生产效率也有了一定的提升。
然而,我们也面临着一些挑战。
首先,由于设备的老化和磨损,一些设备的维护工作变得更加繁重和复杂。
其次,人力和物力资源的不足也给我们的工作带来了一定的困难。
最后,一些员工的维护意识和技术水平还有待提高,需要我们加强培训和指导。
为了进一步提高设备运行维护工作的效率和质量,我提出以下几点建议。
首先,我们需要加强设备的日常维护工作,确保每一台设备都得到充分的关注和维护。
其次,我们需要加强对员工的培训和技术指导,提高他们的维护意识和技术水平。
最后,我们需要加强设备的更新和改造工作,逐步淘汰老化设备,引进先进设备,提高设备的稳定性和可靠性。
总之,设备运行维护工作是一项重要的工作,关系到生产的稳定进行和企业的发展。
我相信在大家的共同努力下,我们一定能够进一步提高设备的运行效率和可靠性,为企业的发展做出更大的贡献。
谢谢大家!。
软件运维服务服务评价表格-范文模板及概述示例1:标题:软件运维服务评价表格引言:随着企业在日常运营中越来越依赖于软件系统,软件运维服务的重要性也日益凸显。
为了评估软件运维服务的质量,我们需要一个评价表格,用于收集并分析用户对软件运维服务的体验和反馈。
在本文中,我们将介绍一个综合而实用的软件运维服务评价表格,帮助企业客观评估软件运维服务的各个方面。
评价表格的构建:软件运维服务评价表格是一个多维度的工具,包含了以下几个关键方面:1. 反馈数据收集:- 用户基本信息:包括姓名、联系方式等,用于识别用户身份;- 服务时间:记录用户使用软件运维服务的具体时间段;- 问题描述:用户遇到的具体问题以及其表达的清晰度;- 解决方案:软件运维团队提供的解决方案的准确性和有效性;- 响应时间:软件运维团队对用户问题的响应速度;- 满意度评分:用户对软件运维服务整体满意程度的评分。
2. 问题分类:- 稳定性:软件运维服务是否保持稳定的运行状态;- 故障处理:软件运维团队针对问题进行的解决和处理能力;- 预防措施:软件运维团队对潜在问题的预防和提前处理能力;- 服务质量:软件运维团队提供的服务质量和用户体验;- 问题跟踪:软件运维团队对用户问题跟踪和反馈的能力。
3. 评分标准:- 分数范围:每个问题分类都可以根据评分标准给出0-10的分数;- 权重调整:可以根据需求调整各个问题分类的权重,以反映其在整体评价中的重要性。
结论:软件运维服务评价表格是一个非常有用的工具,可以帮助企业客观评估软件运维服务的质量,并为软件运维团队提供改进的方向。
通过收集和分析用户的反馈,软件运维团队可以了解客户的需求和痛点,并提供更好的解决方案。
随着对软件运维服务的评价改进,企业可以提高软件系统的稳定性和用户满意度,从而更好地支持业务发展。
示例2:软件运维服务服务评价表格评价项目评分(1-10)备注1. 服务响应时间- 快速响应用户请求- 处理问题所耗时间- 及时处理紧急情况2. 技术能力及专业性- 对软件系统的了解程度- 解决问题的水平和效率- 提供专业建议和指导3. 服务态度和沟通能力- 主动沟通和及时反馈- 回应用户问题的准确性- 与用户间的沟通和合作能力4. 故障排除和问题解决- 迅速定位故障原因- 解决问题的能力和方法- 对故障修复的持续跟进5. 系统性能和稳定性- 系统的运行效能和稳定性- 针对性能优化的建议和措施- 系统故障频率和稳定性评估6. 服务报告和文档- 提供详细的服务报告和文档- 文档的完整性和准确性- 报告和文档的格式和交付方式7. 物料配送和备件管理- 及时提供所需备件和物料- 物料配送的准确性和保密性- 备件库存和管理的及时性8. 服务费用和合同管理- 合同条款和费用明细的清晰性- 服务费用的透明度和合理性- 合同管理和续签的方便性请根据以上评价项目,给出相应的评分并在备注栏中添加任何附加信息或具体例子。
ITSS但要及各科级对照一、什么是ITSSITSS(Information Technology Service Standards 信息技术服务标准,简称ITSS)是国内第一套成体系和综合配套的信息技术服务标准库,全面规范了IT服务产品及其组成要素,用于指导实施标准化和可信赖的IT 服务。
ITSS是在工业和信息化部、国家标准化管理委员会的联合指导下,由国家信息技术服务标准工作组(以下简称:ITSS工作组)组织研究制定的,是我国IT服务行业最佳实践的总结和提升,也是我国从事IT服务研发、供应、推广和应用等各类组织自主创新成果的固化。
ITSS的内容即主要包括一系列标准,是一套完整的IT服务标准体系,包含了IT服务的规划设计、部署实施、服务运营、持续改进和监督管理等全生命周期阶段应遵循的标准,涉及咨询设计、集成实施、运行维护、服务管控、服务运营和服务外包等业务领域。
其主要依据原理如下:ITSS充分借鉴了质量管理原理和过程改进方法的精髓,规定了IT服务的组成要素和生命周期,并对其进行标准化。
包括:IT服务的组成要素,包括:人员(People)、流程(Process)、技术(Technology)和资源(Resource),简称PPTR。
IT服务的生命周期,包括:规划设计(Planning & Design)、部署实施(Implementing)、服务运营(Operation)、持续改进(Improvement)和监督管理(Supervision),简称PIOIS二、什么是运维服务能力成熟度模型自2009年ITSS工作组成立后,开展了一系列标准研制工作,并于2012年发布了《信息技术服务运行维护》(GB/T 28827)系列标准,并开展了运行维护服务能力符合性评估认证。
但为了解决运维服务企业的能力水平参差不齐、对运维服务供应商进行差异化评价、及协助企业依据自身业务需求建立运维服务能力管理体系等问题,ITSS工作组于2014年编制了《信息技术运行维护能力成熟度模型》,运维服务能力成熟度模型将运维服务能力划分为四个等级,依次是基本级、拓展级、改进(协同)级和提升(量化)级,分别用四、三、二、一表示,保持与计算机信息系统集成企业资质的划分方式一致。
设备运行维护工作总结汇报尊敬的领导和各位同事:
我很荣幸能够向大家汇报我们设备运行维护工作的总结情况。
在过去的一段时间里,我们团队经过不懈的努力和合作,成功地完成了各项设备的运行维护工作,确保了设备的正常运转和生产效率的提高。
首先,我们对设备进行了全面的检查和维护,及时发现并解决了一些潜在的问题,避免了设备故障对生产造成的影响。
我们采取了定期保养和检修的措施,确保设备的稳定性和可靠性,最大限度地延长了设备的使用寿命。
其次,我们注重了设备运行数据的收集和分析,通过对数据的监测和分析,我们能够及时发现设备的异常情况,并采取相应的措施进行调整和修复,提高了设备的运行效率和生产质量。
最后,我们还加强了设备操作人员的培训和技能提升,提高了他们对设备运行维护的技术水平和责任意识,确保了设备的安全运行和生产的顺利进行。
通过我们团队的不懈努力和合作,设备运行维护工作取得了显著的成绩,为公司的生产经营做出了积极的贡献。
但同时,我们也意识到还存在一些不足和问题,我们将进一步加强团队合作,完善设备维护工作制度,提高设备维护效率和质量,为公司的发展贡献更大的力量。
最后,我要感谢团队成员们的辛勤付出和努力工作,也要感谢领导和各位同事对我们工作的支持和鼓励。
我们将继续努力,为公司的发展做出更大的贡献。
谢谢!。
运维服务工具应用情况说明编制:
审核:
****公司
二〇一四年一月
版权所有:****公司。
保留所有权利。
目录
序言 (4)
一、运维管理类工具的应用情况 (4)
1.1 400客服故障业务受理系统 (4)
1.1.1系统业务介绍 (4)
1.1.2系统功能及原理 (5)
1.2 知识库管理工具 (6)
1.2.1系统业务介绍 (6)
1.2.2系统功能介绍 (7)
二、监控、系统维护类工具的应用情况 (8)
2.1指挥调度系统监控平台 (8)
2.2硬件系统监控工具 (9)
2.3程控交换机维护工具 (9)
三、其他运维及故障检测工具 (10)
3.1示波器 (10)
序言
****公司产品广泛应用于****单位的指挥中心,提供特服电话的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服电话受理系统的涉及范围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。
正是在这种情况之下,特服电话指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。
一、运维管理类工具的应用情况
运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。
1.1400客服故障业务受理系统
1.1.1系统业务介绍
“400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的电话业务受理系统,该系统通过硬件及软件实现对客户电话的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分:
1)故障业务电话排队接入受理系统
2)后台业务流转通信平台
3)故障受理、登记系统
4)二级分配、处理系统
5)数字录音录时子系统
6)查询、统计、分析系统
7)用户处理情况回访系统
8)故障业务跟踪系统
1.1.2系统功能及原理
1、故障业务电话排队接入受理系统
故障业务电话受理子系统是应运维系统的门户和语音呼入呼出的通道,其稳定性和可靠性以及系统的接入速度应该作为设计的重点来考虑。
2、后台业务流转通信平台
后台业务流转通信平台是400客户故障受理系统的核心平台之一,所有消息流及数据的流转均需要通过该平台进行传送,因此公司将该平台设计为热备份系统,已保证系统的稳定及客户服务的不间断性。
3、故障受理、登记系统
客户报障电话呼入后,系统将电话自动分配至空闲座席,受理人员接通客户电话后,系统将自动弹出相应的受理单,受理单中的报障人呼入电话号码及录音号将自动填写如受理单。
受理人在询问客户基本信息及故障情况后进行受理单的录入,包括故障种类、故障情况、发生时间等等,如受理人员能够在电话中当场为客户解决故障的,则受理人员需在系统中填写相应的反
馈内容,包括处理方法、处理结果等信息,如受理人员无法即时解决的,则通过二级分配、处理系统将该受理单发送至二级受理部门,二级受理部门包括客服中心、项目履行部、开发部等。
4、二级分配、处理、反馈系统
一级受理人员在接收到客户的报障电话并进行登记后,如不能在第一时间为客户排除故障的,则需要根据具体情况将报障记录通过二级分配系统分配至其他相关部门,由其他部门根据报障单的内容进一步与客户进行沟通,判断故障的原因及处理,如有必要则需安排人员携带相关备品备件至用户现场进行维修,在处理完毕后需通过二级反馈系统进行及时的处理情况反馈。
二级系统包括系统登录、业务单接收、业务单反馈等功能。
1.2知识库管理工具
1.2.1系统业务介绍
➢知识库使信息和知识有序化,是知识库对组织的首要贡献
建立知识库,必定要对原有的信息和知识做一次大规模的收集和整理,按照一定的方法进行分类保存,并提供相应的检索手段。
经过这样
一番处理,大量隐含知识被编码化和数字化,信息和知识便从原来的混
乱状态变得有序化。
这样就方便了信息和知识的检索,并为有效使用打
下了基础。
➢知识库加快知识和信息的流动,有利于知识共享与交流
知识和信息实现了有序化,其寻找和利用时间大大减少,也便自然
加快了流动,使有效的知识能够迅速传遍整个企业,这就使人们获得新信息和新知识的速度大大加快。
➢知识库还有利于实现组织的协作与沟通
公司的知识库可将员工的建议存入,员工在工作中解决了一个难题或发现了处理某件事更好的方法后,可以把这个建议提交给一个由专家组成的评审小组,评审小组对这些建议进行审核,把最好的建议存入知识库,知识库中注明建议者的姓名,以保证提交建议的质量,并保护员工提交建议的积极性。
➢知识库可以帮助企业实现对客户知识的有效管理
运维部门的信息管理一直是比较复杂的工作,一般老的运维人员拥有很多宝贵的信息,但随着他们负责项目的转变或工作的调动,这些信息和知识便会损失。
因此,知识库的一个重要内容就是将运维项目的所有信息进行保存,以方便新的运维人员随时利用。
1.2.2系统功能介绍
知识库系统中包含了知识地图、我的订阅、我的知识、知识排行、全文检索、知识管理等分支内容。
各分支模块中主要功能:
➢知识地图
➢我的订阅
➢我的知识
➢知识排行
➢全文检索
➢知识管理
二、监控、系统维护类工具的应用情况
2.1指挥调度系统监控平台
在系统中建立完善的监控体系,便于对整个系统进行管理和维护。
提供良好的人机管理界面,能够迅速定位故障结点,应用程序提供完整的故障日志,以便及时发现故障并进行快速维护排除故障;
公司为了便于客户及客服人员能够及时了解系统运行情况,判断系统故障所在,是系统故障能够得到及时、准确的处理,缩短系统的故障时间,在系统架构中开发了监控平台,监控平台的监控范围涵盖了系统的主要核心部分及终端部分,系统中的某一环节一旦出现故障,监控系统将会对相关故障部分做出报警提示,并初步判断故障的原因。
监控系统主要包括以下部分内容:
1、系统鉴权登录部分
完成授权系统管理、监控员的登录,由于监控系统可对系统的运行服务进行控制,因此要求必须有维护权限的操作员方可登录该系统
2、系统核心设备及软件监控部分
特服电话呼叫指挥中心的核心系统包括数字程控排队交换机、数据库、后台通信平台等,这些核心系统一旦出现故障将严重影响系统的稳
定性,监控系统可分类对核心系统进行即时监控。
另系统中如果增加了核心部件的备份或业务分担冗余节点,在监控
系统中也可以增加对这些冗余节点的监控,确保冗余节点的可用性,避
免造成即使有备用系统,但在主用系统出现故障是,备用系统无法接替
主用系统工作的现象。
3、系统性能监控及告警
监控系统可对平台内所有的服务器及终端设备进行性能监控,包括CPU、内存、硬盘等的使用情况监控,并针对不同的应用设定不同的告
警阈值,当系统运行过程中监控组件超过阈值后系统即产生告警,告知
系统维护人员关注,告警界面如下图所示:
4、后台通信平台监控
5、系统服务控制
系统一旦发生故障后,维护人员如判断为终端服务出现故障,或其他系统故障可通过重启计算机服务来解决的,则可以利用系统监控平台
及时对故障终端进行服务的控制,停止或重新启动相应的服务,以达到
解决故障的目的。
2.2硬件系统监控工具
公司生产的部分硬件产品中增加了故障告警判断、搜集及发送模块……
2.3程控交换机维护工具
排队程控交换机作为公司的核心产品……
1、线路连接状态的跟踪及告警
2、信令跟踪
3、历史数据查询
三、其他运维及故障检测工具
3.1示波器
公司配备了电子示波器,用于对排队程控交换机、联动控制设备等系统硬件设备进行故障检测及判断的辅助工具。
公司在系统运维、故障监控及故障处理中应用了大量的硬件及软件辅助工具,规范了客户故障申报的处理、跟踪过程,增强了系统运行的稳定性、故障预判能力、故障及时处理能力,提高了客户的满意度。