运维解决方案7x24服务方案
- 格式:doc
- 大小:199.00 KB
- 文档页数:20
平台运维技术服务方案一、方案概述平台运维技术服务方案旨在确保平台运行的稳定性、安全性和高效性,提供全面的技术支持和服务,保障平台的正常运营。
二、平台运维团队建设1. 组建专业的运维团队,包括系统管理员、网络管理员、数据库管理员和安全管理员等。
2. 建立技术服务流程,明确各个岗位的职责和工作流程。
3. 提供系统管理、网络管理、数据库管理和安全管理等的技术培训及定期更新。
三、硬件设备监控管理1. 使用监控软件进行硬件设备的实时监测,包括服务器、交换机、防火墙等。
2. 设立告警系统,及时发现并解决硬件设备出现的故障和异常情况。
3. 定期对硬件设备进行维护和巡检,以确保其正常运行。
四、系统运维管理1. 定期进行系统巡检,包括系统性能监控、系统日志分析等,及时发现并解决问题。
2. 对系统进行安全评估和漏洞扫描,及时修补漏洞,保证系统的安全性。
3. 对系统进行定期备份和恢复测试,以应对可能的数据丢失和系统故障。
五、网络运维管理1. 定期对网络设备进行巡检和维护,包括交换机、路由器等。
2. 对网络流量进行监测和分析,及时处理网络故障和异常。
3. 建立网络安全防护措施,包括防火墙、入侵检测系统等,确保网络的安全。
六、数据库运维管理1. 定期对数据库进行备份和恢复测试,以防止数据丢失和灾难发生。
2. 对数据库进行性能监测和优化,提高数据库的稳定性和响应速度。
3. 建立权限管理机制,限制对数据库的访问权限,提高数据的安全性。
七、安全管理1. 设立完善的安全管理制度,包括访问权限管理、安全策略制定等。
2. 定期进行安全漏洞扫描和评估,及时修补漏洞和强化安全策略。
3. 建立入侵检测和防御机制,及时发现并处理恶意攻击和入侵行为。
八、技术支持和服务1. 提供7x24小时的技术支持和服务。
2. 及时响应用户的问题和需求,并提供解决方案。
3. 定期进行用户满意度调查,改进技术支持和服务质量。
以上即为平台运维技术服务方案的主要内容,通过建立专业的运维团队、定期巡检和维护硬件设备、系统、网络和数据库,加强安全管理和提供高质量的技术支持和服务,可以确保平台的正常运营和用户的满意度。
运行维护方案在本项目上线前,承建单位应承接平台相关系统的运行维护工作,以保障xx市各行政部门在过渡期内各相关系统的正常使用。
1.1运维的必要性平台涉及部门多、业务数据量大,售后服务的运维管理也变的越来越重要。
一旦系统网络、服务器、数据库、各种应用出现问题,而没有及时地得到妥善解决,常常会给企事业造成很大的损失。
因此保障7x24小时设备系统的正常运行,避免各种故障的发生,优化和改进传统的运维模式,提高平台的稳定性就显得非常重要。
1.2运维目标通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。
结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。
将用户的运行目标、业务需求与IT服务的相协调一致。
提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:➢运行状态、故障情况➢配置信息➢可用性情况及健康状况性能指标1.3运维管理内容运维管理包括:(1)故障发现与警报;(2)记录日常运维日志信息;(3)设备故障统计;(4)设备软硬件信息统计;(5)服务进程管理;(6)将数据信息存储备份,并使用图形方式直观的展示出来;(7)服务人员绩效、考核管理;(8)将数据生成报表。
1.4运维管理方式(1)系统承接:和原系统开发商承接现有系统,并了解该系统现有运行模式及其主要功能模块。
(2)故障排查:在平台上线前,若现有的部门系统、基础数据系统、影像平台系统等相关系统发生故障,安排相关人员配合原系统供应商进行问题排查,并做好详细记录。
运维服务保障措施及方案
运维服务保障措施及方案
运维服务是保障企业信息系统正常运行的重要环节,下面是常见的运维服务保障措施及方案:
1. 24小时不间断监控:实施24小时全天候实时监控,通过系
统日志、性能监控和事件监控等手段,及时发现和解决潜在问题,保证系统稳定运行。
2. 定期备份和恢复:定期对服务器、数据库和关键数据进行备份,并且制定恢复策略,确保数据的完整性和可用性。
3. 异常处理和故障排除:对于系统异常、故障或其他问题,及时响应并进行有效的排查和修复,确保系统的可用性和稳定性。
4. 安全防护和漏洞修复:通过定期进行安全漏洞扫描和修复,保障系统的安全性,减少潜在风险。
5. 性能优化和资源管理:监控系统的性能指标,及时进行性能优化和资源调整,提高系统的响应速度和用户体验。
6. 灾备和容灾规划:制定完备的灾备和容灾规划,确保在不可抗力事件发生时,能够快速恢复服务,减少业务中断时间。
7. 人员培训和知识管理:持续对运维人员进行培训,使其具备相关技术知识和能力,提高运维服务水平。
8. 定期安全审计:定期进行安全审计,对系统进行全面检查和评估,及时发现和修复潜在的安全问题。
9. 紧急响应机制:建立紧急响应机制,对重要事件和故障进行及时响应和处置,减少对业务的影响。
10. 定期评估和优化:定期评估运维服务的质量和效果,并根
据评估结果进行优化和改进,提供更好的服务质量。
综上所述,运维服务保障措施及方案是多方面的,包括监控、备份恢复、异常处理、安全防护、性能优化、灾备规划、人员培训、安全审计、紧急响应和定期评估。
只有采取综合性的保障措施,才能保证企业信息系统的稳定运行,提供可靠的服务。
724运维思路
724 运维思路是指在运维(运营和维护)服务中,解决问题和提高效率的思路和方法。
以下是一些常见的724 运维思路:
1. 快速响应:及时响应用户的需求和问题,尽量在最短的时间内解决问题,以提高用户满意度。
2. 自动化和脚本化:使用自动化工具和脚本来简化和加速常见的运维任务,如安装、配置和监控等,以减少错误和提高效率。
3. 监控和预警:建立有效的监控系统,对关键指标进行实时监控,并设置相应的预警机制,及时发现和解决潜在的问题。
4. 故障排除:采用科学的方法进行故障排查,通过日志分析、排查工具等找出问题的根源,并及时采取措施进行修复。
5. 容灾和备份:建立容灾和备份机制,确保关键数据和系统的可用性,以避免灾难性的损失。
6. 安全管理:加强系统和数据的安全管理,包括权限控制、漏洞补丁等,确保系统不受恶意攻击和非法访问。
7. 不断学习和改进:持续学习最新的运维技术和方法,并及时应用到实际工作中,不断改进运维流程和效率。
以上是一些常见的724 运维思路,运维工作需要根据具体情况进行调整和优化,以适应不同的业务需求和技术环境。
运维服务方案一、项目背景随着信息化建设的不断深入,企业对于运维服务的需求日益增长。
运维服务不仅涉及到企业信息系统的稳定运行,还直接关系到企业的业务发展和核心竞争力。
为了确保企业信息系统的高效、稳定运行,提高运维服务质量,我们特制定本运维服务方案。
二、项目目标1. 确保企业信息系统稳定、高效运行,降低系统故障率。
2. 提高运维团队的服务水平和响应速度,满足企业业务发展需求。
3. 优化运维管理流程,提高运维工作效率,降低运维成本。
4. 增强企业信息系统的安全性,防范各类安全风险。
三、运维服务内容1. 服务器运维:包括服务器硬件维护、系统安装与升级、性能监控与优化等。
2. 网络运维:包括网络设备维护、网络监控、网络安全管理等。
3. 数据库运维:包括数据库性能调优、备份与恢复、故障处理等。
4. 应用系统运维:包括应用系统的部署、维护、升级、故障处理等。
5. 信息安全运维:包括安全设备维护、安全策略制定与实施、安全风险防范等。
6. 运维管理:包括运维流程优化、运维团队建设、运维工具支持等。
四、运维服务模式1. 定期巡检:定期对企业的信息系统进行巡检,发现并解决潜在问题。
2. 故障响应:设立故障响应机制,确保在发生故障时,能在第一时间进行处理。
3. 系统优化:根据企业业务需求和系统运行情况,对系统进行优化调整。
4. 定期备份:定期对关键数据进行备份,确保数据的安全性和可恢复性。
5. 安全防护:实施安全防护措施,防范各类安全风险,确保信息系统安全。
五、运维服务团队1. 运维团队由具有丰富经验的工程师组成,具备专业的技术能力和良好的服务意识。
2. 运维团队负责日常巡检、故障处理、系统优化等工作,确保信息系统稳定运行。
3. 运维团队定期接受培训和学习,不断提升团队的技术水平和运维能力。
六、运维服务承诺1. 提供7x24小时不间断运维服务,确保信息系统随时可用。
2. 故障响应时间不超过30分钟,快速处理各类故障。
3. 系统正常运行率不低于99.9%,确保企业业务不受影响。
运维解决方案7x24服务方案项目运维整体解决方案:7×24服务方案一、项目运维服务需求响应1.1、7×24小时维护服务与故障响应承诺我们承诺提供全天候的7×24小时维护服务和故障响应,确保您的业务运行顺畅。
1.2、备件质量保障和质保期限我们提供备件的质量保障,并且保证备件的质保期限符合标准。
我们会在备件使用期限内提供维修和更换服务。
1.3、硬件系统软件7×24小时维护服务我们提供硬件系统和软件的7×24小时维护服务,确保系统的稳定性和可靠性。
1.4、网络快速故障排除服务我们提供网络快速故障排除服务,确保网络故障能够及时得到解决,避免对业务造成影响。
1.5、服务响应流程我们拥有完善的服务响应流程,确保您的服务请求能够及时得到响应和处理。
1.6、专人接口服务我们提供专人接口服务,确保您的问题能够得到专业的解决方案和技术支持。
1.7、软件版本升级和补丁安装服务我们提供软件版本升级和补丁安装服务,确保您的系统能够及时得到更新和修复,提高系统的安全性和稳定性。
1.交付的服务文档本文档主要介绍了我们交付的服务文档,包括各种规范和标准,以及服务流程和操作手册等。
我们将确保这些文档的准确性和完整性,以便客户能够清晰地了解我们的服务内容和流程。
2.项目运维服务承诺2.1 维护服务支持方式我们提供多种维护服务支持方式,包括现场实时技术支持、电话指导支持和远程登录支持。
客户可以根据需要选择适合自己的支持方式,我们将确保及时响应并解决问题。
2.1.1 现场实时技术支持我们将派遣专业的技术人员到客户现场进行技术支持,确保问题能够及时得到解决。
我们将尽最大努力保证技术人员的到达时间和响应时间。
2.1.2 电话指导支持我们提供24小时电话指导支持服务,客户可以随时联系我们的技术支持人员,获得及时的技术指导和支持。
2.1.3 远程登录支持我们将通过远程登录的方式,对客户的设备进行故障排查和解决。
网络安全系统运维服务方案1. 项目背景随着信息化时代的到来,网络安全问题日益凸显,企业及个人数据安全面临着前所未有的挑战。
为了确保我国网络安全,提高网络安全防护能力,减少网络安全隐患,制定本网络安全系统运维服务方案。
2. 项目目标- 提高网络安全意识:提升企业及个人网络安全意识,加强网络安全培训和教育。
- 完善网络安全防护体系:构建全方位、多层次、立体化的网络安全防护体系。
- 降低网络安全风险:定期进行网络安全风险评估,及时发现并整改安全隐患。
- 保障网络安全运行:提供7x24小时的网络安全运维服务,确保网络安全稳定。
3. 服务内容3.1 网络安全评估- 定期进行网络安全风险评估,识别网络安全隐患。
- 根据评估结果,为企业和个人提供针对性的安全防护措施建议。
3.2 安全防护体系建设- 根据企业和个人需求,搭建符合实际需求的网络安全防护体系。
- 包括防火墙、入侵检测系统、安全审计、数据加密等安全设备和技术。
3.3 安全运维服务- 提供7x24小时的网络安全运维服务,确保网络安全稳定。
- 包括安全设备监控、日志分析、安全事件应急响应等。
3.4 安全培训与教育- 开展网络安全培训,提高企业和个人网络安全意识。
- 定期发布网络安全知识普及资料,提醒用户注意网络安全。
3.5 安全合规性检查- 按照国家和行业相关法律法规,对企业和个人进行网络安全合规性检查。
- 协助企业和个人整改不符合规定的安全问题。
4. 项目实施流程1. 项目启动:明确项目目标、范围、时间表等关键要素。
2. 安全风险评估:对企业和个人网络进行安全风险评估。
3. 防护体系搭建:根据评估结果,搭建网络安全防护体系。
4. 运维服务实施:提供7x24小时的网络安全运维服务。
5. 培训与教育:开展网络安全培训,提高安全意识。
6. 合规性检查:定期进行网络安全合规性检查。
7. 项目总结与优化:总结项目经验,不断优化网络安全服务。
5. 项目团队与资源- 项目团队:项目经理、网络安全工程师、安全运维人员等。
网络运维服务方案一、背景随着互联网技术的不断发展,网络运维服务变得越来越重要。
网络运维是指对网络设备进行监控、维护和管理,以确保网络的正常运行和可靠性。
在现代企业中,网络已经成为了各种业务和信息的重要传输通道,因此网络运维服务的质量直接影响到企业的业务连续性和效率。
二、目标本文档旨在制定一套网络运维服务方案,以提供高效、可靠的网络运维服务,确保网络的稳定运行和安全性。
三、服务内容我们的网络运维服务方案包括以下几个主要内容:1. 网络监控和故障排除通过监控网络设备的运行状态、带宽利用率、流量等指标,及时发现并排除网络故障,以确保网络的稳定运行。
2. 网络设备维护和更新定期对网络设备进行维护和更新,包括固件升级、安全补丁安装、配置优化等,以提升网络设备的性能和安全性。
3. 网络安全防护建立完善的网络安全防护系统,包括防火墙配置、入侵检测和防御、恶意软件防护等措施,以保护网络免受各种安全威胁的侵害。
4. 网络优化和性能管理根据网络负载情况和业务需求,对网络进行优化和调整,以提升网络的性能和响应速度。
5. 故障应急和恢复在网络故障发生时,及时采取措施进行快速排除,并确保网络的快速恢复,以最小化对业务的影响。
四、服务流程我们的网络运维服务流程如下:1. 建立初始网络状态基线:对现有网络进行全面评估,了解网络设备、拓扑结构以及性能瓶颈等情况,建立初始网络状态基线。
2. 设定运维计划:根据网络的特点和需求,制定网络运维计划,包括监控策略、维护计划等。
3. 实施网络监控:部署监控系统,监控网络设备的运行状态、性能指标等,并及时发现并处理异常情况。
4. 进行预防性维护:定期对网络设备进行维护和更新,包括固件升级、安全补丁安装、配置优化等。
5. 处理故障和恢复:及时响应网络故障,采取快速排除措施,并确保网络的快速恢复。
6. 性能优化和调整:根据网络负载情况和业务需求,对网络进行优化和调整,以提升网络的性能和响应速度。
项目运维整体解决方案7×24服务方案目录一、项目运维服务需求响应 (3)1.1、7*24小时维护服务与故障响应承诺 (3)1.2、备件质量保障和质保期限 (3)1.3、硬件系统软件7*24小时维护服务 (3)1.4、网络快速故障排除服务 (3)1.5、服务响应流程 (4)1.6、专人接口服务 (5)1.7、软件版本升级和补丁安装服务 (5)1.8、交付的服务文档 (5)二、项目运维服务承诺 (7)2.1 、维护服务支持方式 (7)2.1.1、现场实时技术支持 (7)2.1.2、电话指导支持 (7)2.1.3、远程登录支持 (7)2.2、故障响应服务 (8)2.3、备品备件及设备维护 (8)2.4、软件升级服务 (8)2.5、设备移机服务 (8)三、项目运维巡检服务 (10)3.1 巡检频率 (10)3.2 检查支持方式 (10)3.3 巡检服务内容 (10)3.4 巡检维护的方法和步骤 (12)3.5 巡检报告 (12)3.6 巡检流程 (13)1.2.7 巡检流程说明 (13)四、设备清单及运维价格................................................................................错误!未定义书签。
4.1、设备清单:.......................................................................................错误!未定义书签。
4.2、运维价格:.......................................................................................错误!未定义书签。
一、项目运维服务需求响应1.1、7*24小时维护服务与故障响应承诺公司提供7*24小时的硬件现场服务和热线电话支持。
当发生故障时,中心立即备案,并将响应时间控制在10分钟以内,同时派经验丰富的系统维护工程师在初步判断故障部件后,携带备件在规定的时间内到达硬件故障现场,进行故障检测、定位、维护与排除,尽快恢复贵方业务系统正常运行。
如果故障在短时间内无法排除,我公司将提供备机,恢复贵方业务系统正常工作。
技术服务中心对整个过程有专人负责跟踪,负责工程师汇报整个处理过程与进展,直到问题解决。
1.2、备件质量保障和质保期限1)、新更换的硬件享有一年的质保期,在质保期间发生故障,将免费更换;2)、更换以后的备件,在质保期间,将享有与保修设备同样的维护服务;3)、更换的备件均为原厂生产,具有使用的合法性和可靠性。
1.3、硬件系统软件7*24小时维护服务技术支持中心除提供全天硬件服务外,还提供7*24小时的电话及现场服务软件维护服务。
1.4、快速故障排除服务1.一般性故障对于不影响甲方业务工作的一般性故障,工程师将首先向用户提供故障热线支持服务。
其方式包括通过电话进行技术支持和远程登录。
为了加快对客户故障申报的响应,以最短的时间解决问题,一直致力于提高服务响应速度,加强服务手段功能的开发与投入。
如果远程支持不能解决问题,则根据双方协商,在指定时间内到达现场,尽快解决故障问题。
2.网络瘫痪崩溃情况排除如果网络瘫痪崩溃或系统故障已导致业务工作已不能正常进行,工程师将在接到故障报告后将立即向用户提供电话支持服务,并根据用户要求及实际情况以最快的速度提供现场维护服务。
可以保证4小时内做出实质性响应。
1.5、服务响应流程技术响应中心(Call Center)是技术中心面向客户的7X24小时售后技术服务部门,它是7X24小时电话支持中心,7X24小时全天候都有座席(接线员)和工程师值班为客户服务,并且是售后技术服务的统一窗口,技术响应中心设在北京,对客户进行技术服务,并且根据客户故障问题的情况调动技术中心全国资源来解决客户的问题。
技术支持体系向客户提供三级的售后技术服务支持,统一客户技术服务窗口,利用热线电话、Web、Email、传真受理方式对客户进行技术服务,及时响应以及解决客户的问题。
客户有问题可以通过热线电话、Email、传真、Web网站与技术响应中心联系,座席(7X24小时)负责接听技术服务电话、受理客户问题,进行记录,分类并转给相应的工程师处理。
值班工程师(7X24小时)负责处理座席分配的Case,当工程师需要技术支持时,可以从技术中心或实验室得到技术支持和实验支持,当Case需要进一步的技术支持时,可以使用技术中心公共资源(例如技术专家)处理Case和现场支持,当Case还需要进一步的技术支持时,可以向原厂商申请技术支持。
1.6、专人接口服务指定专人作为热线响应的补充,以备在紧急情况或不方便拨打热线时,仍能对用户的各种要求迅速作出响应,接口人包括项目经理和主要技术负责人、本项目网络调试实施工程师,联系方式在项目启动阶段提供给客户。
1.7、软件版本升级和补丁安装服务将及时获取原厂发布的版本更新或者补丁程序等,如果适合用户的情况,应该及时做好升级举措。
但在升级和打补丁之前,要对必要的系统数据做好备份,防止异常情况发生。
1.8、交付的服务文档《故障问题处理报告》在每次解决完故障后有相应的故障问题处理报告,每季度向用户提供当期所有的故障问题处理报告和问题汇总。
《重要事件支持报告》发生重大事件或遇到客户重要事件(如在进行重大系统调整与重大保障活动等)现场支持后会向用户客户提交《重要事件支持报告》,报告格式与《故障问题处理报告》相同。
《售后服务满意度调查表》为了提高我们的服务质量,我们在每个季度(或半年)对服务过的客户征询对故障或问题处理的满意度调查,全面了解最终客户对我们热线支持、项目管理、备件响应、远程及现场技术支持等方面的意见和建议,以便于我们可以向用户提供更好的服务。
《技术服务单》工程师每一次的现场服务都会在客户现场填写《技术服务单》,列明本次支持服务的内容,以及处理结果。
如果有遗留问题,还会记下问题特征和建议,交由客户签字确认。
客户可以现场复印相应的《技术服务单》,每半年(或一年)总结时向用户客户提供当期所有的《技术服务单》,以便存档备案。
二、项目运维服务承诺2.1 、维护服务支持方式2.1.1、现场实时技术支持1.系统设备投入使用后,将按照用户要求为用户提供技术人员进行现场运行维护;承诺提供7*24的技术设备维护服务,提供保修期后的技术设备成本价优惠维修及维护服务;2.用户系统进行扩容、升级或大规模迁移时,将派技术人员到现场协助工作。
2.1.2、电话指导支持工程师接到客户的服务请求后,一般通过电话获得客户的问题反馈,并根据问题的复杂程度,相应采取电话指导支持、或远程登录支持、或现场支持进行处理。
电话指导支持是指工程师通过电话方式指导客户进行操作,就可完成故障的恢复或问题的解决。
电话指导支持是一种及时、有效的服务支持渠道,适用于问题的定位较容易且不需要更换部件,特别是当客户的系统出现故障需要立即进行处理、而工程师不能马上到达的情况。
2.1.3、远程登录支持远程登录支持是指经客户授权,在确保客户系统安全的前提下,工程师通过远程登录方式登录到客户系统上,就可完成故障(或问题)的诊断、排除及解决。
远程登录为工程师提供了虚拟现场的环境,因此,在不需要更换部件情况下,远程登录支持与现场支持的效果是一样的。
远程登录支持是一种高效、快捷的服务支持渠道,适用于问题的定位较复杂且电话指导不能解决,特别是当客户的系统出现故障需要立即进行处理、而工程师不能马上到达的情况。
2.2、故障响应服务接到用户要求时为用户提供相关的技术咨询;保证售后服务与技术支持工作。
所有承诺的服务要求在用户提出后,将保证在30分钟内响应,如果需要,将在6小时内到达用户现场;2.3、备品备件及设备维护在保修期内,维保供应商将免费为用户提供备品备件,为用户免费更换相应的设备;在保修期外,对于用户的故障设备,我们将为用户更换相应设备。
更换设备的费用,按当时设备的价格优惠提供。
同时,为应付用户的紧急情况,我们将当场提供相应的设备进行更换,能在故障发生后最短内完成备件的响应,直到更换来新设备为止。
我们建有完备的用户档案,记录设备运行情况,以便于随时跟踪了解用户的使用状况。
2.4、软件升级服务在设备开通后,如发生系统应用软件或设备固件扩展升级等情况,我们将负责现场升级和向用户提供必要的技术资料。
如果网络系统软件有所改进,均将为用户提供最新版本免费使用。
软件升级服务的方式有远程升级和现场升级两种,我公司将首先考虑远程升级,在远程升级不能完成升级任务的情况下,将安排技术人员现场升级服务。
2.5、设备移机服务在用户网络设备扩容及系统升级时,将派技术人员到现场协助完成相关工作。
客户设备需要移机,我公司技术人员将负责协助客户进行设备移机服务。
在远程指导不能完成移机情况下,安排技术人员现场协助客户进行设备移机服务。
三、项目运维巡检服务3.1 巡检频率在维护服务期间,我公司制定专门的巡检方案和计划,巡检计划如下:1、定期现场巡检每半月现场巡检一次,2、不定期现场巡检除了定期巡检外,在一些重要项目、时段和特殊情况,根据贵方的需求,增加:不少于50人/天的驻场服务。
3、沟通与访问:经常与贵方保持沟通,了解新的需求并提供技术咨询服务。
3.2 检查支持方式1、现场巡检我司一般采取现场巡检方式,也就是工程师定期到客户现场对保修设备的硬件、系统软件及中间件进行预防性的检查维护。
2、远程巡检为增加巡检频度,可采取远程登录方式进行巡检,或由客户系统管理员按照我司制定的巡检脚本和巡检步骤进行现场巡检,而我司工程师根据客户的巡检结果进行分析,并做出巡检报告发给客户。
3.3 巡检服务内容公司的工程师定期到现场对保修设备进行全面的检查,及时发现故障(或问题)的隐患,并排除系统故障或调整系统性能,必要时更换故障部件,同时做好设备的保养工作等,主要内容如下:硬件部分➢系统运行环境检查,包括机房温度、湿度和零地电压、零火电压等➢设备连接状况检查➢系统硬件运行情况检查➢系统运行状态、性能检查和优化,包括CPU、内存和交换区使用情况,内存和网络的IO情况检查➢设备指示灯状态检查➢设备电源、风扇、温度检查➢设备除尘处理➢检查如发现有隐患的部件将及时更换系统部分➢系统版本时效性检查;➢随时关注系统补丁情况,及时打补丁;高可用部分在巡检维护服务中,对高可用性设备主备集群进行详细检查,并进行模拟故障测试,以确保在发生故障的情况下保证备机能够正常接管主机的工作。
主要内容如下:➢ HA配置情况检查➢ HA心跳工作情况➢ HA主备侦测情况系统日志和信息检查➢查看设备事件日志(Log);➢查看攻击日志➢查看设备报错信息➢查看接口信息有无错误信息3.4 巡检维护的方法和步骤1、运行环境与网络设备状态检查➢电源环境:电压,零地电压,UPS功率及电源的状态,断电保护时间等➢空调数量及状况➢运行环境:检查机房内的温、湿度检查➢检查电源线及接线插座是否安全可靠,并符合主机连接要求➢网络设备物理状态检查,具体包括电源、风扇状态、LED状态灯检查等。