当前位置:文档之家› 运维自动化平台白皮书

运维自动化平台白皮书

运维自动化平台白皮书
运维自动化平台白皮书

运维自动化平台白皮书

目录

一、概述 (3)

二、功能介绍 (3)

1.平台整体功能 (3)

2.安装部署 (4)

3.配置更新 (4)

4.任务执行 (4)

5.监控报警 (5)

6.巡检管理 (5)

三、技术特点 (6)

1.Python语言开发 (6)

2.融合云计算平台 (6)

3.规则知识库 (6)

4.标准RESTful API (6)

5.运维控制台 (6)

一、概述

本产品为运维自动化平台,集安装部署、配置更新、任务执行、监控报警、巡检管理等功能为一体,将运维管理员的经验和运维工具有效的结合,引入丰富的运维规则库,辅助管理员完成日常运维工作。

运维自动化平台立足于传统的数据中心架构,也能更好的支持Openstack 等框架下的私有云平台和公有云平台,做到传统运维和云运维的结合。其设计原则是“平台化、模块化、松耦合、全开放”,以平台化、模块化实现工具集成、功能聚合,改变原有运检工具分散独立运行的现状,将运维工作全部整合在统一的平台中,并且各模块均提供标准化接口,满足模块化、松耦合的原则,可以与其他系统的功能模块方便地集成;其核心是从配置管理着手,配合监控工具,对各类应用系统进行从基础资源的部署到应用发布,再到运行维护的全生命周期的管理,最终实现运维的自动化、可视化、智能化。

二、功能介绍

1.平台整体功能

(1) 权限管理

目前的权限管理主要指对平台的普通用户可使用的运维功能模块进行管理,由管理员统一进行权限的管理。如用户A只拥有安装部署的权限,则其他的权限对用户A来说是隐藏的。

(2) 用户管理

管理员对平台的普通用户进行增加、修改和删除的操作,也可以由使用者自己注册平台用户,并申请权限。注册功能可以启用或者禁用。

(3) 通知管理

用户可以接收到平台运行中发生较严重的事件,在平台使用界面的菜单栏中可以查看。

(4) 规则库管理

平台中的每个模块都需要建立规则库,以支撑运维操作的执行。目前规则库分散到各个模块中独立管理。

2.安装部署

本功能主要分为两部分,一是实现对物理机的操作系统的推送和自动化安装,二是实现在目标操作系统上实现对中间件、数据库及其他软件的自动化安装、更新及卸载。

平台可以自动发现需要安装操作系统的物理服务器,然后再根据预先在模板库中定义的系统镜像来安装操作系统,支持主流的操作系统,如Ubuntu、Redhat、CentOS等。

安装软件需要从“软件商店”中选择,将软件和主机进行关联,实现对应操作系统的软件的安装及卸载。安装方式支持从软件源中安装,也支持自定义软件包安装。对传统的物理环境、Openstack私有云以及公有云提供全面的支撑,有效减少企业内部基础设施环境的差异化。

3.配置更新

平台提供丰富的配置更新管理功能,实现自动化修改目标主机的配置文件并使之生效。支持操作系统的配置文件,例如:hosts;也支持应用程序的配置文件,例如:sshd_config。

配置更新包括两个角度的实现:配置参数的修改以及配置文件的替换。配置参数的修改可以对多数的配置文件进行修改,完成参数的新增、更新以及删除;而复杂格式的配置文件目前只能通过配置文件的替换完成,该功能将替换掉原有的配置文件。

4.任务执行

统一运维自动化平台能通过简单的操作在平台上完成对指定节点的命令行或脚本任务的创建与执行。任务执行模块主要分为三个子模块完成相应的功能,分别是:规则库、运行记录与统计分析。

用户在规则库中自定义名称、规则描述和需要执行的脚本命令,定义好后在平台上创建一个任务,选择指定的节点和指定的脚本模板,提交后后端程序立即执行或周期性执行任务,执行结束后平台会将任务执行的结果和自动化处理的结果反馈给用户。

用户在查询任务执行结果时,能鲜明的查看到结果与对应的脚本详情,包

括名称、状态、命令、节点和创建时间等,并且,如果一个脚本对多个节点执行,平台可以让用户选择查看全部结果或者是单条结果,单条结果即为某一个节点上的任务执行情况,可以根据用户的需求进行相应的选择。

在任务执行模块,每一个任务在执行后,后端都会对其进行统计分析,平台会实时将所有的任务执行的数量情况,以天为单位,反映到折线图上,用户可以在网页上随时进行查看与分析。

5.监控报警

运维自动化平台采集服务器节点的性能数据和状态数据,以及数据库、中间件等的运行数据,生成监控图表,并根据预设策略,以短信、邮件方式发出报警信息。

对数据的监控,首先需要定义监控规则、监控项及监控模板。监控项定义了需要采集的监控数据,在定义的过程中需要设置一些属性。监控模板定义了监控项的集合。

对监控功能的管理,包括管理服务器节点的监控项,监控模板及触发器,可以关闭对某个节点的监控功能。当应用监控项后,就可以采集节点上这个监控项的数据。监控模板采集节点上多个监控项的数据。触发器可以根据监控项的数据在某种情况下触发事件。

平台还需要维护报警策略和报警对象。报警策略的定义,主要通过与触发器的关联来实现。告警方式包括短信告警和邮件告警,需要有邮件网关和短信网关,才能发出告警信息。报警对象包括联系人及联系人组。

6.巡检管理

对主机的巡检管理,获取巡检对象的状态和性能数据,对系统的运行状态进行检查,并生成巡检报告。包括以下内容:

巡检规则。用户在执行巡检任务前,需要自定义巡检规则,即如何对软件或硬件进行巡检。比如定义巡检的项目和阈值、巡检的策略、需要配置部署的软件等。规则是由脚本组成,支持shell脚本和python脚本。

巡检任务制定。巡检任务分为手动执行和自动执行两种。手动巡检在创建完巡检任务之后立即执行,而自动巡检在巡检执行周期自动执行,用户可以根据需要灵活设定。

巡检报告。手动巡检和自动巡检在结束后将巡检结果存储在数据库中,用户可以在界面中查看到结果,并输出巡检报告。

三、技术特点

1.Python语言开发

平台的前端和后端统一采用Python语言进行开发。严格来说,Python是一门脚本语言,但由于其拥有非常多的模块以及优秀的Web框架,使其成为设计开发运维平台的首选。

2.融合云计算平台

本产品在开发技术选择上和架构的设计上,考虑了与Openstack、Cloudstack等目前流行的开源云计算平台的融合,可以很好的支持云平台上的虚拟主机的自动化运维工作,可以将资源申请和运维工作更加的流程化、自动化。

3.规则知识库

运维平台需要维护规则知识库,将运维人员的实际运维经验总结成规则知识库,并通过自动化的方式,完成运维操作。

规则知识库以Shell脚本或Python脚本的方式规定了实际动作,如通过哪种方式完成软件的安装,怎么收集巡检数据等。随着平台使用的深入以及知识库中规则的积累,运维自动化平台的运行会更加的稳定,功能会得到更多的实现。

4.标准RESTful API

平台提供的运维功能均提供标准的RESTful API,方便与其他系统进行集成,以及做二次开发工作。

5.运维控制台

运维自动化平台的控制台采用与开源云计算平台Openstack相同的技术,即Python的Django框架、Bootstrap样式和AngularJS库实现,充分考虑运维人员的操作习惯和方式,

企业自动化运维平台设计方案

企业自动化运维平台设计方案

目录 1.企业运维现状与发展趋势 (3) 2.企业运维存在的问题与需求 (3) 2.1运维人员的工作效率与工作主动性需要提升 (4) 2.2需要建立一套高效的运维机制 (4) 2.3缺乏高效的运维技术工具 (4) 3.业务流程标准化与健全运维管理制度 (5) 3.1实现业务流程标准化,为自动化运维打好基础 (5) 3.2建立完整、全面的运维管理制度,为自动化运维的实现保驾护航 (8) 4.自动化运维技术路线选型 (9) 4.1自动化运维概述 (9) 4.2开源运维工具的应用场景与优势 (9) 4.3Saltstack 实现服务器部署的自动化 (14) 5.自动化运维方案设计 (18) 5.1自动化运维规划图 (18) 5.2自动化运维平台模块设计 (20) 6企业自动化运维方案总结 (21)

1.企业运维现状与发展趋势 随着企业信息化的不断发展,运维人员需要面对越来越复杂的业务和越来越多样化的用户需求,不断扩展的应用需要越来越合理的模式来保障运维服务能灵活便捷、安全稳定地持续。某企业从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低运维服务成本的因素越来越被人们所重视。其中,自动化开始代替人工操作在企业的运维过程中逐渐体现出来了强大的优势。 运维随着企业业务的发展,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。通过自动化运维能最大限度地在更少的维修时间内实现运维目标,提高运维服务质量。因此, 对于越来越复杂的运维来说,将人工操作逐渐改变为自动化管理是一个重要发展趋势。 2.企业运维存在的问题与需求 某企业初期只有文件共享和邮件服务等几台服务器,运维工作完全由人工操作,随着企业的发展,新业务系统不断上线企业建设了中心机房,运维工作还是以人工为主,但是这一阶段增加了网络管理系

运维监控管理平台建设方案(参考)

IT运维监控管理平台 建设方案 XXXXXXX

目录 第1章概述 (4) 1.1 建设背景 (4) 1.2 建设目标 (4) 1.3 建设思路 (5) 第2章系统总体设计 (6) 2.1 总体架构 (6) 2.2 设计原则 (7) 2.3 运维管理体系架构设计 (8) 2.3.1 系统总体架构设计 (8) 2.3.2 监控采集层 (9) 2.3.3 数据处理层 (9) 2.3.4 运行展现层 (9) 2.4 系统技术路线 (10) 2.4.1 采用Java语言开发 (10) 2.4.2 采用J2EE框架 (11) 2.4.3 采用WebService进行数据互连互通 (11) 2.4.4 数据库技术 (13) 2.4.5 性能控制 (14) 2.4.6 开发、运行环境 (14) 2.5 应用接口总体设计 (14) 2.5.1 系统内部集成接口 (14) 2.5.2 与基础运维管理工具的集成接口 (15) 2.5.3 与ITSM系统的集成接口 (15) 2.5.4 与相关外部系统的统一身份认证与单点登录接口 (15) 2.6 系统安全设计及部署 (16) 2.6.1 输入检验 (16) 2.6.2 GET请求和Cookie中的敏感数据 (16)

2.6.3 防通过嵌入标记实现的攻击 (16) 2.6.4 防口令猜测功能 (17) 2.6.5 页面和字段级的权限控制 (17) 2.6.6 系统安全架构 (17) 第3章系统功能设计 (18) 3.1 动环监控 (18) 3.1.1 配电柜监测 (18) 3.1.2 配电开关及电流监控 (18) 3.1.3 发电机监控 (19) 3.1.4 ATS监测 (19) 3.1.5 STS监测 (19) 3.1.6 UPS监控子系统 (20) 3.2 统一门户子系统 (20) 3.2.1 信息主管领导内容展示 (21) 3.2.2 运维人员内容展现 (21) 3.2.3 一般用户内容展现 (22) 3.3 IT运行监控子系统 (22) 3.3.1 基础平台功能 (22) 3.3.2 网络设备管理 (24) 3.3.3 服务器监控管理 (27) 3.3.4 存储监控管理 (30) 3.3.5 数据库监控管理 (30) 3.3.6 中间件监控管理 (31) 3.3.7 web与应用监控管理 (32) 3.3.8 虚拟化监控管理 (33) 3.3.9 IP地址管理管理 (34) 3.3.10 信息点管理 (35) 3.3.11 告警监控管理与转发处理 (36) 3.3.12 综合监控管理 (37)

网络安全管理与运维服务

网络安全管理与运维服务 近年来,随着我国信息化建设的不断推进及信息技术的广泛应用,在促进经济发展、社会进步、科技创新的同时,也带来了十分突出的安全问题。根据中国国家信息安全漏洞库(CNNVD)、国家互联网应急中心(CNCERT)的实时抽样监测数据,2013年3月份,新增信息安全漏洞数量比上个月增加了33.9%;境内被挂马网站数量比上月增加17.9%;境内被黑网站数量为7909个,境内被篡改网站数量为9215个,境内被木马或僵尸程序控制主机数量为129万台。面对我国网络信息安全问题日益严重的现状,国家层面在陆续出台相关专门网络信息安全保护法律法规。在各行各业根据不同时代威胁对象及方法的不同,在不断完善自己的安全建设。随着网络系统规模的扩大,各种应用系统不断完善,对各类业务数据的安全提出了新的要求——如何加强网络安全管理?如何使运维服务行之有效? 一、网络管理体系化、平台化 网络安全管理不是管理一台防火墙、路由器、交换机那么简单,需要从以体系化的设计思路进行通盘考虑,需要统一和规范网络安全管理的内容和流程,提升风险运行维护的自动化程度,实现风险可视化、风险可管理、风险可处置、风险可量化。使日常的风险管理由被动管理向主动的流程化管理转变,最终真正实现网络安全管理理念上质的飞跃,初步建立起真正实用并且合规的网络安全管理运维体系。 网络安全管理平台作为管理的工具其核心理念是管理,网络安全管理平台围绕此开展设计,最终形成安全工作的工作规范,通过不断完善的工作规范,通过安全

工作能力的不断提升,通过对工作内容及结果的工作考核,形成安全建设螺旋上升的建设效果。在网络安全管理平台建设上重点考虑如下几个方面的内容: 1)安全资源的统一管理 安全策略是企业安全建设的指导性纲领。信息安全管理产品应能在安全策略的指导下,对与信息安全密切相关的各种资产进行全面的管理,包括网络安全设备(产品)、重要的网络资源设备(服务器或网络设备),以及操作系统和应用系统等。要实现关键防护设备的健壮性检查工作。 2)安全管理可视化 实现安全运维管理服务流程的可视化、结果可跟踪、过程可管理,支持完善的拓扑表达方式,支持可视化的设备管理、策略管理和部署,支持安全事件在网络逻辑拓扑图中显示。信息安全全景关联可视化展示方法和技术,从信息展示逻辑和操作方式上提高可视化的视觉效果,增强系统的易用性和信息的直观性。采用了众多图形化分析算法技术从大量图表数据中揭示更深层次的关联信息和线索。 3)信息安全全景关联模型及方法 各种类型、不同厂家的安全设备得以大规模使用,产生难以手工处理的海量安全信息,如何统一监控、处理这些不同类型的安全信息,如何从这些海量的安全信息中整理、分析出真正对用户有价值的安全事件。通过设计一个基于关联的信息安全事件管理框架,实现安全信息的关联及关联后事件表示,实现安全信息精简、降低误报率和漏报率以及改进报警语义描述,达到增强安全系统间的联系、建立安全信

全面解读一个自动化运维管理平台的开发过程

全面解读一个自动化运维管理平台的开发过程开发环境: 操作系统:Cenots6.6 Web框架:tornado-4.0.2 数据库:mysql-5.1.73 html框架:bootstrap-3.0.3-dist 相关软件包: tornado相关依赖包 backports.ssl_match_hostname-3.4.0.2.tar.gz setuptools-5.7.tar.gz certifi-1.0.1.tar.gz tornado-4.0.2.tar.gz torndb数据库环境需要软件包 MySQL-python-1.2.5.zip torndb-0.2.tar.gz 密码加密软件包: passlib-1.6.2.tar.gz windows客户端远程调试Mysql软件包 Navicat_windows_premium_en.rar 一、登录界面 1月23日开发完成,已经能实现用户登录验证、和退出登录删除cookie 功能、限制不登录无法跳转其他页面。 存在bug 1.密码是用md5加密,然后去群里问有没有有更好的加密方法推荐python passlib库需要后期改进

2.存在问题没有实现用户登录密码输错3次锁定30分钟,网上查阅方法通过记录cookie的方法。后期待改进。 3.登录成功成功后弹出框需要美工美化。 二、用户管理界面 1月24、25两天开发完成。 存在bug 1.创建用户验证表单存在问题,需要单独调试js 2.创建成功、删除成功、编辑成功弹出框需要美化。 3.背景样式需要美工修改,让界面更漂亮。 三、主机管理 具体功能还需要讨论实现、调研具体要实现什么? 审计报表功能?(报表具体事项) 系统监控?(SNMPor自己开发Agent) 主机远程连接服务? (webbash or puppet ....)

运维控制中心白皮书

运维控制中心 白皮书 2013年9月1日

目录 运维控制中心 (1) 运维控制中心——概况 (3) 什么是OCC? (3) OCC由什么构成? (11) 为什么客户需要OCC? (13) 提高业务连续性 (13) 提高业务满意度 (14) 提高IT支持效率 (14) 降低运营成本 (14) OCC是如何工作的? (15) 提供透明化 (15) 解决警报 (18) 持续改进 (20) OCC前提条件 (21) SAP在客户端OCC中的作用 (21) OCC中的关键角色 (22) OCC 团队负责人 (22) IT运维人员 (技术 /功能) (22) 负责业务连续性的质量经理 (23) 负责业务流程优化的质量经理 (23)

运维控制中心——概况 运维控制中心(OCC)是“工厂化运行SAP”的具体体现。OCC能够确保高度自动化及主动的操作,此举能够在降低运营成本的同时提高IT服务质量,从而提高企业满意度。此外,OCC 能够不断推动业务流程的改进和IT支持。运营控制中心与创新控制中心 (ICC) 和SAP任务控制中心 (MCC) 的紧密联系旨在支持这些目标的实现。 图1: OCC,ICC及MCC ICC旨在助力SAP客户实现“工厂化建立SAP”。ICC能够最大程度地使用SAP标准功能,通过端到端的集成验证保护和优化投资,并能够保证上线后平稳无中断的运行。MCC基于SAP在全球各地的办事处,随时准备为客户提供关键支持。图1展示了上述三个控制中心。 在OCC,一组IT运营人员负责SAP生产环境的维护。根据环境和业务流程复杂性的差异,两个运营人员一班制(全职雇员)能够理想地进行环境的维护,通过SLA(服务等级协议)达到4小时内解决业务问题的目标。 什么是OCC? OCC是位于客户现场的IT支持团队,能够积极主动地监控SAP的生产环境(及重要的非SAP应用)。我们建议客户在IT支持部门内设立OCC办公室。图2显示了OCC的外观和整体布局。

服务管理平台产品白皮书

服务管理平台 1产品综述 1.1产品定义 服务管理平台,是将基于服务技术、组件式开发的、独立运行的服务进行统一的接入、统一管理、统一调度,实现异构服务间集成与管理,最终实现所有运行中的服务可以有序、正常、持续的运转。 1.2产品定位 服务管理平台是针对系统庞大、需求持续增加、需求变化较为频繁、接口数目庞大、接口调用频繁,并倾向于使用服务架构系统管理,而提供一体化的服务管理平台。服务管理平台通过集成支撑服务、行业服务、工具服务、中间件服务,对所有的服务进行统一的管理和监控,对上层应用的服务调用提供基础支撑。 2产品核心价值 2.1快捷部署 现有平台,针对单一系统,功能的增加或者原有功能的修改,都需要开发人员重新梳理原有系统接口,并针对每个接口进行调整然后重新测试部署,对开发人员和运维人员都带来不小的负担,开发实施时间长。

服务管理平台正是为解决这一难题而出现的,灵活的服务配置改变原有单模式,将服务按功能或行为划分为响度独立的功能服务,每个服务都可独立部署运行,对外提供统一的服务接口,快速应对用户需求的变化。 2.2强大的服务管理支撑 服务管理平台可接入依照服务模式和灵活的调度策略开发出来的产品模块,实现服务的注册、服务依赖关系的管理、服务的资源目录、服务路由等功能,并可实现服务的计量功能,提供全面化的服务统一管理功能。 2.3一致的服务调用 服务管理平台对接入的服务的运行进行统一的管理,根据服务的调用关系,实现服务运行过程中的降级、熔断等调度功能,最终达到服务能有序、高效、正常的运行。 3产品架构 服务管理平台通过统一网关来接受外部系统的服务调用,并实现服务路由、均衡负载、权限控制等功能。 服务管理平台中的Adapter模块,主要实现第三方服务的接入、具体业务需求的定制和配置管理,以满足不同项目的特定业务和技术需求。

运维管理系统方案

运维管理系统方案 概述 伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要? 因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。 运维管理系统的功能: 故障发现与警报; 记录日常运维日志信息; 服务器故障统计; 服务器软硬件信息统计; 服务进程管理; 将数据信息存储到数据库,并使用图形方式直观的展示出来; 权限、密码管理; 将数据生成报表。 运维管理系统的特点: 邮件和短信实时故障报警; B/S结构,能够通过web对远程服务器下达指令; 监控服务器和被监控服务器之间通过python socket来发送信息; 统计日常故障处理,以便下次出现同样故障时能够更快的解决问题; 实现自动化管理和自动化监控; 安全管理服务器性能; 操作流程统计与管理。

系统结构 运维管理系统采用B/S构架,运维管理人员随时随地可以对服务器进行管理、配置及故障处理。它是将部署在同一个局域网内的所有服务器统一管理,服务器之间的信息通讯、指令发送、运维管理都通过python来实现。监控服务器端负责采集、统计和分析数据,在数据出现异常时发送报警信息到管理员的email、手机中,并将错误日志存储到数据库中。 运维管理系统主要通过LAMP服务器、python编程、snmp和shell编程来实现。在被监控端安装python服务,并在被监控服务器上部署python程序和shell脚本用于接受监控服务器端指令、信息采集并发送会监控服务器端。监控服务器端部署python程序和LAMP服务器,用于发送指令、接受数据信息、存储数据、统计数据以及异常报警。 运维管理人员日常通过web浏览器远程登录监控管理系统,检测各被监控服务器的运行状态、服务状态、防火墙配置、进程信息、操作日志等信息。在出现异常时,通过运维系统可以查看到具体的异常服务器、进程等信息,并根据这些信息来处理异常。

可视化综合运维管理系统白皮书

IT可视化综合运维管理解决方案 SmartView产品 技术白皮书V1.61 目录

一、导论 1.1. 产品背景 IT行业技术突飞猛进地发展,设备集成度不断提高,使各种网络设备之间的界限逐渐模糊,主设备、传输系统、支撑系统之间相互融合,互相渗透,已经逐步向一体化的解决方案迈进。 首先,机房内由设施数量众多,特别是当企业存在分支机构,由于分布范围广,机房内走线将非常复杂,尤其是老机房,如何理清楚设备与设备、设备与系统的拓扑关系,通常是机房维护人员的最为头疼的难题。 其次,对于办公区域,存在大量固定资产、移动办公类设备,这些设备资产的管理常常具有移动性,且各种人为情况较多。办公区域工位与网络也有一定的对应关系,如何找出工位与设备资产、工位与网络端口的对应关系,将能够很大程度上提升并规范企业的IT水平。 此外,当设备出现故障的时候,在相同类型的设备中,如何能快速定位出故障设备,如何真实的通过系统反应出设备环境及周边情况;如何通过系统以往解决过程和系统知识库,提供可参考的解决思路,将能够显着提高运维的自动化程度。 因此,有必要建立一套“集中监控、集中维护、集中管理”的监控系统,实现对企业IT资产实现远程集中监控,实时动态呈现设备告警信息及设备参数;快速定位出故障设备,使维护和管理从人工被动看守的方式向计算机集中控制和管理的模式转变;通过标准的ITIL流程提升企业IT服务效率。 3D仿真是企业IT数字化管理信息化建设的一个重要的组成部分,全三维可视化资源管理与运维监控平台,形象化的虚拟场景和真实数据相结合,通过3维场景能显着增强机房查看与监控,企业办公区域监控,提高设备、设施、资产与流程的直观可视性、可管理型,真正提高企业IT运维管理的效率,让IT真正服务于企业运营。 神州数码针对以上问题推出一套基于生产实景的全3D可视化IT资源管理与运维监控管理平台,形象化的虚拟场景和真实数据相结合,用户在显示屏幕前即可查看到机房中的所有设备,对于日常维护人员对设备的运行监控管理,资产审核人员对设备的盘点

数据中心基础设施智能运维白皮书

数据中心基础设施智能运维白皮书 1 当前大部分数据中心的运维安全依赖于富有经 验、训练有素的运维团队,部分成熟的数据中心 已经开发出完善的运维流程和培训体系,并用以 减小偶发事件及人员变动对运维安全的冲击,少 数先进的数据中心已经在寻求通过数字化、智能 化手段来保障数据中心运维安全的可持续性。本 白皮书划分了从传统运维到智能化运维的5个阶 段,以及每个阶段的典型特征,一 方面,数据中 心的管理人员可以根据这些信息明确当前所处的阶段,以及演进和优化的目标。另一方面,对于处在传统运维阶段的团队,本白皮书介绍了数据中心基础设施可用性管理全景及对应的数字化,智能化措施,利用这些信息,运维团队能更好地规范运维管理,制定智能化运维升级的计划,并能指导运维团队从传统运维向智能运维转型,在智能化运维工具的帮助下,实现运维更高效、更 安全并可持续的业务目标。 简介

数据中心基础设施智能运维白皮书 2 图1展示的是运维从传统运维到智能运维的阶段演进,横 坐标是智能化进展,纵坐标指的是运维流程的完备和复杂 度,在传统运维阶段,智能化手段不多,运维安全主要依 靠运维团队的经验和技能,管理的可持续性则依赖流程制 度,和不断完善培训体系,随着流程制度的不断完善,运 维效率会有所降低,但随着运维团队对流程制度熟练应用 后,效率会有所恢复,在传统运维阶段,存在几个潜在的 误区:1、对运维团队或者个人的过度依赖,往往导致熟练 流程建设及经验积累;2、对流程的僵化使用,最终会导致 运维团队对流程失去耐性,而导致实际运维操作完全偏离 流程本身,因为运维团队需要讲流程跟实际情况结合,在 不影响流程节点结果输出的情况下匹配实际情况,做到这 一点需要运维团队具备丰富的运维经验;3、一些经验丰富、 流程制度成熟的运维团队往往会陷入过于自满的误区,错 误排斥任何智能手段,拒绝对运维效率改善的建议,固执 的认为效率提升必然影响到运维安全。 智能运维阶段,会通过数字化、智能化手段不断的固化和 简化流程,“云化”运维专家,自动化手段取代人力等, 大幅提升运维效率,运维安全不受影响甚至更安全,智能 运维不仅能解决当前数据中心运维人力短缺的困境,还能 通过对流程、经验和技能的不断固化、优化来彻底摆脱数 据中心运维对人和团队的依赖。 数据中心智能运维演进 图1

海康综合监控与运维管理平台V13用户操作手册

min 海康威视iVMS-9300综合监控与运维管理平台 用户操作手册 杭州海康威视系统技术有限公司 2016.3

目录 目录 (1) 第1章前言 (5) 1.1编写目的 (5) 1.2术语和缩写 (5) 第2章平台概述 (6) 2.1环境要求 (6) 2.1.1运行硬件环境 (6) 2.1.2运行软件环境 (6) 2.2用户登录 (7) 第3章运维概况 (7) 3.1视频概况 (11) 3.1.1视频概况 (11) 3.1.2一键运维 (13) 3.2卡口概况 (14) 3.2.1过车统计 (15) 3.2.2资源信息 (15) 3.2.3服务器信息 (15) 3.2.4最新异常信息 (16) 第4章巡检中心 (16) 4.1运行监测 (17) 4.1.1监控点视频 (17) 4.1.1.1 监控点明细查看 (17) 4.1.1.2 视频预览 (18) 4.1.1.3 工单上报 (19) 4.1.1.4 视频质量诊断图片查看 (20) 4.1.1.5 图像重巡 (21) 4.1.1.6 查询导出 (21) 4.1.2录像 (22) 4.1.2.1 录像详情查看 (23) 4.1.2.2 巡检一次 (24) 4.1.2.3 工单上报 (24) 4.1.2.4 查询导出 (25) 4.1.3卡口 (26) 4.1.3.1 卡口信息 (26) 4.1.3.2 异常信息 (28) 4.1.4编码资源 (29) 4.1.4.1 设备详情查看 (30) 4.1.4.2 工单上报 (31) 4.1.4.3 查询导出 (31) 4.1.5解码资源 (32) 4.1.5.1 解码资源详情查看 (33) 4.1.5.2 工单上报 (33)

自动化运维管理解决方案--白皮书

自动化运维管理解决方案

目录 1IT运维管理面临挑战 (3) 2应运而生的自动化解决方案 (5) 3自动化应用场景 (7) 3.1灾备切换自动化 (7) 3.2故障现场快照 (8) 3.3批量设备操作处理 (8) 3.4周期性作业调度 (9) 3.5应急处理流程 (9) 3.6重要配置备份、基线比对 (10) 4产品简介 (12) 4.1运维脚本集中管理 (12) 4.2可视化流程配置引擎 (12) 4.3作业流程人工干预 (13) 4.4作业执行验证/持续监控 (13) 4.5作业操作手册自动生成 (13) 4.6作业执行结果展现 (14) 4.7配置备份/基线库管理 (14) 5产品优势 (16) 6运行环境 (17)

1 IT 运维管理面临挑战 24% 31%45% IT 运营费用比例 新系统开发维护开发运维管理 ? 分散于各服务器上的运维脚本,存在管理风险,且耗费大量管理成本; ? 日常操作消耗大量人力资源,误操作风险较大,操作执行效率低;

?操作过程可控度低,运维风险大: ?操作与执行方案匹配度无法保证,实际操作过程可控度较低; ?日常操作对人员水平要求高,人力资源风险大; ?运维操作透明度低: ?实际操作不便于监督,存在“黑盒”操作风险; ?日常工作与实际操作无法有效关联,不利于日后审计;

2应运而生的自动化解决方案 面对IT运维管理中的诸多问题,单靠人工已经无法满足在技术、业务等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。其中,IT运维自动化是指将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。 IT运维自动化从诞生发展至今,其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。自动化对IT运维的影响,已经不仅仅是人与设备之间的关系,已经发展到了面向客户服务驱动IT运维决策的层面。 融海咨询借鉴IT运维自动化发展趋势,结合多年IT服务经验中对用户需求的把控,自行研发自动化解决方案。 自动化方案概述: 通过自动化手段,实现IT运维管理操作的自动化调度、“一键式”处理;通过异常处理的支持,对操作的结果进行验证,并持续监控作业执行结果;通过时间约束条件,对按照时间计划执行的运维作业进行管理;通过复杂的关系运算条件,处理复杂的作业流程的关系;通过UserTasks人工接口,方便运维人员对作业调度流程的参与;通过图形化的工作流定制平台,实现对业务活动进行整体规划;通过与其它平台的集成,实现了与报警、监控等运维系统的一体化管理。从而实现功能强大、简单易用、安全可靠的作业调度自动化。 通过自动化解决方案,推动了企业IT运维管理操作的指令化、标准化、流程化进程。 自动化建设目标:

运维应用管理平台运维服务介绍

1.1 系统维护服务要求 1.1.1 维护服务要求 1.应答方在保修期内应提供免费的系统维护服务,保修期为自系统终验证 书签署之日第二天起12个月。 2.应答方应根据系统维护服务的范围和要求,提出针对广东移动掌上运维 应用管理平台的后期维护方案,包括故障处理的流程、响应时间、管理 体制、维护人员和工具配备等。 3.应答方应提供7x24小时的现场维护人员(不少于3人)。应答方的技术 支持人员应具有不少于三年开发和维护经验,应答方应标时必须提供详 细的维护人员名单,名单中必须列明各人员的学历、工作经验等信息, 并经由需求方确认。 4.应答方支持终端侧重要需求的快速响应,应答方有责任在需求方要求的 时间内支持重要需求的快速开发和部署上线。 5.应答方为系统故障的第一响应方。应答方有责任在需求方要求的时间内 首先响应需求方的要求,并负责召集设备供应商共同对系统软、硬件设 备的安装、联通测试及运行维护中出现的问题进行及时的处理和故障排 除。 6.应答方应提供详细的故障处理方案,该方案必须经需求方评审通过。故 障处理方案必须针对不同故障等级分别制定,故障等级划分包括但不限 于: 紧急故障:系统核心业务瘫痪,无法提供服务; 严重故障:系统核心业务仍能提供服务,但是性能受到严重影响; 一般故障:系统核心业务不受影响; 7.在紧急故障发生时,应答方应在15分钟内响应,1小时之内赶赴现场, 2小时内对故障进行紧急处理,恢复业务基本运行。因不可抗力致使应 答方未按时到达现场除外。 8.在严重故障发生时,应答方应在30分钟内响应,2小时之内赶赴现场, 4小时内对故障进行紧急处理,恢复业务基本运行。因不可抗力致使应

校园网综合运维管理平台

校园网综合运维管理平台 一、系统简要描述 ●系统名称:DTSM校园网综合运维管理平台 ●开发单位:广州市点易资讯科技有限公司 ●版本号: ●开发模式:定制开发 ●系统架构:B/S 结构 ●开发平台: ●数量: 1套 ●报价: 人民币33万元 ●功能及用途简要描述 DTSM校园网综合运维管理平台是为校园网用户提供网络自助服务和网络服务运维流程管理的专业平台,整合校园网系统运行环境、网络、服务器与业务应用等的分割管理,实现对IT系统的集中、统一、全面流程管理;平台系统设计遵循 FCAPS、eTOM、ITIL等国际服务管理标准和规范,达到技术、功能、服务三方面的有机整合,能实现IT 服务支持过程的标准化、流程化、规范化,提高故障应急处理能力,提升系统运维的管理效率和服务水平。 该平台主要功能包括服务台、流程管理、设备监控管理等,实现校园网用户入网流程管理、网络服务流程管理、网络资源管理,平台能够与收费系统和认证系统对接并实现数据交互。 二、模块功能描述 1、网络服务流程管理模块 提供用户网络自助报障、Duty值班事件受理、故障流程管理(包括资源 配置库管理、流程跟踪、服务质量管理等)、服务统计、回访等功能; (1)用户网络自助报障

用户通过自助平台故障报修,可查询报障记录和故障处理进度。(2)Duty值班事件受理 Duty值班受理电话报障和网上报障,并在运维管理平台上建立(或确认)事件工单。 (3)运维流程管理 具体实现流程为: 服务台通过网路和电话受理建立工单; 一线人员通过系统接单和处理,处理包括事件成功处理之后的申请关闭,或申请二线支持,或不能处理的申请撤单。 二线人员可以受理一线(或项目经理)转交的工单或则直接从服务台接单处理,成功处理可以申请关闭,或则回退给一线工程师等; 服务台人员可以根据处理情况进行回访,并给予意见; 项目经理根据一线、二线的处理情况和回访情况,决定事件的关闭或则回退等相关处理。 在这期间,涉及到服务台、事件管理、问题管理、变更和发布管理、服务水平管理、知识库和方案库管理; ●服务台 ●建立运维团队与用户之间的单一联系点,统一受理用户的咨询、服 务请求、故障报修、流程跟踪、投诉等情况,并通过底层监控系统 主动预警网络故障,通过事件管理流程及时处理,及时跟踪和通报 处理进展,借助知识库和方案库,解决大部分常规事件。同时,也 包括集中监控平台、电子值班管理、统一实时展现IT运行状况。 ●事件管理 ●事件管理流程是事件驱动的日常流程。服务台接收到的事件主要包 括故障和服务请求。事件管理负责事件的调查、诊断、修复,其主 要目标是尽可能快地解决故障,以恢复受影响的业务。 ●问题管理 ●主动的问题管理主要是进行各个系统的巡检、分析和建议。被动的 问题管理主要是分析各个系统的故障,定义问题,并提出可能变更

IT数据中心运维服务白皮书

鹏博士电信传媒集团股份有限公司 IT服务白皮书 二零一三年十一月

目录 第一章运维服务概述 (4) 1、 (4) 2、 (4) 3、 (4) 第二章监控巡检服务 (4) 1、实时监控 (4) 2、日常监控 (4) 第三章服务器运维管理服务 (4) 1、服务器健康检查 (4) 2、服务器日常维护 (5) 3、服务器配置管理 (6) 4、服务器性能管理 (7) 第四章网络运维管理服务 (8) 1、网络拓扑规划和优化 (8) 2、网络设备安装、配置、调试 (8) 3、网络设备“高可用”配置和维护 (8) 4、网络设备性能管理 (8) 第五章存储运维管理服务 (8)

1、存储设备安装、配置、调试 (8) 2、存储容量空间管理 (8) 3、存储性能管理 (8) 第六章数据库管理服务 (8) 1、数据库安装、配置、调试 (8) 2、数据库性能管理 (8) 3、数据库容量空间管理 (8) 4、数据库备份和恢复管理 (8) 第七章安全管理 (8) 1、服务器安全管理 (9) 2、网络安全管理 (9) 第八章管理制度、流程 (9) 1、服务支持 (9) 2、服务交付 (9) 第九章应急管理 (9) 1、应急预案开发和维护 (9) 2、应急演练 (9)

第一章运维服务概述 1、 2、 3、 第二章监控巡检服务 1、实时监控 2、日常监控 第三章服务器运维管理服务 1、服务器健康检查 为了提高系统的可用性,将故障排除在发生之前至关重要。健康检查服务是鹏博士提供的一项针对设备的非常有效的事故预防服务,是主动式服务的一种。通过健康巡检服务可以尽早发现系统的问题或潜在问题,保证系统的安全、稳定运行。 健康巡检将帮助客户从技术角度对正在运行的服务范围内系统的技术特征、故障隐患有一个全面的了解,以便根据业务发展需求和目前系统资源状况,制定合理、可行的系统扩容、改造、维护计划,提高系统运行的安全性。 服务内容如下: 根据客户需求制定健康检查计划、方案、流程;

IT运维管理平台

简单运维 轻松管理 统一门户管理 云基础架构管理 管理 统计报表 无线管理 业务服务管理 数据中心管理 @ 告警管理

RIIL-BMC,综合业务管理平台 以IT业务价值为核心,帮助企业构建可视、智能的IT一体化管理动态模型,通过端到端海量IT数据的实时透视与分析,洞察企业IT正在发生的一切,为企业IT管理提供决策依据与最佳实践指引,提升企业IT运营管理水平,挖掘IT 业务价值。 统一门户管理 整合运维数据,打造个性化的信息看板 Portal一体化门户定位于连接RIIL各产品、各模块的统一访问门户,为用户提供整合的资源信息、统一的用 户登录认证、个性化的管理界面等服务 业务服务管理 业务运行状况有效度量与数据分析,快速定位业务故障点 业务服务管理帮助IT管理者全局掌握业务的运行状态和健康水平,了解动态变化趋势,快速查明问题源,降 低运营风险。同时可直观反映IT资源的运行状况对应用系统、核心业务以及用户的影响,遇到故障帮助IT人

业务体验分析 基于嗅探技术获取用户体验数据,提升用户满意度 关注用户满意度,实时监测各关键应用性能,提供详细的性能和故障现场数据,分析业务交易服务质量,构建以业务为中心的业务管理视图。帮助客户了解其业务应用系统的使用情况及最终用户的体验情况。 告警管理 智能化故障关联分析,提升故障处理时效 告警管理帮助管理人员实时掌握所有业务系统的运行状态,一旦发现异常,快速定位问题根源点,并主动通知责任人,采用直观的可视化方式进行故障分析管理,降低管理人员的工作难度,提升整体故障处理的工作效率。 无线管理 多厂商,有线、无线一体化管理 支持对锐捷、H3C、华为、Cisco、Aruba、Juniper、中兴等无线设备的的全方位管理。图形化展现无线设备及用户分布情况,用户体验好坏直观可视

itop运维综合管理平台使用手册

xxxx运维综合管理平台 操作手册V1.0 xxxx(天津)科技有限公司

变更记录

目录 1.平台介绍 (4) 1.概述 (4) 2.平台架构 (4) 2.1展示层 (5) 2.2功能层 (7) 2.3技术层 (8) 2.4外部接口层 (8) 1.xxxx运维综合管理平台软件功能 (9) 2.1服务台 (9) 2.2自助服务中心 (10) 2.3配置管理模块 (11) 2.4事件管理模块 (13) 2.5问题管理模块 (17) 2.6变更管理模块 (19) 2.7服务管理模块 (22)

1.平台介绍 1.概述 xxxx运维综合管理平台是为了业务需要进行开发,适用于IT服务的日常运维管理。它基于ITSS最佳实践,适应符合ITSS最佳实践的流程,同时它又很灵活,可以适应一般的IT服务管理流程。 xxxx运维综合管理平台的功能包括: ?记录IT配置项(如服务器、应用程序、网络设备、虚拟机、联系人、位置、VLAN 等)及其各个配置项之间的关联关系; ?管理事件、用户请求和变更审批与执行等; ?归档IT服务及与外部供应商的合约,包括SLA(服务级别协议); ?手动或脚本方式导出所有信息; ?批量导入或同步/联调所有来自外部平台的数据; xxxx运维综合管理平台基于Apache/IIS、MySQL和PHP,它可以在任何支持这些程序的操作平台上运行,如Windows、Linux(Debian、Ubuntu和Redhat)、Solaris和MacOS X等。此外,由于平台是基于B/S架构的应用程序,不需要在用户电脑上部署任何客户端,只需要一个简单的Web浏览器(IE 8+、Firefox 3.5+、Chrome或Safari 5+)即可使用。 2.平台架构 平台架构如下图所示:

一体化综合运维管理解决方案

一体化综合运维管理解决方案 应对挑战 轻松 自如

客户之声 我们很关心机房设备的影响。比如说吧,一台UPS连接了哪些服务 器,万一这台UPS出了问题,会对哪些系统有影响,我们就会预先 采取措施,别让它成为单点隐患…… 我们的ERP系统是委托定制的,很重要……但它有时出问题莫名其 妙,数据库、应用服务器、网络都没有问题,就是查不出毛病在哪 ……怎么样才能把定制的应用监控起来,我们很关心…… 我们已经上了ITIL,但每次系统出问题还是手忙脚乱,到底问题出在 哪总是要查半天……同样的问题,下次再出现能不能马上知道还是 心里没底……看来,仅靠流程解决不了问题,更需要有效的监控系 统的支持 我们需要的是一个实用、解渴的监控解决方案,实际上,许多经验 是出了问题才知道如何监控,我们自己做了很多这方面的脚本和 SQL语句,所以,必须是一个监控经验的快速沉淀平台……指望监 控软件厂商什么都能干并不现实,只要能长期帮助我们把监控经验 积累、固化到工具中就行…… 我们的长期体会是:只有进行网络、主机、数据库、中间件、应用、 业务的6层集中综合监控、集中展现、集中分析,才能帮助我们准确 进行根本故障定位…… 我们的这些后台核心系统,不允许网管监控软件用探针插入方式监 控,安全隐患太大…… TeaView 一体化综合运维管理解决方案4大特色能力: 资源梳理能力____全面掌握IT资源关联关系 监测扩展能力____快速满足各种监控需求 应用监控能力____满足个性化应用监控 管控一体能力____系统监测、操作安全、服务管理的管控一体化 1

企业IT运维面临的挑战 目前,企业的IT系统运维包括规划部署、运行监控、日常运维管理、运维安全审计等一系列周期性工作。在这些 周期性工作中,经常遇到如下问题: IT 运维周期性工作 综合上述问题,企业IT运维正面临如下挑战: 急需主动梳理IT资源内部关联关系 设备间影响密切,准确故障定位日益困难 资源关联复杂,系统变更风险越来越高 脆弱点隐蔽,单点故障风险难以控制 定制化应用故障最多,影响最大,监控需求最迫切 监控需求预知性差、突发性强、监控指标个性化、业务特征明显 监控部署时效要求高、监控方法难以系统化 对监控的扩展能力要求越来越高,以确保IT系统全生命周期的可持续化监控 IT系统生命周期不同阶段,呈现不同故障特征,监控需求持续变动 定制化应用不断调整改造,导致应用监控需求持续变化 新设备种类、新的监控指标不断涌现 规范ITIL流程管理,提升IT服务质量 2

智能IT运维监控平台-技术白皮书V2

目录 一、背景与需求 (3) 1、背景 (3) 2、需求要点 (3) 二、解决方案与系统构架 (5) 1、解决方案 (5) 2、系统构架 (6) 三、系统及运维监控功能与特点 (7) 3.1 系统功能特点 (7) 3.1.1 IT资源集中监控管理 (7) 3.1.2、IT资源运行状态统一展示 (7) 3.1.3、IT资源告警事件管理 (7) 3.1.4、IT设备智能巡检 (8) 3.1.5、业务维度监控 (8) 3.1.6、业务维度的拓扑展示 (9) 3.1.7、应用性能分析 (10) 3.1.8、IT资源使用分析 (10) 3.2 监控功能 (10) 3.2.1、IT资源监控类型 (10) 3.2.2、网络设备状态监控 (11) 3.2.2、服务器状态监控 (12) 3.2.3、数据库监控 (13) 3.2.4、Web中间件监控 (14) 3.2.5、虚拟设备监控 (17) 四、部署与配置 (17) 4.1、部门级部署 (17) 4.2、企业应用部署 (18)

4.3、集团应用部署 (19) 4.4、部署要求 (20) 4.5、运行环境 (20) 五、效益与价值 (20) 5.1、产品价值 (20) 5.2、效益体现 (21)

一、背景与需求 1、背景 随着我国工业企业及组织机构信息化建设的快速发展,越来越多的企业核心业务及机构工作的开展已经高度依赖于信息系统的应用,随着信息化的不断深入,信息系统越来越多,各类系统越来越复杂,系统间的关联度也越来越高,使得企事业单位的IT运行环境日趋复杂,各类IT设备的运行监控难度加大,由于IT系统的运行环境更加复杂,造成了机房管理、系统监控和运行维护工作变的十分困难。 目前单个的IT设备初步具有自监控的手段和方法,但由于设备的种类数量众多且分属不同的平台和厂商,导致运维监控工作各自为政,运维监控缺乏一个集中、统一的运维监控平台,使得各类设备运行事件无法做到实时统一。由于缺少一个IT统一的监控运维平台,任何一个IT设备资源出现故障时都需要IT运维人员手工查找与排查故障产生原因和定位故障,使得运维人员对于日常的运维工作还是处于被动等待“救火式” 状态之中,运维事件的发现收集操作为传统手工方式,往往是故障事件发生后,运维人员被动告知后去处理问题,严重制约IT运维的响应速度和执行效率,影响企事业单位的IT信息系统的顺利使用。 通过建立智能IT运维监控平台,对网络、硬件、安全设备、操作系统、数据库、中间件、应用系统、机房空调、UPS等资源实时监控采集,能够自动地收集信息系统中各类IT资源设备运行状态、数据库状态、中间件运行状态和网络状态等,发现各类IT 资源运行过程中的异常。依据业务视角和设备视角分析发现已发生和潜在的各类资源问题,及时通知相关责任人和启动相关运维流程。 2、需求要点 智能IT运维监控平台实现对网络、应用服务器、业务系统、各类主机资源和安全设备等运行状态的全面监控,建立对各类IT资源的各类运行状态参数的采集、分析,及时发现和定位IT设备故障,启动相关的故障解决流程。 智能IT运维监控平台可从IT视角完成对各类IT资源监控的同时,也提供从业务系统的视角对IT资源监控运维方法。

软件平台运维服务方案

软件平台系统运维方案

1.技术支持服务 技术服务主要包括如下:400电话支持、线上客服务、远程服务;针对上述技术支持服务工作,提供2名专责客服务人员; 1.1400电话 专门成立Call Center团队,保障做好平台的技术支持服务工作;收集整理相关问题记录,最终形成问题库,通过问题库更好的为客户提供相应服务;主要提供服务主要包括如下: ●通话录音 ●智能来电分配 ●客服工号播报 ●服务评分 1.2线上客服 线上客户主要为广大用户提供俩大类服务,主要服务的内容如下: ●问题查找:系统自动根据当前用户所关心的问题,列出最近的相关问题, 并对问题可分类进行展示,用户也可通过“搜索”进行查找; ●提交工单:用户也可以向系统管理员提交工单,管理员接到工单后,会 针对提交工单进行相应处理,用户可查看到管理员所反馈工单处理结果; 1.3远程协助 远程协助主要通过远程终端操作,解决用户在使用系统过程中遇到的各类问题; 1.4客服满意度 ●用户提出来所有问题,均采用“一问一答”闭环式关闭所有问题;并对

相关问题形成完整问题记录库; ●400电话,所有通话至少保留10个工作日通话语音记录,便于以后追责; ●启用客服满意度评估机制,有效提高客服满意度; 2.运维服务 2.2基础运维 主要从物理安全、网络安全、主机安全、应用安全、数据安全以及日常设备巡检六个层面分别进行。具体内容为: (1)物理安全:针对信息系统所处的物理环境即机房、线路、基础支撑设施等进行标准符合性识别。主要包含:物理访问控制、防盗窃和防破坏、防雷击、防火、防水和防潮、防静电、温湿度控制、电力供应、电磁防护等方面。针对各个风控点安排相应的技术人员进行排查; (2)网络安全:对工作范围内的网络与安全设备、网络架构进行网络安全符合性排查检验。主要包含:结构安全与网段划分、网络访问控制、网络安全审计、边界完整性检查、网络入侵防范、恶意代码防范、网络设备防护等方面,针对各个风控点安排相应的技术人员进行排查; (3)主机安全:针对身份鉴别、访问控制、安全审计、系统保护、入侵防护、恶意代码防护、资源控制等方面,针对各个风控点安排相应的技术人员进行排查;; (4)应用安全:对信息系统进行应用安全符合性排查。如身份鉴别、访问控制、安全审计、通信完整性、通信保密性、抗抵赖、软件容错、资源控制等方面,针对各个风控点安排相应的技术人员进行排查; (5)数据安全:主要检查系统的数据在采集、传输、处理和存储过程中的安全,针对各个风控点安排相应的技术人员进行排查; (6)日常巡检:检查系统相关服务器操作系统、数据库和中间件的开放服务及端口、磁盘使用率、内存使用率、账户设置(定期修改密码并且满足复杂度和长度)、登录设置、文件权限设置、审计、共享资源、补丁更新和病毒防护等情况;防火墙的访问控制策略、网络连接数限制等信息,检查入侵检测、安全审计

相关主题
文本预览
相关文档 最新文档