当前位置:文档之家› 统一IT运维管理平台解决方案技术

统一IT运维管理平台解决方案技术

统一IT运维管理平台解决方案技术
统一IT运维管理平台解决方案技术

统一IT运维管理平台解决方案技术

目录

1方案体系架构 (4)

1.1方案逻辑结构 (4)

1.2CMS/CMDB配置管理系统 (6)

1.3集中监控平台 (6)

1.3.1数据采集层 (6)

1.3.2数据处理层 (7)

1.4自动化管理平台 (7)

1.5流程管理平台 (8)

1.6数据展现平台 (8)

1.7本解决方案对应的BMC产品 (9)

1.7.1CMS/CMDB配置管理系统 (9)

1.7.2集中监控平台 (10)

1.7.3自动化管理平台 (11)

1.7.4流程管理平台 (11)

2系统组成及功能 (13)

2.1CMS/CMDB配置管理系统 (13)

2.1.1系统逻辑架构................................................................. 错误!未定义书签。

2.1.2系统物理架构................................................................. 错误!未定义书签。

2.1.3CMS/CMDB功能 (14)

2.1.4ADDM发现工具功能 (24)

2.2集中监控平台 (28)

2.2.1数据采集功能 (28)

2.2.2数据处理功能 (38)

2.3自动化管理平台 (47)

2.3.1服务器自动化管理功能 (51)

2.3.2网络自动化管理功能 (66)

2.4流程管理平台 (76)

2.4.1服务台 (76)

2.4.2事件管理 (79)

2.4.3问题管理 (84)

2.4.4知识库管理 (86)

2.4.5变更管理 (87)

2.4.6发布管理 (92)

2.4.7服务级别管理 (94)

2.5数据展现平台 (97)

2.5.1管理门户 (98)

2.5.2操作控制台 (99)

2.5.3报表系统 (102)

3附录:BSM业务服务管理白皮书 (104)

3.1IT运维管理趋势 (104)

3.2应运而生的BMC业务服务管理 (105)

3.3BMC业务服务管理框架 (106)

1.规划与监管 (106)

2.服务与支持 (107)

3.供应与配置 (108)

4.监控与运营 (109)

5.集成与调和 (110)

3.4业务行于IT,而IT行于BMC (111)

3.5产品配置列表 (113)

3.6部分成功案例 (117)

1.中国银联上海信息中心 (117)

2.中国太平洋保险集团有限公司 (118)

3.中国建设银行整个企业开放平台集中监控系统 (119)

4.中国农业银行整个企业开放平台集中监控系统 (120)

5.中国人民银行集中信息管理平台 (121)

1 方案体系架构

1.1 方案逻辑结构

统一IT运维管理平台逻辑结构划分为四个平台和一个核心系统,分别是数据展现平台,流程管理平台,集中监控平台,自动化管理平台以及CMS/CMDB 配置管理系统。

从监控角度上来讲,又分为数据采集层、数据处理层、数据呈现层,通过三个层面的处理,统一展现给监控和维护人员。这三层结构主要由集中监控平台和数据展现平台实现,并与流程管理平台、自动化管理平台和CMS/CMDB配置管理系统实现有机的结合。

本解决方案从总控中心的角度出发,侧重于及时发现您企业IT系统中的各类告警和性能异常,进行数据分析和整合,同时以适当的形式进行呈现;另一方面,维护人员借助该系统能够执行相关操作,对各种问题进行迅速的响应,及时履行维护职责。

其主要功能描述如下:

●实现对您企业信息系统各组件运行状态的统一监控。被监控对象包括主

机(包含虚拟化环境)、数据库、中间件、网络、存储、安全、应用软

件等。

●数据采集层可通过发现模块自动发现业务系统的配置信息,自动设置被

监控的实例。

●数据采集层通过与被管系统的接口采集数据,送到处理层进行数据处

理。

●数据处理层一方面对数据进行分析判断产生告警信息并发送到展现层,

另一方面在数据库集中存放性能数据。

●数据处理层还可以对所有告警事件做进一步的分析,根据业务服务模型

来生成业务影响分析视图,提供给业务影响管理的功能模块。

●数据呈现层不仅展现告警信息,而且展现各种监控视图,如事件拓扑展

现图。

●数据呈现层能展示业务系统的状态、各个服务的状态以及影响业务系统

的主要关联部件。

●通过与服务管理平台的接口,监控管理平台可以有选择性地将告警信息

送到帮助台,形成事件提交给运维管理人员以启动故障处理流程进行处

理。

1.2 CMS/CMDB配置管理系统

配置管理系统CMS/CMDB是IT运维管理平台的核心,它统一为其它所有IT 管理平台提供服务。它提供了配置项和关系发现、业务系统建模、配置信息可视化等各种功能。

CMS/CMDB可以统一多种IT管理工具的配置数据和流程,从而降低运维成本、最小化风险和加速BSM的实施。借助CMS/CMDB所提供的IT技术架构的唯一配置信息来源,可以更好地了解你的环境。通过可视化业务服务模型和影响模拟器等功能,更好地管理基础架构和控制各种变更的发生。按照不同业务建立和监控服务水平级别,唯一的业务服务模型梳理了各种服务基本协议的业务需求,BMC Atrium给SLA的建立和维护了提供了一致可靠的参考。

1.3 集中监控平台

1.3.1 数据采集层

数据采集层,主要是完成各类数据的采集工作,建立相关的数据采集接口,并能够根据需要定制在特定的时间(或周期性)进行数据的采集,并为数据处理层提供相关的数据。目前采集可以支持的手段有:RPC、SNMP、SYSLOG、专用Agent、脚本方式、以及一些标准的协议如WMI、SSH、Perfmon、JMX等来实现无代理的数据采集。这一层主要是由通过设置在各个点的各类采集设备组成。

通过在您企业各类系统运行所依赖的服务器上安装BMC的代理来对您企业各类系统运行的软件环境进行监控与管理,包括对系统、数据库、中间件、应用、存储等,这些监控对象通过BMC Performance Manager相应的知识模块或通过定制开发的知识模块对其进行监控与管理。通过与安全管理系统、存储管理系统、桌面管理系统、机房其它系统的集成并提供相关信息给数据处理层,相关信息在同一用户界面上进行展现。

BMC的代理程序及其知识模块可通过远程分发的方式进行安装和升级,其运行消耗的资源很少,代理程序同BMC其它管理模块之间的通信通过TCP的

某一端口进行,相对于SNMP或其它的通讯方式,传输安全可靠。BMC代理是完全智能的,可在不连接任何控制台的情况下,通过知识模块完成相应的监控功能,并能在本地进行数据存储及处理,可通过公开的API、知识模块和SNMP 的方式和第三方管理软件集成。

1.3.2 数据处理层

数据处理层的主要任务是将采集的数据进行汇总和处理,并根据需要进行展现。

来自于被监控对象(操作系统、数据库、中间件、应用等)的性能数据通过Common Service统一存储到后台数据库中。系统每隔一段时间后对这些数据进行各种汇总操作,如产生每小时的某个性能参数的最大值、最小值、平均值,每天的某个性能参数的最大值、最小值、平均值等。

BMC事件管理平台根据预定义的事件处理策略对接受到的事件进行处理,并进行后续的各种处理动作,如以各种方式通知相关的处理人员、在帮助台中产生故障工单等,同时实现在BMC事件管理平台与帮助台的故障工单之间状态的双向同步。

BMC业务影响管理平台结合事件管理平台中的事件故障信息和CMDB中的业务服务模型。为运维人员定位和分析系统故障提供强大支持,是的整个监控系统更加完善,增强了BSM的实现效果。

1.4 自动化管理平台

与自下而上做事件采集、处理和展现的监控平台相对应,自动化管理平台执行自上而下的控制和操作动作。

自动化管理平台可以覆盖从物理服务器、虚拟服务器、网络到应用、甚至客户端,提供设备发现、脚本执行、操作系统安装、配置备份、配置检查、配置变更、补丁分析和分发、应用程序分发、操作审计、合规审计、配置修正、作业调度、虚拟机管理、远程管理等多种跟运维管理相关的功能,将手工作业进行自动

化实现,解放运维人员,同时强制遵循最佳实践和法律法规的合规要求。

1.5 流程管理平台

流程管理平台为客户实现ITIL理论中的服务台、事件管理、问题管理、变更管理、配置管理、资产管理、服务水平管理等流程。

流程管理平台在逻辑上被分为四个层次(如下图所示),分别是:门户(前端用户访问层)、服务平台(客户化流程应用)、服务基础架构(流程引擎及相关基础设施)和外围接口(与服务台系统相关的所有外围系统和应用)。

通过采用这种分层的架构模式,大大降低了各层次间的耦合程度,提供了系统的可用性和可扩展性,为企业实现一种高可用、高稳定性的平台提供了保障。

1.6 数据展现平台

展现层主要是由BMC Portal、报表管理等组成。BMC Portal通过集成多种工具的控制台来对相关数据进行呈现,根据用户的不同权限呈现给相关的用户,

并通过拓扑图(地理区域视图或业务视图)、报表、图形、声光等界面方式进行显示和汇报,界面展现支持C/S和B/S结构,各级维护和管理人员可以根据用户的角色和权限来定制相应的用户界面。

报表管理根据汇总的数据来产生相应的报表,如告警分类报表、告警分时报表、告警来源报表、性能数据的日报、周报、月报、性能数据的对比分析报表、性能数据的趋势分析报表等。可以定制自己的报告,也可以通过Web发布报告。当前报表管理作为数据呈现层的一个单独的功能模块,未来可集成到BMC Portal中,使用户通过统一的访问接口访问。管理员可以在内部网上使用Internet 浏览器来查看和打印各种报告。可以运用这些有价值的历史数据来分析业务系统的运作情况,帮助指定服务目标,提高服务水准。

1.7 本解决方案对应的BMC产品

1.7.1 CMS/CMDB配置管理系统

本方案中配置管理系统基于BMC Atrium CMDB产品、ADDM发现组成。

BMC是业内最先以IT管理为目的而开发和设计的CMDB产品,比其他厂商领先20月,被Gartner评为架构最成熟的CMDB产品。(来源: Gartner, June 2007:"BMC Atrium CMDB 2.0 added significant maturity in modeling and the Definitive Software Library,")

BMC Atrium CMDB是第一个通过端到端的业务服务拓扑图,来可视化展示业务系统所有部件和关联关系的产品。它是CMDB市场里支持业务服务模型的领导者,该业务服务模型让您很好的管理基础架构提供的IT服务和业务服务的关联关系。

BMC Atrium CMDB的通用数据模型是面向对象的配置信息表达技术,它通过弹性和完全图形的操作管理界面来定制可扩展类型属性,在业内标准数据模型的基础上,方便的满足了任何客户化需求。

ADDM发现工具能发现和捕获物理和逻辑的配置项,在于定义的不同技术范畴上发现并提供各种关系视图。它自动和强大的发现功能维护和保证了CMDB 中IT基础架构配置项信息的精确性。

ADDM发现工具的应用关系发现和映射能够发现和可视化虚机环境:包括物理虚拟环境(如:AIX Cluster)和VMWare等软件虚拟环境的架构。它的通用应用发现引擎能够发现各种企业应用,并且自动发现和维护应用和基础架构直接的联系。最小化了IT基础架构中配置项关系的手工维护工作量。

1.7.2 集中监控平台

本方案中集中监控平台基于BPPM(BMC ProactiveNet Performance Management)、BEIM(BMC Event and Impact Management)产品组成。

BPPM系列产品主要提供对IT基础架构中各IT部件的监控与管理,如对操作系统、数据库、中间件、存储、应用等监控与管理,并提供集中的用户监控管理界面对系统性能和可用性以进行集中监控,使用集中的配置管理界面对监控策略进行集中的配置和管理。

在整个BPPM系列产品中主要包括BPPM代理程序(BMC Agent智能的执行机构)、知识模块(BMC KM监控对象、报警及相应处理措施的定义)、Common Service(BPPM分布式通信中间件、用户安全控制及通信控制模块的集群) 、管理控制台(被管对象集中监控、管理和监控策略的集中配置和管理)。

BEIM提供集中的事件管理平台,通过该集中的事件管理平台可实现事件的过滤、关联和内容丰富等,从而防止事件风暴的发生。事件处理策略可通过图形化的处理界面进行定制,也可通过事件规则编程的方式进行定制。BEIM基于JAVA架构,可根据需要进行扩展,并提供C/C++、JAVA和Web Service进行接口。BEIM通过同Remedy的集成模块可实现BEIM同帮助台之间双向集成。

BEIM的功能模块包括事件处理单元(BMC Impact Manager)、事件适配器(BMC Impact Manager Adapter)、事件管理控制台(BMC Impact Explorer)、BMC

Portal(统一用户界面)

SIM(BMC Impact Managemer服务影响管理模块能提供服务影响分析功能,建立业务服务模型,分析和展现IT组件对业务系统的影响。

IT系统维护人员通过统一的BMC Portal监控IT基础架构的运行情况,BMC Portal集成了BMC Performance Manager Console和BMC Impact Explorer,通过BMC Portal可以同时监控IT部件的事件和性能信息。

1.7.3 自动化管理平台

本方案中自动化管理平台基于BMC BladeLogic系列自动化产品,包括BBSA服务器自动化和BBNA网络自动化。

BladeLogic在一个统一的平台和架构上实现了配置和合规,是业内架构优良和高效的服务器自动化管理平台。BladeLogic的面向对象的配置字典技术,不但提供丰富的开合即用的管理配置对象,而且可以方便的扩展和定制,100%的覆盖变更配置管理的所有需求。是业内管理对象粒度最细的平台,管理对象大到一台或者一组服务器,小到一个配置文件中的某个配置参数。

BladeLogic的基于角色的访问控制技术可以实现非常弹性和全面的安全授权管理。具有“系统管理员”和“安全管理员”两权分离;授权层次为:角色、对象和资源,三重访问授权方式。这种访问控制技术是数据中心的变更管理变得更加安全和可控。

1.7.4 流程管理平台

针对IT服务管理平台建设需求,并同时考虑未来管理系统的不断延伸和扩展,我们建议采用BMC Remedy ITSM应用来实施和部署您企业的流程管理平台,以下是BMC Remedy ITSM的架构图:

运维管理系统方案

运维管理系统方案 概述 伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要? 因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。 运维管理系统的功能: 故障发现与警报; 记录日常运维日志信息; 服务器故障统计; 服务器软硬件信息统计; 服务进程管理; 将数据信息存储到数据库,并使用图形方式直观的展示出来; 权限、密码管理; 将数据生成报表。 运维管理系统的特点: 邮件和短信实时故障报警; B/S结构,能够通过web对远程服务器下达指令; 监控服务器和被监控服务器之间通过python socket来发送信息; 统计日常故障处理,以便下次出现同样故障时能够更快的解决问题; 实现自动化管理和自动化监控; 安全管理服务器性能; 操作流程统计与管理。

系统结构 运维管理系统采用B/S构架,运维管理人员随时随地可以对服务器进行管理、配置及故障处理。它是将部署在同一个局域网内的所有服务器统一管理,服务器之间的信息通讯、指令发送、运维管理都通过python来实现。监控服务器端负责采集、统计和分析数据,在数据出现异常时发送报警信息到管理员的email、手机中,并将错误日志存储到数据库中。 运维管理系统主要通过LAMP服务器、python编程、snmp和shell编程来实现。在被监控端安装python服务,并在被监控服务器上部署python程序和shell脚本用于接受监控服务器端指令、信息采集并发送会监控服务器端。监控服务器端部署python程序和LAMP服务器,用于发送指令、接受数据信息、存储数据、统计数据以及异常报警。 运维管理人员日常通过web浏览器远程登录监控管理系统,检测各被监控服务器的运行状态、服务状态、防火墙配置、进程信息、操作日志等信息。在出现异常时,通过运维系统可以查看到具体的异常服务器、进程等信息,并根据这些信息来处理异常。

信息化建设解决方案之运维篇

信息化建设解决方案之运维篇

散,自我认可度低,团队人员流动率较大。情况往往是某人好不容易成为熟练工了,却因为看不到职业前景或感觉不受重视而提出辞职。这些中坚力量的离职,会造成客户满意度和运维质量相当长一段时间内出现波动。 (4)服务商难管理,技术水平参差不齐,服务不及时,有问题不能及时解决。 IT运维服务外包存在一定风险,关键在于对于IT运维服务外包供应商的管理不到位,具体体现在招标环节疏于审查、过程监督环节疏于监管、以及事后评价环节疏于考核。通过在招标环节加强对供应商资质、能力水平、案例等考察可以有效包括准入关;通过在服务过程中加强监督可及时发现供应商服务提供能力的异常;通过事后评价可以建立供应商的退出机制,保证供应商提供优秀的服务。 1.2 IT运维服务问题分析 从以上现象可以看出,IT运维服务的所有问题的根源都不是技术问题,而是管理问题,包括流程管理的问题、评价管理的问题、应急管理的问题等等。主要包括:

(1)IT运维服务管理方式缺乏创新。 IT 运维服务管理方式包括自营管理和外包管理,随着IT系统复杂程度的增加,对于IT运维能力的要求也越来越高,自营服务的成本已远远大于外包服务的成本,在某些非关键的领域,应该引入IT运维服务外包这一创新管理模式以降低服务成本,同时将组织自身的IT运维人员解放出来,做更有价值和意义的工作。 (2)IT运维服务管理不规范。 IT运维服务人员很忙碌却得不到业务部门认可的根本原因是双方缺少IT运维服务沟通的基本语言,也就是IT运维服务管理规范不明确,导致业务部门对于IT运维服务部门提供哪些服务不清晰、提供服务的流程不清晰、对于服务的评价指标不清晰,同时也导致IT运维服务人员工作职责不清晰、人员间工作交接不顺畅、服务过程缺少监督等。 (3)工作分工设计不合理,忽视梯队建设。 人员管理问题,根源在于运维工作分配不合理,业绩无法考核。若将运维人员分成一、二、三线支持,不同运维人员各司其职,能使有限的

运维监控管理平台建设方案(参考)

IT运维监控管理平台 建设方案 XXXXXXX

目录 第1章概述 (4) 1.1 建设背景 (4) 1.2 建设目标 (4) 1.3 建设思路 (5) 第2章系统总体设计 (6) 2.1 总体架构 (6) 2.2 设计原则 (7) 2.3 运维管理体系架构设计 (8) 2.3.1 系统总体架构设计 (8) 2.3.2 监控采集层 (9) 2.3.3 数据处理层 (9) 2.3.4 运行展现层 (9) 2.4 系统技术路线 (10) 2.4.1 采用Java语言开发 (10) 2.4.2 采用J2EE框架 (11) 2.4.3 采用WebService进行数据互连互通 (11) 2.4.4 数据库技术 (13) 2.4.5 性能控制 (14) 2.4.6 开发、运行环境 (14) 2.5 应用接口总体设计 (14) 2.5.1 系统内部集成接口 (14) 2.5.2 与基础运维管理工具的集成接口 (15) 2.5.3 与ITSM系统的集成接口 (15) 2.5.4 与相关外部系统的统一身份认证与单点登录接口 (15) 2.6 系统安全设计及部署 (16) 2.6.1 输入检验 (16) 2.6.2 GET请求和Cookie中的敏感数据 (16)

2.6.3 防通过嵌入标记实现的攻击 (16) 2.6.4 防口令猜测功能 (17) 2.6.5 页面和字段级的权限控制 (17) 2.6.6 系统安全架构 (17) 第3章系统功能设计 (18) 3.1 动环监控 (18) 3.1.1 配电柜监测 (18) 3.1.2 配电开关及电流监控 (18) 3.1.3 发电机监控 (19) 3.1.4 ATS监测 (19) 3.1.5 STS监测 (19) 3.1.6 UPS监控子系统 (20) 3.2 统一门户子系统 (20) 3.2.1 信息主管领导内容展示 (21) 3.2.2 运维人员内容展现 (21) 3.2.3 一般用户内容展现 (22) 3.3 IT运行监控子系统 (22) 3.3.1 基础平台功能 (22) 3.3.2 网络设备管理 (24) 3.3.3 服务器监控管理 (27) 3.3.4 存储监控管理 (30) 3.3.5 数据库监控管理 (30) 3.3.6 中间件监控管理 (31) 3.3.7 web与应用监控管理 (32) 3.3.8 虚拟化监控管理 (33) 3.3.9 IP地址管理管理 (34) 3.3.10 信息点管理 (35) 3.3.11 告警监控管理与转发处理 (36) 3.3.12 综合监控管理 (37)

IT综合运维管理系统技术方案

IT综合运维管理系统 技 术 方 案

目录 1.1.项目总体背景................................................. 1.2.项目的总体思路............................................... 整体思路..................................................... 建设与管理范围............................................... 达到的效果................................................... 1.3.综合运维管理系统............................................. 系统简述..................................................... 架构和功能................................................... 第2章需求分析 ...................................................... 2.1.总体要求..................................................... 2.2.需求分析..................................................... 2.3.建设目标..................................................... 第3章整体架构设计 .................................................. 3.1.实施范围..................................................... 3.2.网络系统管理模式............................................. 3.3.统一的网络系统解决方案蓝图................................... 代理方式与无代理方式结合的设计............................... 数据库设计考虑............................................... 3.4.平台总体设计................................................. 设计要求..................................................... 结合BTIM的平台总体设计...................................... 信息系统综合网管系统系统软件的选型........................... 设计要求..................................................... 数据采集层技术设计........................................... 3.5.数据管理层技术设计........................................... 设计要求..................................................... 数据管理层技术设计........................................... 3.6.其他技术设计................................................. 设计要求..................................................... 相关技术设计................................................. 3.7.平台功能扩展设计(接口方面的设计)........................... 第4章综合管理系统功能 .............................................. 4.1.综合网管系统架构图........................................... 4.2.综合监控..................................................... 综合监控的优势和亮点......................................... 管理监控与值班监控的功能..................................... 设备运行的功能............................................... 线路流量的功能...............................................

信息化系统 安全运维服务方案技术方案(标书)

信息化系统安全运维服务方案

目录 1概述 (3) 1.1服务范围和服务内容 (3) 1.2服务目标 (3) 2系统现状 (3) 2.1网络系统 (3) 2.2设备清单 (4) 2.3应用系统 (6) 3服务方案 (7) 3.1系统日常维护 (7) 3.2信息系统安全服务 (14) 3.3系统设备维修及保养服务 (16) 3.4软件系统升级及维保服务 (18) 4服务要求 (18) 4.1基本要求 (18) 4.2服务队伍要求 (20) 4.3服务流程要求 (20) 4.4服务响应要求 (21) 4.5服务报告要求 (23) 4.6运维保障资源库建设要求 (23) 4.7项目管理要求 (24)

4.8质量管理要求 (24) 4.9技术交流及培训 (24) 5经费预算 (25)

1概述 1.1服务范围和服务内容 本次服务范围为XX局信息化系统硬件及应用系统,各类软硬件均位于XX局第一办公区内,主要包括计算机终端、打印机、服务器、存储设备、网络(安全)设备以及应用系统。服务内容包括日常运维服务(驻场服务)、专业安全服务、主要硬件设备维保服务、主要应用软件系统维保服务、信息化建设咨询服务等。 1.2服务目标 ●保障软硬件的稳定性和可靠性; ●保障软硬件的安全性和可恢复性; ●故障的及时响应与修复; ●硬件设备的维修服务; ●人员的技术培训服务; ●信息化建设规划、方案制定等咨询服务。 2系统现状 2.1网络系统 XX局计算机网络包括市电子政务外网(简称外网)、市电子政务内网(简称内网)以及全国政府系统电子政务专网(简称专网)三部分。内网、外网、专网所有硬件设备集中于XX局机房各个独立区域,互相物理隔离。 外网与互联网逻辑隔离,主要为市人大建议提案网上办理、XX 局政务公开等应用系统提供网络平台,为市领导及XX局各处室提供互联网服务。外网安全加固措施:WSUS服务器、瑞星杀毒软件服务器为各联网终端提供系统补丁分发和瑞星杀毒软件管理服务,建立IPS、防火墙等基本网络安全措施。

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案(此文word格式,下载后可直接编辑修改套用)

目录 第1章概述 (5) 1.1 建设背景 (5) 1.2 建设目标 (5) 1.3 建设思路 (6) 第2章系统总体设计 (7) 2.1 总体架构 (7) 2.2 设计原则 (8) 2.3 运维管理体系架构设计 (9) 2.3.1 系统总体架构设计 (9) 2.3.2 监控采集层 (10) 2.3.3 数据处理层 (10) 2.3.4 运行展现层 (10) 2.4 系统技术路线 (11) 2.4.1 采用Java语言开发 (11) 2.4.2 采用J2EE框架 (12) 2.4.3 采用WebService进行数据互连互通 (12) 2.4.4 数据库技术 (14) 2.4.5 性能控制 (15) 2.4.6 开发、运行环境 (15) 2.5 应用接口总体设计 (15) 2.5.1 系统内部集成接口 (15) 2.5.2 与基础运维管理工具的集成接口 (16) 2.5.3 与ITSM系统的集成接口 (16) 2.5.4 与相关外部系统的统一身份认证与单点登录接口 (16) 2.6 系统安全设计及部署 (17) 2.6.1 输入检验 (17) 2.6.2 GET请求和Cookie中的敏感数据 (17) 2.6.3 防通过嵌入标记实现的攻击 (17)

2.6.4 防口令猜测功能 (18) 2.6.5 页面和字段级的权限控制 (18) 2.6.6 系统安全架构 (18) 第3章系统功能设计 (19) 3.1 动环监控 (19) 3.1.1 配电柜监测 (19) 3.1.2 配电开关及电流监控 (19) 3.1.3 发电机监控 (20) 3.1.4 ATS监测 (20) 3.1.5 STS监测 (20) 3.1.6 UPS监控子系统 (21) 3.2 统一门户子系统 (21) 3.2.1 信息主管领导内容展示 (22) 3.2.2 运维人员内容展现 (22) 3.2.3 一般用户内容展现 (23) 3.3 IT运行监控子系统 (23) 3.3.1 基础平台功能 (23) 3.3.2 网络设备管理 (25) 3.3.3 服务器监控管理 (28) 3.3.4 存储监控管理 (31) 3.3.5 数据库监控管理 (31) 3.3.6 中间件监控管理 (32) 3.3.7 web与应用监控管理 (33) 3.3.8 虚拟化监控管理 (34) 3.3.9 IP地址管理管理 (35) 3.3.10 信息点管理 (36) 3.3.11 告警监控管理与转发处理 (37) 3.3.12 综合监控管理 (38) 3.3.13 综合报表管理 (39)

信息化系统 安全运维服务方案技术方案 标书

信息化系统 安全运维服务方案

目录

1概述 服务范围和服务内容 本次服务范围为XX局信息化系统硬件及应用系统,各类软硬件均位于XX局第一办公区内,主要包括计算机终端、打印机、服务器、存储设备、网络(安全)设备以及应用系统。服务内容包括日常运维服务(驻场服务)、专业安全服务、主要硬件设备维保服务、主要应用软件系统维保服务、信息化建设咨询服务等。服务目标 ●保障软硬件的稳定性和可靠性; ●保障软硬件的安全性和可恢复性; ●故障的及时响应与修复; ●硬件设备的维修服务; ●人员的技术培训服务; ●信息化建设规划、方案制定等咨询服务。 2系统现状 网络系统 XX局计算机网络包括市电子政务外网(简称外网)、市电子政务内网(简称内网)以及全国政府系统电子政务专网(简称专网)三部分。内网、外网、专网所有硬件设备集中于XX局机房各个独立区域,互相物理隔离。 外网与互联网逻辑隔离,主要为市人大建议提案网上办理、XX局政务公开等应用系统提供网络平台,为市领导及XX局各处室提供互联网服务。外网安全加固措施:WSUS服务器、瑞星杀毒软件服务器为各联网终端提供系统补丁分发和瑞星杀毒软件管理服务,建立IPS、防火墙等基本网络安全措施。 内网与外网和互联网物理隔离,为XX局日常公文流转、公文处理等信息化系统提供基础网络平台。内网安全加固措施:WSUS服务器、瑞星杀毒软件服务器为各联网终端提供系统补丁分发和瑞星杀毒软件管理服务;配备防火墙实现内网中服务器区域间的逻辑隔离及安全区域间的访问控制,重点划分服务器区,实现相应的访问控制策略。 专网由XX局电子政务办公室统一规划建设,专网和互联网、内网及其他非涉密网络严格物理隔离,目前主要提供政务信息上报服务和邮件服务。

IT运维管理平台

简单运维 轻松管理 统一门户管理 云基础架构管理 管理 统计报表 无线管理 业务服务管理 数据中心管理 @ 告警管理

RIIL-BMC,综合业务管理平台 以IT业务价值为核心,帮助企业构建可视、智能的IT一体化管理动态模型,通过端到端海量IT数据的实时透视与分析,洞察企业IT正在发生的一切,为企业IT管理提供决策依据与最佳实践指引,提升企业IT运营管理水平,挖掘IT 业务价值。 统一门户管理 整合运维数据,打造个性化的信息看板 Portal一体化门户定位于连接RIIL各产品、各模块的统一访问门户,为用户提供整合的资源信息、统一的用 户登录认证、个性化的管理界面等服务 业务服务管理 业务运行状况有效度量与数据分析,快速定位业务故障点 业务服务管理帮助IT管理者全局掌握业务的运行状态和健康水平,了解动态变化趋势,快速查明问题源,降 低运营风险。同时可直观反映IT资源的运行状况对应用系统、核心业务以及用户的影响,遇到故障帮助IT人

业务体验分析 基于嗅探技术获取用户体验数据,提升用户满意度 关注用户满意度,实时监测各关键应用性能,提供详细的性能和故障现场数据,分析业务交易服务质量,构建以业务为中心的业务管理视图。帮助客户了解其业务应用系统的使用情况及最终用户的体验情况。 告警管理 智能化故障关联分析,提升故障处理时效 告警管理帮助管理人员实时掌握所有业务系统的运行状态,一旦发现异常,快速定位问题根源点,并主动通知责任人,采用直观的可视化方式进行故障分析管理,降低管理人员的工作难度,提升整体故障处理的工作效率。 无线管理 多厂商,有线、无线一体化管理 支持对锐捷、H3C、华为、Cisco、Aruba、Juniper、中兴等无线设备的的全方位管理。图形化展现无线设备及用户分布情况,用户体验好坏直观可视

XXIT运维监控管理平台建设方案

XXIT运维监控管理平台建设方案 IT运维监控管理平台建设方案XXXXXXX 目录第1章概述3 1.1 建设背景3 1.2 建设目标3 1.3 建设思路 4 第2章系统总体设计5 2.1 总体架构 5 2.2 设计原则6 2.3 运维管理体系架构设计7 2.3.1 系统总体架构设计7 2.3.2 监控采集层8 2.3.3 数据处理层8 2.3.4 运行展现层8 2.4 系统技术路线9 2.4.1 采用Java语言开发9 2.4.2 采用J2EE框架10 2.4.3 采用WebService进行数据互连互通10 2.4.4 数据库技术12 2.4.5 性能控制13 2.4.6 开发、运行环境13 2.5 应用接口总体设计13 2.5.1 系统内部集成接口13 2.5.2 与基础运维管理工具的集成接口14 2.5.3 与ITSM系统的集成接口14 2.5.4 与相关外部系统的统一身份认证与单点登录接口14 2.6 系统安全设计及部署15 2.6.1 输入检验15 2.6.2 GET请求和Cookie中的敏感数据15 2.6.3 防通过嵌入标记实现的攻击15 2.6.4 防口令猜测功能16 2.6.5 页面和字段级的权限控制16 2.6.6 系统安全架构16 第3章系统功能设计17 3.1 动环监控17 3.1.1 配电柜监测17 3.1.2 配电开关及电流监控17 3.1.3 发电机监控18 3.1.4 ATS监测18 3.1.5 STS监测18 3.1.6 UPS监控子系统19 3.2 统一门户子系统19 3.2.1 信息主管领导内容

展示20 3.2.2 运维人员内容展现20 3.2.3 一般用户内容展现21 3.3 IT运行监控子系统21 3.3.1 基础平台功能21 3.3.2 网络设备管理23 3.3.3 服务器监控管理26 3.3.4 存储监控管理29 3.3.5 数据库监控管理29 3.3.6 中间件监控管理30 3.3.7 web与应用监控管理31 3.3.8 虚拟化监控管理32 3.3.9 IP地址管理管理33 3.3.10 信息点管理34 3.3.11 告警监控管理与转发处理35 3.3.12 综合监控管理36 3.3.13 综合报表管理37 3.4 IT服务管理子系统38 3.4.1 功能特点38 3.4.2 服务台管理41 3.4.3 服务目录管理42 3.4.4 服务请求管理42 3.4.5 事件管理43 3.4.6 问题管理43 3.4.7 变更管理44 3.4.8 值班管理44 3.4.9 公告管理45 3.4.10 IT运维报告45 3.4.11 用户管理46 第4章培训方案46 第5章系统价值47 第6章售后服务47第1章概述1.1 建设背景随着近年来经济的进一步迅速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是随着信息化建设的不断深入,信息系统越来越多,各类系统越来越复杂,系统的关联度也越来越高。数据处理量成倍增长,而随着互联网应用的发展,网上应用系统也越来越多,使IT 系统运行环境变得更加复杂,造成了机房管理、系统监控、运行维护工作十分困难的局面。虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,及时发现与解决网络、硬件、安全设备、操作系

软件平台运维技术方案总体方案

软件平台运维技术方案 总体维护方案 全面保障招标人信息、应用系统平稳运行及有效应用,总体目标如下: 建立系统运维机制。提供全程运维服务,出现故障应能及时告警。必须建立完善的运维机制,包括运维团队、运维方案、运维制度、应急预案等:不发生六级及以上通信设备事件。不发生因云平台环境原因造成的系统故障、停机等事件。 信息安全。运维人员严格遵守有关信息安全与保密管理规定,运维期不得发生六级及以上信息安全事件。 运行指标要求。主机系统(包括存储)可用率不低于%。主机系统可用率=(总时间-主机计划外停机时间)/总时间*100%。应用系统可用率不低于%。应用系统可用率=(总时间-计划外停机时间)/总时间*100%。网络可用率不低于%。信息网络可用率=(总时间-计划外网络中断时间)/总时间*100%服务满意度。服务态度端正,有问必答,用语规范,态度诚恳,耐心解答用户疑难,虚心听取用户意见,处理业务不拖拉,不推诿。客户服务满意度达到99%以上。客户服务年投诉次数小于4次。 问题响应效率。从开始处理后3个小时内解决的问题占全部问题的比重不得低于80%;在一个小时内响应的问题占全部问题的比重不得低于95%;客户端、网络、用户管理、权限变更、操作类问题一个工作日内解决,业务流程、系统配置、权限设计类问题视问题的情况,一般在5个工作日内解决,系统变更业务审批在5个工作日内完成,新需求、开发类问题需视开发及测试情况尽快解决。 恢复措施。具备自动或手动恢复措施,以便在发生错误时能够快速地恢复

正常运行。软件系统故障时,自动恢复时间< 30分钟,手工恢复时间< 4 小时。 信息资产统计服务 此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。 服务内容包括: 后台管理系统数据信息统计记录 门户网站信息发布安全管理 系统新增功能接口对接及研发 软件产品型号、版本和补丁等信息统计记录 网络结构、网络路由、网络IP地址统计记录 其它附属数据的统计记录 网络、安全系统运维服务 从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容: 序 号 服务模块内容描述 1云服务器配置配合用户进行,云服务器后买,安装部署,调试等工作 2系统故障诊断按服务级别:7×24小时

IT运维管理平台需求方案

I T运维管理平台需求方 案 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

IT运维管理平台需求方案 深圳市粤港科技有限公司 2017年7月 1.项目概述 1.1项目背景 1.2项目目标 通过构建IT服务管理平台,达到以下目标: 1)流程规范化:运用ITIL最佳经验,建设事件管理、问题管理、变更管理、发布 管理,配置管理、知识库、自助服务流程,规范IT运维工作;梳理IT运维服务流程,提供高质量的服务。 2)平台统一化:构建统一的IT服务平台,以此为基础推广到全公司的IT运维和管 理工作,为IT服务提供有力技术支撑。 3)系统集成化:实现与企业现有众多的管理系统包括门户系统、短信平台、邮件系 统等的集成,发挥信息整合和联动优势;

4)管理可视化:有效监控和分析管理流程运行的效率,产生有效的流程管理信息, 实现对服务流程的不断改进和提升。 2.功能需求 2.1服务台 服务台的主要目标:是协调客户(用户)和IT部门之间的关系,为IT服务运作提供支持,从而提高客户的满意度。 IT部门通过服务台统一授理各类事件或服务请求,并使现在由人工完成的事件或服务请求的记录、分派、监督通知、解决方案记录、报表统计等过程电子化、自动化,降低人工操作和管理带来的风险,以提高系统使用人员的工作效率和服务水平,实现IT服务管理质量的同步提升。有以下的需求: 1)可针对不同的事件类型、处理状态、处理人员、组织结构等进行统计分析,并用 图形显示。 2)能够根据自定义的起止时间实现数据查询和报表定制。系统可按小时、日、周、 月、年等不同时间梯度对系统中数据进行汇总、整理。 3)服务台可以向指定人员或群组发送广播通知(邮件或短信)。 4)可以对接收到的事件信息进行必要的统计,得出可用分析用的报表。 5)服务台实现灵活的通知机制,通知的方式包括:发送电子邮件、短信。 6)对于处理完毕的服务请求,系统自动产生回访调查,由最终用户在网页上填写对 处理的反馈意见和评分,以促进服务水平的不断改进。 2.2自助服务管理 自助服务管理是提高服务台效率和客户满意度的有效手段。自助服务管理通过服务目录发布服务内容,帮助用户自己处理事件或完成事件、问题的申报,从而大量降低了

(完整word版)云平台运维建设方案

xxx 区国土资源 一张图工程和服务平台系统 基础支撑平台与运维保障平台





目录
1 项目概述 ................................................................................................................................... 2
1.1 项目背景 ................................................................................................................................. 2 1.2 项目目标 ................................................................................................................................. 2 1.3 建设内容 ................................................................................................................................. 2
2 现状及需求分析 ........................................................................................................................ 3
2.1 信息化现状 ............................................................................................................................. 3 2.2 存在的问题 ............................................................................................................................. 4
2.2.1 运维保障面临主要问题 ................................................................................................. 4 2.2.2 现有保障手段不能满足需求 ......................................................................................... 4 2.2.3 管理运维问题 ................................................................................................................. 5
3 方案总体设计............................................................................................................................6
3.1 设计原则 ................................................................................................................................. 6 3.2 总体架构设计 ......................................................................................................................... 7 3.3 实施思路 ................................................................................................................................. 7
4 虚拟桌面技术方案设计 .......................................................................................................... 10
5 服务器虚拟化方案设计 .......................................................................................................... 11
6 业务系统运维保障设计 .......................................................................................................... 13
6.1 架构设计 ............................................................................................................................... 13 6.2 业务系统应急 ....................................................................................................................... 14 6.3 数据保障 ............................................................................................................................... 15 6.4 运维迁移 ............................................................................................................................... 15
7 项目实施计划.......................................................................................................................... 16
8 项目组织保障.......................................................................................................................... 17
8.1 工作领导小组 ....................................................................................................................... 17 8.2 项目专家小组 ....................................................................................................................... 17 8.3 项目技术小组 ....................................................................................................................... 17

软件平台运维技术方案34服务计划及水平管理

1软件平台运维技术方案 1.3 维护服务流程 1.3.1 主动式服务 (1)定期预防性维护服务 维护团队根据系统维护服务计划或用户要求为用户提供定期预防性维护服务。此类服务是有计划有步骤进行的,目的是为了提高系统的可使用率和高可靠性,把系统故障的可能性降低到最低。在硬件维护方面,要求维护团队工程师每两周进行一次现场例行检查,为用户维护硬件设备,并为用户替换那些虽然能够工作但不是很正常的部件,以避免系统崩溃的情况发生,防患于未然。在系统服务方面,投标方应指定预防性服务级别,安装预防性PTF软件(补丁软件)检测系统运行状况,解决系统软件问题,使用户的系统保持良好的运行状况。 (2)系统运行健康检查 维护团队应提供一月一次的系统运行健康检查,按计划由专家定期对主机系统性能进行诊断,根据结果出具性能诊断报告,并征得用户同意后调整系统参数,使系统始终在最佳状态下运行。对可能出现的问题提供科学预测,并采取必要的预防和补救措施,防患于未然。 (3)系统运行状况分析 每季一次对系统的运行状况分析。提供本项目系统设备和PC服务器设备运行状态和性能的分析、评估服务,以提高系统的可靠性、可用性和整体性能。每年一次向用户提交详细的系统可用性、安全性、运行状况分析等预防性维护策略、报告和总结。 1.3.2 纠错性维护/维修服务 维护团队应提供电话技术支持服务或到场维修服务。在部件服务方面,维护团队应及时确认故障原因,并更换故障部件,恢复系统正常运行。解决系统软件问题,恢复系统软件正常运行,作系统备份,递交系统检查报告等。

1.4 服务计划及水平管理 1.4.1 服务时间 (1)接收服务请求和咨询: (2)在5*8 小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。 (3)在非工作时间设置有专人7*24 小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24 小时系统监控人员的系统突发情况汇报。

企业自动化运维平台设计方案

企业自动化运维平台设计方案

目录 1.企业运维现状与发展趋势 (3) 2.企业运维存在的问题与需求 (3) 2.1运维人员的工作效率与工作主动性需要提升 (4) 2.2需要建立一套高效的运维机制 (4) 2.3缺乏高效的运维技术工具 (4) 3.业务流程标准化与健全运维管理制度 (5) 3.1实现业务流程标准化,为自动化运维打好基础 (5) 3.2建立完整、全面的运维管理制度,为自动化运维的实现保驾护航 (8) 4.自动化运维技术路线选型 (9) 4.1自动化运维概述 (9) 4.2开源运维工具的应用场景与优势 (9) 4.3Saltstack 实现服务器部署的自动化 (14) 5.自动化运维方案设计 (18) 5.1自动化运维规划图 (18) 5.2自动化运维平台模块设计 (20) 6企业自动化运维方案总结 (21)

1.企业运维现状与发展趋势 随着企业信息化的不断发展,运维人员需要面对越来越复杂的业务和越来越多样化的用户需求,不断扩展的应用需要越来越合理的模式来保障运维服务能灵活便捷、安全稳定地持续。某企业从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低运维服务成本的因素越来越被人们所重视。其中,自动化开始代替人工操作在企业的运维过程中逐渐体现出来了强大的优势。 运维随着企业业务的发展,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。通过自动化运维能最大限度地在更少的维修时间内实现运维目标,提高运维服务质量。因此, 对于越来越复杂的运维来说,将人工操作逐渐改变为自动化管理是一个重要发展趋势。 2.企业运维存在的问题与需求 某企业初期只有文件共享和邮件服务等几台服务器,运维工作完全由人工操作,随着企业的发展,新业务系统不断上线企业建设了中心机房,运维工作还是以人工为主,但是这一阶段增加了网络管理系

校园网综合运维管理平台

校园网综合运维管理平台 一、系统简要描述 ●系统名称:DTSM校园网综合运维管理平台 ●开发单位:广州市点易资讯科技有限公司 ●版本号: ●开发模式:定制开发 ●系统架构:B/S 结构 ●开发平台: ●数量: 1套 ●报价: 人民币33万元 ●功能及用途简要描述 DTSM校园网综合运维管理平台是为校园网用户提供网络自助服务和网络服务运维流程管理的专业平台,整合校园网系统运行环境、网络、服务器与业务应用等的分割管理,实现对IT系统的集中、统一、全面流程管理;平台系统设计遵循 FCAPS、eTOM、ITIL等国际服务管理标准和规范,达到技术、功能、服务三方面的有机整合,能实现IT 服务支持过程的标准化、流程化、规范化,提高故障应急处理能力,提升系统运维的管理效率和服务水平。 该平台主要功能包括服务台、流程管理、设备监控管理等,实现校园网用户入网流程管理、网络服务流程管理、网络资源管理,平台能够与收费系统和认证系统对接并实现数据交互。 二、模块功能描述 1、网络服务流程管理模块 提供用户网络自助报障、Duty值班事件受理、故障流程管理(包括资源 配置库管理、流程跟踪、服务质量管理等)、服务统计、回访等功能; (1)用户网络自助报障

用户通过自助平台故障报修,可查询报障记录和故障处理进度。(2)Duty值班事件受理 Duty值班受理电话报障和网上报障,并在运维管理平台上建立(或确认)事件工单。 (3)运维流程管理 具体实现流程为: 服务台通过网路和电话受理建立工单; 一线人员通过系统接单和处理,处理包括事件成功处理之后的申请关闭,或申请二线支持,或不能处理的申请撤单。 二线人员可以受理一线(或项目经理)转交的工单或则直接从服务台接单处理,成功处理可以申请关闭,或则回退给一线工程师等; 服务台人员可以根据处理情况进行回访,并给予意见; 项目经理根据一线、二线的处理情况和回访情况,决定事件的关闭或则回退等相关处理。 在这期间,涉及到服务台、事件管理、问题管理、变更和发布管理、服务水平管理、知识库和方案库管理; ●服务台 ●建立运维团队与用户之间的单一联系点,统一受理用户的咨询、服 务请求、故障报修、流程跟踪、投诉等情况,并通过底层监控系统 主动预警网络故障,通过事件管理流程及时处理,及时跟踪和通报 处理进展,借助知识库和方案库,解决大部分常规事件。同时,也 包括集中监控平台、电子值班管理、统一实时展现IT运行状况。 ●事件管理 ●事件管理流程是事件驱动的日常流程。服务台接收到的事件主要包 括故障和服务请求。事件管理负责事件的调查、诊断、修复,其主 要目标是尽可能快地解决故障,以恢复受影响的业务。 ●问题管理 ●主动的问题管理主要是进行各个系统的巡检、分析和建议。被动的 问题管理主要是分析各个系统的故障,定义问题,并提出可能变更

相关主题
文本预览
相关文档 最新文档