IT综合运维管理系统技术方案
- 格式:docx
- 大小:314.87 KB
- 文档页数:88
it运维管理系统解决方案
《IT运维管理系统解决方案》
随着信息技术的迅速发展,企业的IT系统也变得日益复杂和
庞大。
为了保证IT系统的稳定运行和高效管理,企业需要一
套完善的IT运维管理系统。
这个系统可以帮助企业监控、维
护和管理其IT基础设施,以确保系统的稳定性和安全性。
IT运维管理系统通常包括硬件设备监控、软件运行监控、网
络监控、故障处理、性能优化、安全管理等功能。
通过这些功能的整合,企业可以实现对IT系统的全面监控和管理,及时
发现并解决潜在问题,减少系统故障和停机时间,提高系统的可靠性和稳定性。
在选择IT运维管理系统解决方案时,企业需要考虑多方面因素。
首先,系统需要具备高可用性和可靠性,能够实时监控并响应问题,确保系统的连续性。
其次,系统需要具有灵活的配置和扩展能力,能够适应企业不断变化的IT环境和需求。
另外,系统还需要具备友好的用户界面和强大的报表功能,方便运维人员进行管理和分析。
目前市场上有许多IT运维管理系统解决方案,如SolarWinds、Splunk、BMC等。
这些系统都具有各自的特点和优势,企业
需要根据自身的实际情况和需求进行选择。
同时,企业还可以根据自身情况定制化或定制开发适合自己的IT运维管理系统
解决方案。
总的来说,一个完善的IT运维管理系统解决方案对于企业的IT系统稳定运行和高效管理至关重要。
通过选择合适的系统解决方案,并结合企业自身的实际情况进行定制化,可以帮助企业实现对IT系统的全面监控和管理,提高系统的可靠性和稳定性,为企业的发展和创新提供有力支持。
IT综合运维管理系统技术方案目录1.1.项目总体背景.................................................1.2.项目的总体思路...............................................整体思路.....................................................建设与管理范围...............................................达到的效果...................................................1.3.综合运维管理系统.............................................系统简述.....................................................架构和功能................................................... 第2章需求分析 ......................................................2.1.总体要求.....................................................2.2.需求分析.....................................................2.3.建设目标..................................................... 第3章整体架构设计 ..................................................3.1.实施范围.....................................................3.2.网络系统管理模式.............................................3.3.统一的网络系统解决方案蓝图...................................代理方式与无代理方式结合的设计...............................数据库设计考虑...............................................3.4.平台总体设计.................................................设计要求.....................................................结合BTIM的平台总体设计......................................信息系统综合网管系统系统软件的选型...........................设计要求.....................................................数据采集层技术设计...........................................3.5.数据管理层技术设计...........................................设计要求.....................................................数据管理层技术设计...........................................3.6.其他技术设计.................................................设计要求.....................................................相关技术设计.................................................3.7.平台功能扩展设计(接口方面的设计)........................... 第4章综合管理系统功能 ..............................................4.1.综合网管系统架构图...........................................4.2.综合监控.....................................................综合监控的优势和亮点.........................................管理监控与值班监控的功能.....................................设备运行的功能...............................................线路流量的功能...............................................峰值流量的功能...............................................环境监控的功能...............................................告警总览的功能...............................................服务总览的功能...............................................4.3.网络拓扑管理.................................................网络拓扑管理的优势和亮点.....................................自动发现生成网络物理拓扑图...................................基于IE的拓扑浏览............................................拓扑图监视...................................................网络拓扑图编辑...............................................常用工具的集成...............................................TOPN性能排序 ................................................图例管理.....................................................4.4.网络监控管理.................................................网络监控管理的优势和亮点.....................................网络监控管理详细介绍.........................................设备负载一览的功能...........................................线路流量一览的功能...........................................TOPN性能分析的功能 ..........................................端口流量分析的功能...........................................交换机用户连接信息的功能.....................................交换机VLAN分布表的功能......................................其他网络监控功能.............................................4.5.设备面板管理.................................................设备面板图管理...............................................网元配置参数备份.............................................自动识别堆叠式设备...........................................关闭/打开端口................................................VLAN划分,VLAN自动辨识......................................更改VLAN ....................................................端口状态.....................................................端口下联设备.................................................设备支持.....................................................4.6.接入管理管理.................................................IP地址管理 ..................................................IP安全管理 ..................................................4.7.数据流分析...................................................功能描述.....................................................数据流分析的优势.............................................功能实现.....................................................功能特点.....................................................4.8.主机系统服务资源管理.........................................系统和通用应用数据采集.......................................主机管理.....................................................数据库管理...................................................中间件管理...................................................应用管理.....................................................系统和通用应用故障管理.......................................告警管理通知方式.............................................数据传输安全管理.............................................4.9.业务管理.....................................................业务结构.....................................................业务运行管理.................................................业务安全管理.................................................业务使用与流量分析...........................................根原因分析...................................................业务报表.....................................................用户模拟体验功能.............................................4.10.存储管理....................................................存储管理的优势和亮点.........................................部署方式.....................................................产品特性.....................................................4.11.虚拟化管理..................................................虚拟化管理的优势和亮点.......................................部署方式.....................................................产品特性.....................................................4.12.故障告警管理................................................故障管理的优势和亮点.........................................BTIM故障管理详细介绍 ........................................基线数据管理的功能...........................................告警日志查询的功能...........................................辅助查询的功能...............................................ARP干扰设置的功能 ...........................................其他告警.....................................................4.13.报表管理....................................................报表管理的优势和亮点.........................................报表内容说明.................................................报表展现类别说明.............................................报表提供方式.................................................4.14.机房管理....................................................4.15.统一监控平台................................................服务拓扑展现功能说明.........................................运行展现功能说明.............................................告警展现功能说明.............................................系统管理的优势和亮点.........................................用户管理的功能...............................................用户操作审计的功能...........................................当前在线用户的功能...........................................当前用户编辑的功能...........................................网管邮件发送帐号的功能....................................... 第5章综合运维系统功能 ..............................................5.1.建设思路.....................................................5.2.系统概述.....................................................5.3.平台架构.....................................................5.4.基于ITIL功能模块............................................自助服务平台.................................................服务台.......................................................事件管理.....................................................问题管理.....................................................变更管理.....................................................发布管理.....................................................资产配置管理.................................................作业管理.....................................................知识管理.....................................................服务级别管理.................................................排班管理.....................................................5.5.运维系统功能.................................................门户平台.....................................................接口管理.....................................................流程设计.....................................................报表设计.....................................................流程监控.....................................................5.6.硬件&基础软件................................................硬件构成.....................................................故障恢复..................................................... 第6章项目管理与实施计划 ............................................6.1.项目总则.....................................................6.2.项目组织机构.................................................组织架构保证.................................................人员稳定.....................................................6.3.项目进度计划.................................................6.4.项目范围内容.................................................6.5.项目实施地点.................................................6.6.项目进度管理.................................................6.7.项目合同变更管理.............................................6.9.服务内容.....................................................6.10.项目管理....................................................6.11.项目交付成果................................................6.12.实施准备....................................................6.13.实施人员清单................................................6.14.实施工作进度计划............................................6.15.实施技术资料................................................ 第7章培训方案 ......................................................7.1.培训总论.....................................................7.2.培训内容.....................................................培训课程表...................................................课程内容简介.................................................培训资费..................................................... 第8章售后服务与日常运维方案 ........................................8.1.服务宗旨.....................................................8.2.北塔软件售后技术支持服务提供的内容...........................8.3.北塔软件售后服务网点.........................................项目概况项目总体背景随着某院信息化建设的快速发展,在新一代运载研保条件信息化项目完成后,拥有多台Windows服务器,多台用于高性能计算的Linux服务器、多个应用系统、多台网络路由交换设备以及近千台终端。
IT运维管理服务方案IT运维管理服务方案一、方案概述随着信息技术的快速发展,IT运维管理已成为企业运营管理的重要组成部分。
本IT运维管理服务方案旨在提供全面、高效、可靠的IT运维支持,确保企业信息系统的稳定运行,提高企业的业务连续性和竞争力。
二、方案内容●IT运维管理服务目标本方案的服务目标包括以下几个方面:●提高IT系统的可靠性和稳定性,减少系统故障和停机时间。
●优化IT系统的性能和资源利用,提高系统的处理能力和响应速度。
●建立完善的IT安全管理体系,保护企业信息资产的安全。
●降低IT运维成本,提高企业的投资回报率。
●提高客户满意度,赢得客户的信任和长期合作。
IT运维管理服务内容本方案的服务内容包括以下几个方面:●IT基础设施管理:提供网络、服务器、存储、虚拟化等基础设施的管理和维护服务,确保IT基础设施的稳定运行。
●应用系统管理:提供应用系统的部署、升级、优化和监控等服务,确保应用系统的正常运行和性能表现。
●数据中心管理:提供数据中心的管理和维护服务,包括数据备份、恢复、容灾等,确保数据的安全性和可用性。
●安全风险管理:提供IT安全风险评估、防范和应对等服务,包括漏洞扫描、安全加固、入侵检测等,确保企业信息资产的安全。
●故障排除与恢复:提供IT系统故障排除和恢复服务,包括硬件故障、软件故障、网络故障等,确保IT系统的正常运行。
●培训与技术支持:提供IT培训和技术支持服务,包括系统操作培训、IT问题解答、技术支持热线等,提高企业员工的IT技能和知识水平。
●IT规划与咨询:提供IT规划和咨询服务,包括IT战略规划、系统选型、架构设计等,帮助企业优化IT架构和提高IT管理水平。
IT运维管理服务流程本方案的服务流程包括以下几个环节:●需求收集:了解客户的需求和要求,包括IT系统的运行环境、安全要求、故障处理等方面,制定服务计划。
●计划制定:根据需求收集的结果,制定具体的服务计划,包括服务内容、时间、人员等。
IT综合运维管理系统技术方案一、系统架构1.总体架构IT综合运维管理系统采用三层架构,包括用户界面层、业务逻辑层和数据访问层。
用户界面层提供用户界面,用户可以通过浏览器访问系统;业务逻辑层处理用户请求,调用相应的逻辑处理代码;数据访问层负责数据的读取和存储。
2.技术选型用户界面层使用HTML、CSS和JavaScript编写,前端框架选择AngularJS;业务逻辑层使用Java编程语言,并采用Spring Boot框架进行开发;数据访问层使用MyBatis作为ORM框架,访问数据库。
系统采用MySQL作为数据库管理系统。
二、系统功能模块1.用户管理模块该模块用于对系统的用户进行管理,包括用户的新增、删除和修改,以及用户的权限控制。
系统管理员可以管理用户的权限和角色,提供灵活的权限分配方式。
2.设备管理模块该模块用于对企业的IT设备进行综合管理,包括设备的新增、删除和修改,以及设备的监控和维护。
系统可以实时监控设备的状态和性能指标,同时提供预警机制,及时发现和解决设备问题。
3.故障管理模块该模块用于对设备故障进行管理,包括故障的报告、分析和解决。
系统可以自动收集设备的故障信息,并提供故障分析报告和解决方案。
同时,系统还可以对故障进行统计和分析,提供故障管理决策支持。
4.变更管理模块该模块用于对IT资源的变更进行管理,包括变更的申请、审批和执行。
系统可以提供变更管理流程和控制机制,确保变更的有效性和可靠性。
同时,系统还可以记录和跟踪变更的历史,方便后续的审计和追溯。
5.性能管理模块该模块用于对设备的性能指标进行监控和管理,包括设备的CPU、内存、网络等指标。
系统可以实时采集和展示设备的性能数据,同时提供性能报表和趋势分析。
6.日志管理模块该模块用于对系统的操作日志进行管理,包括日志的记录、查询和分析。
系统可以将用户的操作日志进行记录和存储,并提供查询和分析功能。
同时,系统还可以对日志进行报表和统计,方便管理者进行管理和决策。
IT运维管理系统方案1. 引言在现代企业中,信息技术(IT)早已被广泛应用于各个企业的日常运营中。
随着IT系统规模的不断扩大和复杂性的增加,IT运维管理变得愈发困难。
为了提高IT系统的可靠性和效率,并减少运维人员的工作负担,引入一个高效的IT运维管理系统变得至关重要。
本文将介绍一个完整的IT运维管理系统方案,涉及系统的架构、功能模块、数据存储和安全性等关键方面。
2. 系统架构IT运维管理系统的架构可以分为前端和后端两个部分。
前端主要负责用户交互和界面展示,后端则处理业务逻辑和数据存储。
2.1 前端架构前端架构采用Web应用程序的形式,使用JavaScript、HTML和CSS等技术构建。
用户通过Web浏览器与系统进行交互,系统向用户提供直观、友好的界面。
前端应具有以下特点: - 响应式设计:适应不同屏幕尺寸的设备,如PC、平板电脑和手机。
- 用户友好:简洁明了的界面和操作流程,提供可定制的个性化设置。
- 数据可视化:实时展示和可视化各种监控数据和报表。
2.2 后端架构后端架构采用分布式系统架构,将业务逻辑分离并进行合理的资源调度和数据处理。
后端应具有以下特点: - 可伸缩性:支持横向扩展,随着系统规模的增加能够保持稳定性和性能。
- 高可用性:多个节点部署,实现故障转移和自动恢复。
- 高效性:采用缓存技术和异步处理,提高系统的响应速度和吞吐量。
3. 功能模块IT运维管理系统应包含以下功能模块:3.1 资产管理资产管理模块负责收集并管理公司的硬件和软件资产信息。
包括对资产的采购、领用和报废等过程进行跟踪和记录。
3.2 配置管理配置管理模块负责管理IT系统的配置信息,包括硬件设备、操作系统、数据库和应用程序等。
可以对配置项进行维护和版本控制。
3.3 工单管理工单管理模块用于处理用户提交的问题和请求。
用户可以通过系统提交工单,运维人员收到工单后进行处理,并将处理过程和结果反馈给用户。
3.4 监控和告警监控和告警模块负责监控关键性能指标和事件,并生成告警通知。
综合IT运维管理解决方案介绍综合IT运维管理解决方案是指通过合理的组织和管理IT设备和系统,以确保其安全、高效运行的一系列措施和方法。
在企业和组织中,IT设备和系统的稳定运行对于提高生产效率和维护业务连续性至关重要,因此综合IT运维管理解决方案越来越受到重视。
1.网络基础设施管理:网络是现代企业和组织的核心基础设施,网络设备的运行状况直接影响到整个系统的稳定性。
因此,综合IT运维管理解决方案需要包括网络设备的监控、故障排除和性能优化等功能,以保证网络的正常运行。
2.服务器和存储管理:服务器是支撑企业和组织各种业务应用的关键设备,而存储设备则为数据的安全保存提供了基础。
综合IT运维管理解决方案需要包括监控服务器的运行状态、进行故障诊断和容量规划等功能,并能够对存储设备进行统一管理和备份。
3.应用系统管理:综合IT运维管理解决方案还需要包括对各种应用系统的管理,包括安装、配置、监控和更新等功能。
通过对应用系统的全面管理,可以及时发现和解决问题,提高系统的稳定性和安全性。
4.安全管理:信息安全是综合IT运维管理解决方案中不可忽视的一环。
综合IT运维管理解决方案需要具备强大的安全功能,包括实施安全策略、监控网络安全事件、进行漏洞扫描和修复等。
只有保证信息的安全性,企业和组织才能避免遭受损失。
5.运维流程管理:综合IT运维管理解决方案还需要包括对运维流程的规范化和自动化管理。
通过制定规范的运维流程,并利用自动化工具进行执行,可以减少人为操作的错误和漏洞,提高运维效率和准确性。
1.提高运维效率:通过自动化工具和流程规范,可以减少运维操作的重复性和繁琐性工作,提高运维效率。
2.减少故障时间:通过实时监控和故障排除功能,可以及时发现和解决问题,减少系统故障的时间和影响。
3.提高系统稳定性:通过全面的监控和管理,可以及时发现并解决潜在问题,提高系统的稳定性和可靠性。
4.降低成本:通过自动化和规范化的运维管理,可以降低人力和物力成本,提高资源利用效率。
IT综合运维管理系统技术方案目录第1章项目概况 .....................................................1.1. 项目总体背景 ...............................................1.2. 项目的总体思路 .............................................整体思路 ...................................................建设与管理范围 .............................................达到的效果 .................................................1.3. 综合运维管理系统 ...........................................系统简述 ...................................................架构和功能 ................................................. 第2章需求分析 .....................................................2.1. 总体要求 ...................................................2.2. 需求分析 ...................................................2.3. 建设目标 ................................................... 第3章整体架构设计 .................................................3.1. 实施范围 ...................................................3.2. 网络系统管理模式 ...........................................3.3. 统一的网络系统解决方案蓝图 .................................代理方式与无代理方式结合的设计 .............................数据库设计考虑 .............................................3.4. 平台总体设计 ...............................................设计要求 ...................................................结合BTIM的平台总体设计 ....................................信息系统综合网管系统系统软件的选型.........................设计要求 ...................................................数据采集层技术设计 .........................................3.5. 数据管理层技术设计 .........................................设计要求 ...................................................数据管理层技术设计 .........................................3.6. 其他技术设计 ...............................................设计要求 ...................................................相关技术设计 ...............................................3.7. 平台功能扩展设计(接口方面的设计)......................... 第4章综合管理系统功能 .............................................4.1. 综合网管系统架构图 .........................................4.2. 综合监控 ...................................................综合监控的优势和亮点 .......................................管理监控与值班监控的功能 ...................................设备运行的功能 .............................................线路流量的功能 .............................................峰值流量的功能 .............................................环境监控的功能 .............................................告警总览的功能 .............................................服务总览的功能 .............................................4.3. 网络拓扑管理 ...............................................网络拓扑管理的优势和亮点 ...................................自动发现生成网络物理拓扑图 .................................基于IE 的拓扑浏览..........................................拓扑图监视 .................................................网络拓扑图编辑 .............................................常用工具的集成 .............................................性能排序 ....................................................图例管理 ...................................................4.4. 网络监控管理 ...............................................网络监控管理的优势和亮点 ...................................网络监控管理详细介绍 .......................................设备负载一览的功能 .........................................线路流量一览的功能 .........................................性能分析的功能 ..............................................端口流量分析的功能 .........................................交换机用户连接信息的功能 ...................................交换机VLAN分布表的功能 ....................................其他网络监控功能 ...........................................4.5. 设备面板管理 ...............................................设备面板图管理 .............................................网元配置参数备份 ...........................................自动识别堆叠式设备 .........................................关闭/打开端口 ..............................................划分,VLAN自动辨识..........................................更改VLAN...................................................端口状态 ...................................................端口下联设备 ...............................................设备支持 ...................................................4.6. 接入管理管理 ...............................................地址管理 ....................................................安全管理 ....................................................4.7. 数据流分析 .................................................功能描述 ...................................................数据流分析的优势 ...........................................功能实现 ...................................................功能特点 ...................................................4.8. 主机系统服务资源管理 .......................................系统和通用应用数据采集 .....................................主机管理 ...................................................数据库管理 .................................................中间件管理 .................................................应用管理 ...................................................系统和通用应用故障管理 .....................................告警管理通知方式 ...........................................数据传输安全管理 ...........................................4.9. 业务管理 ...................................................业务结构 ...................................................业务运行管理 ...............................................业务安全管理 ...............................................业务使用与流量分析 .........................................根原因分析 .................................................业务报表 ...................................................用户模拟体验功能 ...........................................4.10. 存储管理 ..................................................存储管理的优势和亮点 .......................................部署方式 ...................................................产品特性 ...................................................4.11. 虚拟化管理 ................................................虚拟化管理的优势和亮点 .....................................部署方式 ...................................................产品特性 ...................................................4.12. 故障告警管理 ..............................................故障管理的优势和亮点 .......................................故障管理详细介绍 ............................................基线数据管理的功能 .........................................告警日志查询的功能 .........................................辅助查询的功能 .............................................干扰设置的功能 ..............................................其他告警 ...................................................4.13. 报表管理 ..................................................报表管理的优势和亮点 .......................................报表内容说明 ...............................................报表展现类别说明 ...........................................报表提供方式 ...............................................4.14. 机房管理 ..................................................4.15. 统一监控平台 ..............................................服务拓扑展现功能说明 .......................................运行展现功能说明 ...........................................告警展现功能说明 ...........................................4.16. 系统管理 ..................................................系统管理的优势和亮点 .......................................用户管理的功能 .............................................用户操作审计的功能 .........................................当前在线用户的功能 .........................................当前用户编辑的功能 .........................................网管邮件发送帐号的功能 ..................................... 第5章综合运维系统功能 .............................................5.1. 建设思路 ...................................................5.2. 系统概述 ...................................................5.3. 平台架构 ...................................................5.4. 基于ITIL功能模块 ..........................................自助服务平台 ...............................................服务台 .....................................................事件管理 ...................................................问题管理 ...................................................变更管理 ...................................................发布管理 ...................................................资产配置管理 ...............................................作业管理 ...................................................知识管理 ...................................................服务级别管理 ...............................................排班管理 ...................................................5.5. 运维系统功能 ...............................................门户平台 ...................................................接口管理 ...................................................流程设计 ...................................................报表设计 ...................................................流程监控 ...................................................5.6. 硬件&基础软件 ..............................................硬件构成 ...................................................故障恢复 ................................................... 第6章项目管理与实施计划 ...........................................6.1. 项目总则 ...................................................6.2. 项目组织机构 ...............................................组织架构保证 ...............................................人员稳定 ...................................................6.3. 项目进度计划 ...............................................6.4. 项目范围内容 ...............................................6.5. 项目实施地点 ...............................................6.6. 项目进度管理 ...............................................6.7. 项目合同变更管理 ...........................................6.8. 项目质量管理 ...............................................6.9. 服务内容 ...................................................6.10. 项目管理 ..................................................6.11. 项目交付成果 ..............................................6.12. 实施准备 ..................................................6.13. 实施人员清单 ..............................................6.14. 实施工作进度计划 ..........................................6.15. 实施技术资料 .............................................. 第7章培训方案 .....................................................7.1. 培训总论 ...................................................7.2. 培训内容 ...................................................培训课程表 .................................................课程内容简介 ...............................................培训资费 ................................................... 第8章售后服务与日常运维方案 .......................................8.1. 服务宗旨 ...................................................8.2. 北塔软件售后技术支持服务提供的内容.........................8.3. 北塔软件售后服务网点 .......................................第1章项目概况1.1.项目总体背景随着某院信息化建设的快速发展,在新一代运载研保条件信息化项目完成后,拥有多台Windows服务器,多台用于高性能计算的Linux服务器、多个应用系统、多台网络路由交换设备以及近千台终端。
IT运维管理解决方案标题:IT运维管理解决方案引言概述:随着信息技术的不断发展,企业对于IT运维管理的需求也越来越高。
有效的IT运维管理解决方案能够帮助企业提高运维效率、降低成本、保障系统稳定性。
本文将介绍几种常见的IT运维管理解决方案,帮助企业选择适合自身需求的解决方案。
一、自动化运维管理解决方案1.1 自动化运维工具:利用自动化运维工具可以实现任务的自动化执行,减少人工干预,提高效率。
1.2 自动化监控系统:通过自动化监控系统可以实时监测系统运行状态,及时发现和解决问题。
1.3 自动化配置管理:自动化配置管理可以确保系统配置的一致性,降低配置错误的风险。
二、云计算运维管理解决方案2.1 云监控服务:云监控服务可以帮助企业监控云端资源的使用情况,及时调整资源配置。
2.2 自动化扩展服务:通过自动化扩展服务,可以根据需求自动扩展云端资源,提高系统的弹性和稳定性。
2.3 云安全管理:云安全管理可以保护云端数据的安全,防止数据泄露和攻击。
三、容器化运维管理解决方案3.1 容器编排工具:容器编排工具可以帮助企业管理容器集群,实现容器的自动部署和调度。
3.2 容器监控系统:容器监控系统可以监控容器的运行状态,及时发现和解决问题。
3.3 容器安全管理:容器安全管理可以确保容器环境的安全,防止容器被攻击和滥用。
四、DevOps运维管理解决方案4.1 自动化部署工具:通过自动化部署工具可以实现持续集成和持续部署,加快软件发布周期。
4.2 自动化测试工具:自动化测试工具可以帮助企业进行自动化测试,提高软件质量。
4.3 运维团队协作工具:DevOps运维管理解决方案也包括运维团队协作工具,帮助团队成员协作高效。
五、智能运维管理解决方案5.1 人工智能监控系统:人工智能监控系统可以通过机器学习算法实现自动化故障预测和诊断。
5.2 智能分析工具:智能分析工具可以帮助企业分析运维数据,发现潜在问题并提出解决方案。
5.3 智能运维平台:智能运维平台整合了各种智能工具,提供全方位的智能运维管理解决方案。
IT综合运维管理系统技术方案目录项目概况项目总体背景随着某院信息化建设的快速发展,在新一代运载研保条件信息化项目完成后,拥有多台Windows服务器,多台用于高性能计算的Linux服务器、多个应用系统、多台网络路由交换设备以及近千台终端。
面对如此庞大数据量的应用系统和信息设备,依靠某院信息中心目前的运行维护队伍,进行服务器及网络系统的状态监控、配置管理、故障修复、应用维护,还要包括系统开发和后续系统建设,是根本无法完成的,将极大的影响信息化系统的稳定可靠运行能力。
尤其是配置管理和状态监控完成依靠人格经验和手工记录完成,造成系统变更不受控制、故障无法预警等问题,严重的甚至影响应用系统的稳定运行,对科研生产带来严重的影响。
另一方面,自从开展新一轮军工一级保密资格认证工作,按照新标准保密工作工作量成倍增加,如涉密人员流动频繁;信息系统的普及产生多种形式涉密载体,涉密设备和载体如何账物相符管理难度较大,协作配套项目多,协作单位的交流保护核心技术;日常的保密管理制度落实程度等等。
依靠传统两三个管理人员,纸质账本登记的方式难以为继,需要通过信息化的手段,提高保密日常管理工作效率和监督的检查的能力。
基于以上原因,需要部署信息系统运行维护管理系统,完成运维管理、效率评估、设备状态实时监控、配置变更统一受控、客户端信息集成管理和技术服务标准、流程化等功能。
项目的总体思路整体思路项目要在整体统一规划的基础上,采取分阶段、分步骤的策略对现有的信息系统综合网管系统进行建设,实现某院的网络设备的集中监管和维护,通过集中部署管理方式、实现对网络设备的集中监管,全面建成实现某院一体化统一信息系统综合网管系统平台,实现整个院所IT基础设施的集中监控、集中管理和集中维护,全面提高某院IT基础设施运行、管理和维护水平。
建设与管理范围此次综合运维管理系统建设范围覆盖某院整体IT信息设备,系统部署在某院本部。
达到的效果某院综合运维管理系统的全面建设,将为某院基于信息化系统的各项业务和工作的顺利开展提供坚实的技术支撑,为科研项目的生产和管理活动提供良好环境和坚实的基础保障,IT部门作为项目成果的使用者、管理者和直接受益者,将从不同角度和层面感受到项目所产生的变革,具体价值体现为:给予IT部门一个全局化的管理视角,能够杜绝信息系统运转过程中的黑箱现象,避免管理死角的出现。
通过简单直观的图形管控手段替代传统上不直观、不友好的管理界面,通过图形、动画、数据等多媒体手段的集成全方位展现整体信息系统动态运转情况,让管理人员对信息系统的运行情况做到全局掌握和实时了解,及时发现异常或问题,从而迅速介入和及时处理,做到问题早发现、早解决,提高对电力超高压检修信息系统运行管理质量和保障能力。
提供对多厂商、跨平台异构IT系统的统一管理支持,由管理平台屏蔽它们的底层差异性,采取统一的管理维护方式,从而简化管理、降低管理难度,避免重复投资导致的资金浪费,实现经济好省。
管理覆盖全面,实现对某院构成的各要素、各环节进行全面监控,主要是数据交换平台(网络)、安全,管理平台开放的体系架构和高度的可扩展性不但能够充分满足当前的管理需要,而且能够充分适应未来管理发展的变化,快速实现对新技术、产品的支持和适应,保护现有投资,实现向后兼容性。
提供丰富的展现和分析手段,资源使用、系统负荷压力分布一目了然,为有效评估和科学评价提供帮助,确保资源的分配与使用更加科学合理;提高IT部门响应速度和支持保障能力,具备从容应对各种突发事件的能力,通过统一平台的主动检测监控,实现各种问题的及时发现、分析、定位并提供一系列管理手段帮助实现故障的快速诊断和精确定位,帮助管理维护人员迅速锁定故障根原因,从而采取正确的措施迅速排障,最大限度降低故障对业务运转的影响;为多部门、多专业进行高效协同提供统一平台,使不同岗位和专业的管理人员,各司其职,相互协调,相互监督,运转流畅,使信息运维管理工作步入管理规范化、管理科学化和办公现代化的轨道;详实的运行维护数据为推行量化的精细管理奠定了基础,解决了IT部门进行有效绩效考评的困难,为上级部门和主管领导客观评价IT部门的工作成效提供了有力的论据,也有助于IT部门客观检查、审视自身工作,总结成绩、经验,发现不足,制定改进计划,持续改进、提高和优化信息管理维护工作;准确掌握问题、故障的多发点,从设计、运行、管理等多环节切入寻找影响系统正常、稳定和可靠运转的关键因素,为深入优化、升级、改造提供有力的数据支持,从而确保信息管理和决策的科学性。
集成安全管理,统一管理监控入口,及时捕捉影响系统安全的各种风险因素,提高信息系统整体安全性和坚固性;变被动的响应为主动监控;变事后修复为事前预防;变复杂操作维护为简单管理;变孤立分散管理为集中统一管理;全面扭转IT部门在运维工作中被动局面,借助于统一信息内网监管平台的有力支撑,有力推动某院IT部门朝着“全面实现以预防为主、修复为辅的主动式管理”的目标迈进。
该项目建设完成后,将会对某院运行维护和管理水平的整体提高发挥积极的推动和促进作用,做到故障早发现、早解决,确保计算机网络连续、可靠、安全运行,降低发生故障的可能性,提高信息运维部门的运行管理水平和服务保障能力,为信息运维综合监管系统的持续建设与深入应用提供强有力的支持与保障。
综合运维管理系统基于对上面内容的理解,在充分沟通、仔细调研的基础上,我们本次为某院推荐上海北塔公司的BTIM信息系统综合网管系统。
系统简述BTIM为基于DOTNET平台运行的应用系统,采用了业界最新的框架及开发平台;系统采用B/S架构开发的应用系统,采用了业界最先进的技术,通过Ajax 技术和Web Service技术,实现了在浏览器上页面的局部更新,提供更好的部署和使用体验;BTIM-IE客户端采用运行于的jscript开发语言,大大提高IE客户端操作的响应速度;BTIM通过O/R Mapping技术和缓存技术,能够自动适用不同数据库之间差异性,优化数据访问速度。
BTIM是一套全中文网络资源管理系统,是一套“基于网络平台、面向客户应用”的网络设备资源与应用服务资源、全中文、通用的管理软件,具有先进性、实用性、易用性和安全性的特点。
为了确保某院安全、高效、稳定地运行,提高管理水平,满足客户日益增长的服务需要,提供最安全最周到的服务保障,树立自己的行业形象,结合现今行业发展水平,利用先进技术,采用安全可靠的设计方案,将监控系统集成化,流程化。
架构和功能BTIM系统主要功能架构包括对象层、对象采集层、数据处理层、数据展现层、外部接口等。
BTIM系统框架图如下:BTIM系统的管理对象包括:网络设备、安全设备、机房环境、主机系统、数据库系统、应用系统、其他等,BTIM系统数据采集的方式多种多样,支持分布式主动轮询或被动接受的方式采集数据,支持标准的SNMP、RMON、Syslog、WMI、Telnet等协议的数据采集,支持数据库接口采集,支持应用API接口采集等多种方式,支持集成第三方管理平台组件进行数据采集,还可以根据用户的要求定制相应的接口,将相应系统的信息纳入网络管理系统中,形成统一管理。
BTIM系统采用开放的数据存储平台SQL server来进行网管系统的数据存储,能够保存半年以上的历史故障数据和性能数据以便生成相应的趋势分析报告。
BTIM系统能够针对告警事件提供灵活的过滤,提供对告警级别、告警类别、告警消息等配置的能力,告警划分成几种颜色,提供多种工具和方法定位问题的根源。
BTIM系统的性能数据采集能够支持秒级单位的采样周期。
BTIM能够提供原始采样频率的数据。
BTIM系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。
BTIM系统通过Web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和运维管理流程。
BTIM系统标准的Syslog、Telnet、API等接口,可以将安全管理系统、相关环境的管理数据,纳入BTIM系统中实现集中管理。
需求分析总体要求结合项目特点综合运维管理系统要求如下:实时掌握网络性能数据和故障信息,其中性能数据的获取时间不高于5分钟,告警数据的获取时间不高于30秒。
按时间段(天/周/月/季度/年)统计分析网络运行情况,支持设备性能和链路性能图表。
实现全园区系统汇总运行的统计分析,例如CPU平均使用情况、内存最大使用情况等。
分析数据可以层层下钻,看到各个网络设备相关指标的分析情况。
也可以分析某段时间内不同区域不同指标的情况。
实时监控、展现网络设备关键指标的变化情况。
支持统一告警台视图展现,可将监控的所有的内容所产生的事件汇总到统一的展现界面,并可通过事件的点击追溯到事故资源的详细指标信息中。
核心网络实时监控和分析展现是对核心网络数据深入统计分析,更好地了解核心网络系统的运行状况、分析异常数据变动的原始数据原因。
核心网络分析展现通过数据抽取对业务数据进行分析结果展现,同时提供分析所需要的细粒度数据和汇总数据。
网络实时监控和分析展现能按时间段(天/周/月/季度/年)统计分析网络指标的情况,分析数据可在时间维度逐层向下查看详细数据。
(1)系统需提供多种统计分析手段,如排序、同比、环比等而无需输入任何分析公式(2)监控信息刷新频率可以按照用户的需要进行灵活调整(3)满足实时抽取关键数据,按日批量和增量抽取明细数据(4)监控信息刷新频率可以按照用户的需要进行灵活调整需求分析根据需求来看,实际运维工作中是有一些管理工具进行监控工作。
但是从实际运维管理工作需求角度出发,现有的管理工具存在较多的问题,这种问题体现在工具相互之间缺乏关联性,工具的非定制性导致采集数据和某院的实际运维工作存在较大的偏差,因此对于综合运维管理系统需求集中体现在以下几个方面:1)所有IT设备均纳入综合运维管理系统管理综合运维管理系统首先需要的是将某院所有IT设备均纳入管理,这是运维工作管理的基础和核心。
只有当所有设备都在管理范围内,对其进行的监控、告警、统计、分析、报表才有实际意义。
目前某院虽然有了一些监控工具,但从实际情况来看,并未将所有设备纳入监控范围,从监控本身角度存在较大的缺失。
2)全面增强的基础监控KPI某院网络管理系统必须摆脱依赖于原有工具来开展运维工作的情况,需要根据某院自身运维管理工作特点,有目的有计划的展开各类管理对象的专题分析,比如网络设备监控、链路监控、服务器监控、数据库监控等,通过梳理现有的监控指标尤其是全国范围内用户对上述设备的管理指标,建立健全某院对基础监控的KPI库,将各类风险纳入到综合运维管理系统中,实现综合运维管理系统及时、快速、有效的对各类故障进行事前可知、事中可控、事后可查的目标。