数据中心基础设施管理系统DCIM技术方案
- 格式:pdf
- 大小:12.59 MB
- 文档页数:146
数据中心DCIM管理系统技术要求一、项目说明本项目拟建设一套数据中心动环和设备信息化管理系统,接入数据中心电力运行、配电监控系统、环境监控系统和安装的设备等数据,提供电力容量管理、温湿度监控管理、UPS电池监控管理、动环告警管理、设备管理、数字运维、智能运营等业务功能,实现在统一视图上的集中监控、集中运维、集中管理,提升数据中心整体运维效率及水平,满足业务发展的需要。
本项目建设范围为鉴三备灾数据中心以及鉴主19楼机房,其中鉴三楼机房包含2个冷池系统共62个机柜以及相应配套设施,鉴主19楼机房包含3个区域共约70个机柜以及相应配套设施。
二、技术要求(一)系统整体要求1、系统架构。
DCIM管理系统的整体架构需要能够满足以下要求:➢★系统应用主体应采用B/S架构,应能够通过浏览器进行实时访问。
同时需具备友好的操作界面,能够支持中文环境。
系统应支持常用的主流浏览器,如IE、Chrome、Firefox。
同时,系统应可以支持通过手机等移动终端APP进行访问,同时支持通过浏览器访问。
系统应支持手机APP报警、短信报警等多种形式。
➢系统应具有数据自动备份机制与系统自我监测功能,监控系统所消耗的内存、硬盘等资料。
➢★系统应采用可靠稳定的操作系统平台,保证系统的通用性和安全性。
服务器端程序应基于Linux正版操作系统,部署在专业的x86服务器上。
2、系统可扩展性。
➢系统应有良好的功能扩展性,应采用组件化的松耦合架构,部分组件可进行功能扩展,不影响整体架构。
➢系统支持多数据中心之间数据相连互通,应具有至少5个站点的可扩展性。
3、系统安全设计。
➢★采用高安全设计,着重对操作系统、数据库、管理软件进行加固,可有效防御窃听、伪造、篡改、越权访问、病毒、网络入侵等危害,避免管理系统服务器成为安全短板,要求提供3种以上主流杀毒软件的扫描报告(例如:AppScan、Nessus、NGS、Symantec、McAfee等)。
密码存储:管理系统用户密码、手机号、邮箱等个人信息的存储需经过加密处理,不允许明码存储,需提供相关证明。
数据中心基础设施管理系统(DCIM)技术方案目录第1章项目技术方案 (5)1.1.项目概述 (5)1.2.技术标准 (5)1.3.系统设计 (6)1.3.1.系统描述 (6)1.3.2.项目范围 (6)1.3.3.系统架构 (7)1.3.4.串口设计 (10)1.3.5.双总线(A/B路)设计 (12)1.3.6.系统性能 (13)1.4.基础设施监控实现 (14)1.4.1.动环监控实现 (14)1.4.1.1.变压器监测 (14)1.4.1.2.发电机监测 (15)1.4.1.3.列头柜监测 (15)1.4.1.4.电量仪监测 (16)1.4.1.5.UPS监测 (17)1.4.1.6.EPS监测 (18)1.4.1.7.ATS监测 (19)1.4.1.8.蓄电池监测 (19)1.4.1.9.氢气监测 (20)1.4.1.11.新风机监控 (21)1.4.1.12.温湿度监测 (22)1.4.1.13.机柜温度监测 (23)1.4.1.14.漏水监测 (23)1.4.1.15.入侵监测 (24)1.4.2.第三方系统集成 (25)1.4.2.1.系统集成架构描述 (25)1.4.2.2.视频系统集成实现 (26)1.4.2.3.门禁系统集成实现 (26)1.4.2.4.BA系统集成实现 (27)1.4.2.5.消防系统集成实现 (27)1.4.2.6.极早期探测系统集成实现 (28)1.5.基础设施管理平台功能 (28)1.5.1.系统界面 (28)1.5.2.冷通道管理 (34)1.5.3.告警管理 (39)1.5.4.报表管理 (42)1.5.5.联动管理 (45)1.5.6.远程管理 (46)1.5.7.日志管理 (46)1.5.8.数据管理 (46)1.5.10.配置管理 (48)1.5.11.微信告警(根据项目情况增减) (50)1.5.12.双机热备(根据项目情况增减) (51)1.5.13.手机客户端(根据项目情况增减) (52)1.5.14.资产管理 (53)1.5.15.容量管理 (62)1.5.16.能效管理 (65)1.5.17.温度场管理 (66)1.5.18.三维可视化管理系统功能 (67)1.5.18.1.三维可视化 (67)1.5.18.2.三维巡视 (67)1.5.18.3.自定义视角 (68)1.5.18.4.监控可视化 (69)1.5.18.5.温度云图 (70)1.5.18.6.资产管理 (70)1.5.18.7.容量可视化 (71)1.5.19.微信运维管理 (72)1.5.19.1.人员管理 (73)1.5.19.2.设备管理 (74)1.5.19.3.维修管理 (75)1.5.19.4.过保通知 (76)1.5.19.6.权限管理 (77)1.5.19.7.知识库 (77)1.5.19.8.微信告警 (78)1.5.19.9.资产管理 (79)1.5.19.10.容量管理 (79)1.5.19.11.移动巡检 (80)1.5.19.12.web维护端 (81)第1章项目技术方案1.1. 项目概述数据中心基础设施管理系统(DCIM)是一个数据采集、加工处理、统计分析的数据管理平台。
施工方案目录第一章项目概述______________________________________________________________ - 4 -第二章工程实施准备 _________________________________________________________ - 4 -2.1项目实施前期准备___________________________________________________________ - 4 -2.2需要甲方配合的准备 _________________________________________________________ - 4 -2.3项目进度计划 ________________________________________________________________ - 5 -2.4人员计划 ____________________________________________________________________ - 7 -2.4.1各负责人职责_____________________________________________________________________ - 8 -2.4.2项目人员安排_____________________________________________________________________ - 8 -2.5安装工艺及注意事项 _________________________________________________________ - 9 -2.5.1机房布线实施原则 ________________________________________________________________ - 9 -2.5.2机房环境监控系统布线要求 _______________________________________________________ - 9 -2.5.3采集柜布线安装 ________________________________________________________________ - 10 -2.6机房环境监控部分子系统说明 _______________________________________________ - 10 -2.6.1RS232接口智能设备 ___________________________________________________________ - 11 -2.6.2RS485接口智能设备 ___________________________________________________________ - 11 -2.6.3温湿度监测子系统 ______________________________________________________________ - 12 -2.6.4温场监控子系统 ________________________________________________________________ - 12 -2.6.5氢气监测子系统 ________________________________________________________________ - 12 -2.6.6漏水监测子系统 ________________________________________________________________ - 12 -2.6.7门禁管理子系统 ________________________________________________________________ - 13 -2.6.8入侵监测子系统 ________________________________________________________________ - 13 -2.6.9视频监控系统___________________________________________________________________ - 13 -2.7施工质量控制措施_____________________________________________________________ - 14 -2.8测试及验收____________________________________________________________________ - 21 -2.9验收计划______________________________________________________________________ - 25 -第三章技术培训____________________________________________________________ - 31 -3.1培训目标______________________________________________________________________ - 32 -3.2培训对象______________________________________________________________________ - 32 -3.3培训安排______________________________________________________________________ - 32 -3.4培训形式______________________________________________________________________ - 33 -3.5培训内容______________________________________________________________________ - 33 -3.6培训资料的管理 _______________________________________________________________ - 34 -3.7培训结果的确认 _______________________________________________________________ - 35 -第一章项目概述项目名称:XXXXX数据中心基础设施管理系统项目地点:XXXXXX第二章工程实施准备2.1项目实施前期准备组织相关人员熟悉设计方案,现场情况进行书面或电话调查,充分了解和掌握系统设计意图、功能特点,作好技术交底工作,包括深化设备清单;组织项目相关人员(包括建设单位相关人员)确立项目开工事项。
数据中心DCIM管理系统技术要求一、项目说明本项目拟建设一套数据中心动环和设备信息化管理系统,接入数据中心电力运行、配电监控系统、环境监控系统和安装的设备等数据,提供电力容量管理、温湿度监控管理、UPS电池监控管理、动环告警管理、设备管理、数字运维、智能运营等业务功能,实现在统一视图上的集中监控、集中运维、集中管理,提升数据中心整体运维效率及水平,满足业务发展的需要。
本项目建设范围为鉴三备灾数据中心以及鉴主19楼机房,其中鉴三楼机房包含2个冷池系统共62个机柜以及相应配套设施,鉴主19楼机房包含3个区域共约70个机柜以及相应配套设施。
二、技术要求(一)系统整体要求1、系统架构。
DCIM管理系统的整体架构需要能够满足以下要求:➢★系统应用主体应采用B/S架构,应能够通过浏览器进行实时访问。
同时需具备友好的操作界面,能够支持中文环境。
系统应支持常用的主流浏览器,如IE、Chrome、Firefox。
同时,系统应可以支持通过手机等移动终端APP进行访问,同时支持通过浏览器访问。
系统应支持手机APP报警、短信报警等多种形式。
➢系统应具有数据自动备份机制与系统自我监测功能,监控系统所消耗的内存、硬盘等资料。
➢★系统应采用可靠稳定的操作系统平台,保证系统的通用性和安全性。
服务器端程序应基于Linux正版操作系统,部署在专业的x86服务器上。
2、系统可扩展性。
➢系统应有良好的功能扩展性,应采用组件化的松耦合架构,部分组件可进行功能扩展,不影响整体架构。
➢系统支持多数据中心之间数据相连互通,应具有至少5个站点的可扩展性。
3、系统安全设计。
➢★采用高安全设计,着重对操作系统、数据库、管理软件进行加固,可有效防御窃听、伪造、篡改、越权访问、病毒、网络入侵等危害,避免管理系统服务器成为安全短板,要求提供3种以上主流杀毒软件的扫描报告(例如:AppScan、Nessus、NGS、Symantec、McAfee等)。
密码存储:管理系统用户密码、手机号、邮箱等个人信息的存储需经过加密处理,不允许明码存储,需提供相关证明。
数据中心基础设施管理系统(DCIM)技术方案目录1.项目概述及需求理解 (6)1.1.项目背景简介 (6)1.2.项目管理范围 (6)1.3.项目建设原则 (7)1.4.项目建设目标 (8)1.5.解决方案概述 (9)2.系统架构及实现原理 (13)2.1.系统架构 (13)2.1.1.采集层 (14)2.1.2.处理层 (14)2.1.3.管理层 (15)2.1.4.交互展现层 (15)2.2.系统集成 (16)2.2.1.第三方集成 (16)2.2.2.短信猫集成 (17)2.2.3.短信网关集成 (17)2.3.开发工具及技术介绍 (18)2.3.1.自定义流程引擎 (18)2.3.2.成熟的开发标准技术 (19)2.3.3.分布式通讯调度 (19)2.3.4.搜索引擎 (20)3. DCIM系统功能实现 (21)3.1.基础设施集中监控 (21)3.1.1.UPS监控 (22)3.1.2.蓄电池监测 (23)3.1.3.配电参数监测 (25)3.1.4.发电机监测 (26)3.1.5.精密空调(加湿器)监控 (28)3.1.6.环境监控(温湿度、风速、氢气) (29)3.1.7.漏水检测 (30)3.1.8.消防(极早期)监测 (31)3.2.基础设施管理 (32)3.2.1.资产管理 (32)3.2.2.容量管理 (37)3.2.3.能耗管理 (39)3.3.集中展现 (42)3.3.1.展现系统集中化 (42)3.3.2.展现方式多样化 (49)3.4.预警及告警 (52)3.4.1.统一事件展现 (52)3.4.2.监控指标库 (52)3.4.3.故障管理 (54)3.5.运维管理 (58)3.5.1.服务台 (59)3.5.2.个人工作台 (61)3.5.3.值班管理 (64)3.5.4.事件管理 (70)3.5.5.问题管理 (73)3.5.6.配置管理数据库 (78)3.5.7.变更管理 (80)3.5.8.服务级别管理 (82)3.5.9.知识库管理 (88)3.5.10.可视化流程设计 (92)3.5.11.角色/权限管理 (98)3.6.报表分析 (100)3.6.1.监控报表 (100)3.6.2.运维管理报表 (102)3.7.三维可视化管理 (107)3.7.1.IT类资产三维浏览 (109)3.7.2.数据中心容量可视化管理 (115)3.7.3.数据中心配线可视化管理 (118)3.7.4.数据中心能耗可视化管理 (127)3.7.5.数据中心运维可视化管理 (130)3.7.6.集中监控展示 (135)6.系统部署方案及软硬件配置要求 (141)6.1分布式部署方案 (141)6.2服务器硬件 (143)6.3服务器软件 (145)1.项目概述及需求理解1.1.项目背景简介伴随着数据中心规模的不断扩大,业务量的逐渐增大,对数据中心的运维管理也变的越来越重要。
一旦基础设施系统出现问题,而没有及时地得到妥善解决,常常会给企、事业造成很大的损失。
怎样能7x24小时保证设备系统的正常运行,避免各种故障的发生,优化和改进传统的运维模式,提高客户服务的及时性和满意度就显得非常重要。
因此,建设一套数据中心基础设施管理系统势在必行。
一个完备的运维管理系统能够提供7x24小时检测基础设施运行状态、各种资源状态的信息。
运维管理人员依靠流程管理系统可以及时排除故障避免造成重大损失,控制运维质量提高服务水平。
1.2.项目管理范围项目内容:设施故障发现与警报;记录日常运维日志信息;设施故障统计;设施软硬件信息统计;服务进程管理;将数据信息存储备份,并采用不同方式直观的展示出来;服务人员绩效、考核管理;将数据生成报表;1.3.项目建设原则数据中心基础设施管理系统建设指导思想是:“统一规划、分步实施、已有纳入、新建遵循”。
数据中心基础设施管理系统项目建设是要建设一个集中管控资源的运维平台,所以需充分考虑对已有各种产品组件做针对性的开发、整合工作。
在项目建设过程中,除满足系统功能需求外,遵循如下原则:●安全性原则:系统设计注重安全方面的设计,确保系统的安全运行。
系统提供安全认证技术,确保登录身份认证安全性、有效性。
●稳定性原则:保证系统不间断运行,系统执行监控及操作任务时或出现自身故障,绝不能影响被监控及操作对象的正常稳定运行。
●开放性原则:系统遵循行业主要的标准化组织所提供的标准或建议,采用标准的、开放性的技术,能够实现与其他厂商的产品无缝地连接;采用国际标准化组织及工业界广泛接受的有关标准和基于标准的通用软硬件平台。
●可扩展性原则:在保持系统的基本体系结构长期稳定的前提下,可以有效地容纳和支持基础设施规模的不断扩大和复杂、业务种类的增多。
同时,能够在应用体系结构和软件模块划分两个方面支持整个应用的良好扩展性。
在体系结构方面采用多层结构划分,实现各层的高聚合和层间低耦合。
尽量使用模块化和插件化,使得扩展时对原系统的影响最小化。
●用户体验优化原则:具有较高的易用性,界面友好,美观统一,并对人机交互进行优化设计。
●灵活性原则:系统各子系统及子系统内功能模块具有一定的独立性,同时具有系统相关性和整体一致性。
系统提供自动化升级维护功能,系统的维护及拓展灵活、方便。
●规范性原则:统一接口标准,规范数据字典。
定义监控接入标准,规范未来新建系统的监控。
1.4.项目建设目标加强数据中心的维护平台建设,提高数据中心的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握数据中心的运行状态,保障各业务系统的正常运行,并达成如下目标:(1) 强化主动监控,实现集中管理。
以设施资源可用性监控为主线,构建数据中心统一集成的设施资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成数据中心运维管理主动服务的新局面。
(2) 帮助定位故障,快速恢复系统运行。
建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。
当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。
(3) 掌握运行质量与效率,合理利用资源。
建立数据中心基础设施管理系统平台后,可以实时了解数据中心全部资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调剂业务系统对资源的使用。
(4) 规范运行管理,有序开展维护。
参照数据中心运维规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。
根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。
(5) 共享运维经验,完善知识库。
把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高数据中心运维人员的工作效率。
1.5.解决方案概述DCIM系统是在在分析了国内数据中心管理现状和需求后,自主研发而成。
秉承以客户为中心、流程为导向的理念,实现对基础设施资源的全面管理,完美整合了人员、技术和流程三大要素,帮助用户以较低的成本提供稳定、优质的服务,共同实现基础设施服务的目标。
DCIM系统提供了“无缝式基础设施监控系统”功能,其系统架构清晰,采用模块化的设计理念,各功能模块既可独立运行、松散耦合;亦可整体功能无缝衔接覆盖整个业务系统,灵活的自由组合真正实现个性化的基础设施无忧运维。
DCIM系统提供一个图形化、可定制、统一的监控管理平台。
通过它实现对基础架构性能和告警数据的直接监控与展示,实现对用户环境的整体运行状态的监控管理。
1.故障预警和管理前瞻性地发现系统的故障和性能问题,能够快速识别、隔离、诊断和修复生产中出现的问题。
1)前瞻性发现基础设施和应用系统的故障。
2)前瞻性检测复杂的应用性能问题。
3)基于业务的性能影响分析报告4)快速识别、隔离和诊断问题的起因,事故根本原因分析。
5)对一些简单的故障问题,提供自动化修复故障的功能;对复杂的故障和性能问题,尽可能提供修复故障和改善性能的建议。
6)提供的丰富的事件通知功能,事件通知方式包括:-Mail 自动向指定邮箱发送告警邮件。
-短信自动向指定手机发送告警短信。
-声音自动产生声音告警。
-图像自动以图标形式显示告警事件。
-其它通过二次开发可实现特殊要求的告警方式。
7)提供监控参数化配置管理,参数超过设定阀值,产生报警信息。
2.多层次的视图展示直观、准确地体现各层面的系统和业务运行状态,分别展示不同管理层次和范围的系统运行状态。
根据企业的业务特点和管理习惯,可将展示视图分成一级视图、二级视图和三级视图,分别展示不同管理层次和范围的系统运行状态(如下图所示)。
3.集中统一的管理界面用户在统一监控管理平台上可查看所有视图,提供直观的图形用户界面。
1)基于上下文环境和组合视图,降低用户诊断问题的时间。
2)基于角色和权限的控制,增强管理的安全性。
3)提供可定制化的工作区和视图,提高操作的灵活性。
4.开放的接口能够集成第三方监控工具,实现将第三方监控(例如BA、安防、柴发、电力或特定应用管理工具等)完全变为监控系统的一部分。
5.丰富的报表展示功能提供统一的报表界面,具备强大的数据展现能力:1)提供网络、系统、数据库、网络、中间件、应用和业务运转状况的集中统一报表2)提供实时与历史性能报表3)提供数据分析、展现和用户报表定制功能4)预制报表模板5)自动周期性报表,如日报、周报、月报、季报、年报等6)支持PDF、HTML、Excel等报表格式2.系统架构及实现原理2.1.系统架构本次提供的数据中心基础设施管理系统涵盖较多被监控的对象,覆盖面较广,功能复杂,系统设计遵循模块式开发、部署,系统从底层到最上层的图形用户接口共分为四层,每一层实现不同的功能,系统整体的架构如下图所示:整个系统管理架构分为采集层、处理层、管理层、交互展示层四个层次。
2.1.1.采集层包括数据中心环境中的机房环境、暖通设备、电力设备、安防设备等被管理实体,是需要被实时监控的对象,是原始信息的来源。
所有的被管理对象通过标准协议或私有协议方式向管理端提供各种性能和事件数据。
2.1.2.处理层包含两个功能,一是对管理实体中的数据进行数据采集;二是根据要求对数据进行必要的整合。
除了采集到的数据外,还可能包括各种管理数据,系统汇总后的数据、文档数据等。
系统管理的数据采集方式支持以下几种:采用定时轮循机制获取被监测设施的数据;监听代理端的TRAP消息实时获取数据;通过设备厂家提供的监控工具获取数据;通过读取日志文件获取数据;通过其他厂商监控平台获取数据。