异构云平台的管理
- 格式:pdf
- 大小:4.19 MB
- 文档页数:37
异构云平台间的资源调度与管理机制研究随着云计算技术的不断发展和应用,异构云平台的兴起成为了一个新的研究方向。
异构云平台是指由不同类型的云平台组成的系统,例如,公有云、私有云、边缘云等。
这些不同类型的云平台具有不同的性能特点和资源配置,因此需要开发资源调度与管理机制来确保在异构云平台之间高效地利用资源。
资源调度是指根据系统的需求和资源的可用性,动态地分配和管理资源的过程。
对于异构云平台间的资源调度来说,有以下几个关键问题需要考虑:1. 资源分析和监控:在异构云平台中,不同类型的云平台具有不同的硬件配置和性能特点,因此需要对这些平台的资源进行实时分析和监控。
这可以通过采集云平台的监测数据来实现,例如CPU利用率、内存使用率等。
通过对这些数据的分析,可以了解不同平台上资源的利用情况,从而为资源调度做出合理的决策。
2. 资源预测和优化:在异构云平台间进行资源调度时,需要对资源的需求进行预测和优化。
通过分析用户的请求和应用的特点,可以预测未来的资源需求。
同时,还需要考虑到不同云平台上的资源配置差异,以便进行资源的优化分配。
资源预测和优化可以帮助提高资源的利用率,减少资源浪费。
3. 资源分配和调度:资源分配和调度是异构云平台间资源调度的核心问题。
在进行资源分配时,需要考虑到不同云平台之间的网络延迟、带宽等因素,以便选择最合适的云平台进行资源分配。
在进行资源调度时,还需要考虑到不同云平台上的负载状况和资源利用率,以便选择最优的资源调度策略。
通过合理地分配和调度资源,可以提高整个系统的性能和效率。
4. 资源管理和监督:异构云平台间的资源管理和监督是确保资源调度正常进行的关键。
资源管理包括对资源的统一管理和分配,以及对资源利用情况的监督和评估。
通过对资源的管理和监督,可以及时发现资源利用不合理的问题,并采取相应的措施进行调整和优化。
5. 安全和隐私保护:在进行异构云平台间的资源调度时,还需要考虑到安全和隐私保护的问题。
分布式异构智能算力的管理和调度技术研究报告1. 引言1.1 概述:随着分布式计算和智能算力的不断发展,人们对于管理和调度这些异构智能算力资源的需求也越来越迫切。
在传统的计算模型中,所有的计算任务都集中在单一的服务器上执行,但这已经无法满足现代复杂任务的需求了。
分布式异构智能算力的概念应运而生,它将不同种类、规模和性能的计算设备组合起来,实现更高效、灵活和可扩展的计算处理。
1.2 文章结构:本文将就分布式异构智能算力的管理和调度技术进行深入研究。
首先,我们将介绍分布式计算与异构计算两个概念,并解析智能算力的含义。
接着,我们将探讨异构智能算力相对于传统计算方法的优势以及其应用场景。
然后,我们会详细研究目前在资源管理和任务调度方面所存在的技术现状,并对现有的算力管理平台进行比较与分析。
最后,我们会展望面向分布式异构智能算力管理和调度技术未来发展趋势,并针对可扩展性、智能化调度与优化方法以及安全性与隐私保护等方面进行深入探讨。
本文最后将提供结论和展望,总结关键研究问题及成果,并对未来的发展方向提出建议。
1.3 目的:本篇研究报告的主要目的是为了深入研究分布式异构智能算力的管理和调度技术,并分析其在不同领域中的应用前景。
通过梳理当前技术现状和发展趋势,我们旨在为研究人员提供一个全面了解和把握该领域动态的平台,同时也为相关企业和决策者提供参考,帮助他们更好地利用分布式异构智能算力资源,提升计算效率、降低成本并推动科学技术进步。
2. 分布式异构智能算力的概念和特点2.1 分布式计算与异构计算的定义分布式计算是一种通过将任务分解为多个子任务并在多台计算机上并行处理的计算模型。
它利用网络连接的计算资源,实现任务的合作处理,从而提高整体系统的性能和可靠性。
异构计算是指使用不同类型、功能或规格的计算资源组成的系统。
这些资源可能包括不同架构(如CPU、GPU、FPGA等)、操作系统以及软件环境。
2.2 智能算力的概念解析智能算力指的是运用人工智能技术和算法来增强分布式系统中各种类型异构计算资源的智能化程度和自主决策能力。
异构数据资源的统一存储管理方案
异构数据资源的统一存储管理方案主要包括以下几个方面:
1. 统一数据底座:构建统一的数据底座,将数据放在合适的位置,并实现存储网络的发放自动化、拓扑自动化和性能分析自动化。
2. 数据流动:基于数据冷热和应用负载分析,实现数据的按需流动,满足不同生命周期阶段的性能和成本需求。
例如,可以将热数据存储在本地,全量数据存储在云端,以平衡性能和容量。
3. 多云对接:通过API、脚本和插件等多种方式对接云管平台,确保融入客户流程,不改变客户习惯。
这样可以在多云环境中简化数据管理,如同时部署在本地、私有云、公有云上,实现“混合多云”。
4. 数据协议支持:数据的存入与使用需要适配各种应用场景,如支持块存储、对象存储等协议。
例如,通过标准iSCSI协议为上层应用提供虚拟Target
和逻辑卷,接入天翼云OOS后提供S3对象存储协议,以充分适配各种应
用场景。
5. 资源优化:通过提高资源利用率、优化资源成本等手段,助力企业在“双碳”背景下实现绿色转型。
例如,存储资源盘活系统可以通过纯软件的存储控制器、分布式双控制器架构等方式,充分利用全部存储资源,实现低延迟、高可用、易拓展的特性。
6. 统一调度管理:通过完善的控制台、命令行与API来统一调度管理所有存储设备,实现统一的管理方案。
以上方案仅供参考,建议根据实际情况进行调整。
异构计算模型在云计算中的性能优化研究随着云计算的快速发展和对计算资源的不断需求增加,对云计算性能优化的研究也变得愈发重要。
异构计算模型作为一种新颖的计算模型,在云计算中展现出巨大的潜力。
本文将研究异构计算模型在云计算中的性能优化问题,探讨如何利用异构计算模型提升云计算性能。
1. 异构计算模型概述异构计算模型是指将多种不同类型的计算资源组合在一起,形成一个拥有不同处理器、内存和存储器的计算系统。
这样的系统能够更好地适应各种类型的计算任务,并将任务分配给最适合处理的资源。
异构计算模型的核心思想是利用不同类型计算资源的优势互补,提高计算效率和性能。
2. 异构计算模型在云计算中的应用2.1 异构计算模型的优势在云计算中,应用程序的需求多种多样,包括大数据处理、机器学习、图形渲染等。
而传统的计算平台往往无法提供高效处理这些任务所需的计算资源。
而异构计算模型正好能够弥补这一差距。
通过将多种不同类型的处理器和硬件设备组合起来,异构计算模型能够更好地解决不同类型任务的需求,提高处理效率。
2.2 异构计算模型在云计算中的应用案例在云计算中,异构计算模型广泛应用于以下领域:2.2.1 大数据处理对于大数据处理任务来说,异构计算模型能够更好地利用GPU等高性能设备,通过并行计算的方式提高数据处理速度。
例如,在数据的预处理和分析阶段,使用GPU进行高速数据计算,可以大大加快数据处理的速度。
2.2.2 机器学习机器学习需要大量的计算资源来训练模型和进行推理。
异构计算模型通过将CPU和GPU等设备进行协同工作,可以提供更高效的计算和更快的训练速度。
例如,在深度学习模型训练过程中,使用GPU进行并行计算可以大大加快训练速度。
2.2.3 图形渲染对于图形渲染任务来说,GPU是更适合处理的设备。
异构计算模型可以将图形渲染任务分配给GPU进行加速处理,提高渲染效果和渲染速度。
同时,CPU可以负责其他任务,实现多任务的协同工作。
3. 异构计算模型性能优化方法为了更好地利用异构计算模型优化云计算性能,以下是几种值得尝试的方法:3.1 任务调度优化任务调度是指将不同的计算任务分配给最适合处理的计算资源。
多源异构数据融合与管理技术研究在当今的数字化时代,数据已经成为企业和机构中最重要的资产之一。
这些数据来自不同的数据源和类型,这些数据源通常是异构的。
这就需要对这些多源异构的数据进行融合和管理,从而提高数据的价值和有效性。
多源异构数据融合与管理技术,成为当前数据管理领域中的重要研究方向。
一、多源异构数据的概念与分类多源异构数据是指来自不同来源、类型和格式的数据,它们之间存在着数据差异和数据质量差异。
多源异构数据一般可以分为结构化数据和非结构化数据两大类。
1.结构化数据结构化数据一般指已经规范化和标准化的数据,其中每个数据元素都能够被确定的标识和分配。
结构化数据可以使用数据库存储,并能够使用SQL等数据库语言进行检索和操作。
2.非结构化数据非结构化数据是指没有预先定义好的数据格式和结构的数据,比如文本、图像、音频、视频等,这些数据需要进行处理和分析才能得到有意义的信息。
二、多源异构数据的融合技术多源异构数据的融合技术包括数据集成和数据合并两个方面。
1.数据集成数据集成是指将来自不同数据源的数据进行整合、修正、转换和清洗,从而形成一个统一的数据集,方便用户进行查询和分析。
数据集成有两种常见的技术方式:(1)传统方式:需要先对数据源进行分析和整理,再使用ETL工具进行导入和转换。
但这种方式需要额外的人力和资源进行处理。
(2)实时方式:通过数据中间件技术将来自不同数据源的数据进行整合,这样可以实现实时数据的更新和查询,同时也减少了数据处理的负担。
2.数据合并数据合并是指将来自多个数据源的数据并列进行比较和分析,从而得到数据的相关性和差异性,进而形成更为精确和全面的数据信息。
数据合并采用的方法有:(1)数据聚合:将来自不同数据源的数据进行统计和汇总,以得到更加全面和精确的数据结果。
(2)数据关联:将不同数据源中的数据进行关联和对比,以得到数据之间的相关性和差异性。
三、多源异构数据的管理技术多源异构数据的管理技术包括数据标准化和数据质量控制两个方面。
异构计算平台的统一体系结构框架一、异构计算平台概述异构计算平台是指将不同类型的处理器或计算资源集成在一个系统中,以实现更高效的计算性能和更优的能效比。
这种平台通常包括CPU、GPU、FPGA、ASIC等多种计算单元,它们各自擅长处理不同类型的任务。
异构计算平台的发展,不仅能够推动计算技术的进步,还将对整个信息技术产业产生深远的影响。
1.1 异构计算平台的核心特性异构计算平台的核心特性主要包括以下几个方面:灵活性、并行性、能效比和可扩展性。
灵活性是指平台能够根据不同的计算任务需求,动态调整资源分配。
并行性是指平台能够同时执行多个任务,提高计算效率。
能效比是指在完成相同计算任务的情况下,平台消耗的能量更少。
可扩展性是指平台可以根据需求增加更多的计算资源。
1.2 异构计算平台的应用场景异构计算平台的应用场景非常广泛,包括但不限于以下几个方面:- 大数据处理:处理大规模数据集,进行数据挖掘和分析。
- :支持深度学习、机器学习等算法的计算需求。
- 科学计算:进行复杂的数值模拟和科学实验的计算。
- 图形渲染:提供高性能的图形处理能力,满足游戏和专业图形设计的需求。
二、异构计算平台的体系结构异构计算平台的体系结构是实现其高效运行的关键。
一个统一的体系结构框架能够确保不同计算单元之间的有效协同工作。
2.1 异构计算平台的硬件架构硬件架构是异构计算平台的基础,包括CPU、GPU、FPGA 等不同计算单元的集成方式。
这些计算单元通过高速互联技术连接,如PCIe、NVLink等,以实现快速的数据交换。
2.2 异构计算平台的软件架构软件架构是异构计算平台的大脑,负责管理和调度不同计算单元的资源。
它包括操作系统、编译器、运行时系统等,能够根据任务的特点,自动选择最合适的计算单元执行。
2.3 异构计算平台的通信机制通信机制是确保异构计算平台内部各计算单元高效协作的关键。
它涉及到数据传输、同步、任务调度等多个方面。
高效的通信机制可以减少数据传输的延迟,提高计算任务的执行效率。
Flykernel从去年年底(2010年)转向云计算。
主要原因是构建云计算平台必然是使用开源软件。
网上找了很多文章,都阐述了原因。
我们分析了目前云计算平台使用的开源信息系统(认为比开源操作系统确切)主要是:a.美国的RedHat Enterprise Linuxb.德国Novell公司的Suse Linux Enterprisec.CentOSd.Arch Linuxe.Ubuntu Linux等等,采用开源发行版Linux在构建云计算平台存在问题:1.大多数发行版都是国外的,安全性无法真正保障。
例如:发行版商预留系统后门,严重威胁国内数据安全2.发行版导致使用的系统库无法彻底重构,严重限制开发云平台的功能实现3.发行版都有统一的系统文件位置和名字,以及整个系统架构,这将为黑客提供了易于攻击的方法4.基于发行版的云计算平台,无法超越国外的软件技术。
例如:当要使用最新的开源软件时,有可能发行版商没有提供支持。
5.国外的发行版厂商都是公司,有可能因公司利益关系,而改变提供发行版的战略因而,基于开源源代码构建一个专用的云计算平台,即异构,就会解决掉上述的问题.异构开源信息系统,能够:1.设计符合云计算平台的系统架构2.完全客户化系统文件的名字,存放位置3.增加和剪裁平台需要的各种系统库,甚至修改系统库4.改变平台中系统的调度算法5.设计或改变平台所使用的通信协议栈。
例如:通过设计自己的httpXXX来增加云安全和云管理6.采用不同的软件实现技术7.完全按照开源软件的发展,平台能完全重构或升级异构的云计算平台,能带来的好处是:1.提升云平台硬件性能。
由于针对物理服务器硬件定制,完全发挥硬件性能2.有力保障云安全。
异构的云平台,黑客无法确定系统的各种架构和文件名字以及位置等,病毒和黑客攻击几乎不存在可能。
异构的云终端,可以保证用户从端到端的云安全。
3.节省云平台维护的成本。
没有病毒和黑客的干扰,智能性基于WEB控制的云管理。
异构云环境下云管平台设计在异构云环境下设计云管平台是一项复杂的任务,需要考虑各种云平台的差异以及不同云平台之间的互操作性。
下面是一个可能的设计方案,用于管理和监控异构云环境下的云资源。
1.管理云资源:在云管平台中,需要能够管理和监控各种异构云平台上的资源。
这涉及到统一的虚拟机管理、存储管理、网络管理等功能。
通过云管平台,用户可以在一个统一的界面上进行所有云平台资源的管理,而不需要为每个云平台都使用不同的管理工具。
2.异构云平台适配:在设计云管平台时,需要考虑到各种异构云平台的差异性,并提供相应的适配层,以便更好地管理和监控这些云平台。
适配层负责与各云平台进行通信,并将不同云平台的资源信息进行统一整合和展示。
3.提供自动化操作:云管平台应该提供一些自动化的功能,以简化操作和提高效率。
例如,可以设计一个自动化的任务调度系统,用于自动分配资源、自动扩缩容、自动备份和恢复等操作。
此外,还可以提供基于策略的自动化功能,例如根据负载情况自动调整资源分配。
4.提供监控和报告功能:云管平台应该能够对异构云环境下的资源进行监控和报告。
通过实时监控各云平台上的资源使用情况,可以及时发现和解决潜在的问题,并且提供性能和容量报告,以便进行资源规划和预测。
5.提供安全管理:在云管平台中,安全管理是一个非常重要的方面。
需要确保云平台之间的安全隔离,并提供访问控制和身份认证功能,以保护云资源免受未授权访问和攻击。
6.支持多租户:云管平台应该支持多个租户的管理,并提供对租户资源的隔离和划分。
通过提供多租户功能,可以使不同的用户和组织共享同一个云管平台,同时保持各自的资源和数据的独立性。
7.易于扩展:云管平台应该具有良好的扩展性,以便根据需要添加新的云平台和功能。
可以采用模块化设计,将不同的功能模块分离,并提供适配接口,以便新增云平台的集成和功能的扩展。
总结来说,设计异构云环境下的云管平台需要考虑资源管理、适配性、自动化操作、监控与报告、安全管理、多租户支持以及易于扩展等方面。
苏哲 广西广电大数据科技有限公司摘要:近年来,越来越多的企、事业单位开始使用云计算架构来建设新的IT系统。
然而,旧的传统架构的IT 系统还能正常使用,全部淘汰势必造成业务中断和资源浪费。
如何同时使用新、旧系统,既能发挥新系统的技术优势,又能避免旧系统的资源浪费,关系到业务的稳定和发展。
针对这个课题,本文立足某项目的研究与应用,提出异构云系统的解决方案。
本文首先介绍了项目的背景和需求,再分析异构云系统的架构和关键技术,最后提出异构云的优化方案和发展方向。
关键词:云计算 异构云 虚拟化架构1 引言异构云是指将多个不同形态、不同功能、不同网络的IT系统整合成一套系统,以提供更强的计算、存储能力。
不同形态,是指IT系统可以基于虚拟化架构,也可以基于硬件架构。
不同功能,是指IT系统可以是计算型服务器,也可以是存储型服务器。
不同网络,是指IT系统可以是单台设备,也可以是一个局域网的多网元系统。
本文先是介绍项目的背景和需求,然后分析异构云系统的架构和关键技术,最后提出异构云的优化方案和发展思考。
2 异构云的需求及业务规划2.1 异构云的背景需求某单位的机房A有2套系统:硬件服务器系统(80台x86型机架服务器)、存储系统(10台NAS主机)。
随着业务量的增加,硬件服务器系统的计算能力已无法满足业务需求,因此需要对服务器进行升级扩容。
考虑到云计算技术具备弹性计算、快速部署的优势,因此单位计划部署一套云计算系统去分摊原系统的业务压力。
然而,因机房A已无可用空间,所以将云计算系统部署在30km外的机房B。
部署完毕后,单位将有3个系统:硬件服务器系统、存储系统和云计算系统。
异构云系统的地理位置示意图如图1所示。
2.2 异构云的业务规划新建的云计算系统可创建超过1000台虚拟服务器,在计算能力上可分摊原硬件服务器的计算压力。
但云计算系统的硬盘存储容量较小,在涉及大数据存储业务时需搭配现有的存储系统使用。
因此,项目需将这3个图1 异构云系统的地理位置示意图系统进行整合,形成一个异构云系统。
现在企业为了满足自身的存储需求往往需要使用多个云平台,但是多云环境的管理是具有很大难度的,尤其是在应用程序变得更加复杂并且用户变得更加分散的时候。
所以这个时候就需要运用到多云管理工具即云管理平台了。
那么云管理平台如何定义又有哪些功能呢?云管理平台又称CMP,是一套集成的软件工具,企业可以使用它来监视和控制公共,私有,混合和多云环境。
多云管理平台是以客户应用为核心的下一代云操作系统,能够统一管理异构云资源,并以领先的可视化应用建模和微服务技术为基础,实现IaaS/PaaS+/容器等的自动化、开发、编排、交付和管理,并且能够对云的使用和成本进行追踪和优化。
目前市场上的云管平台层次不齐,功能点也是各有千秋。
为了规范平台使用,有的云管理服务商已经在国内推出了多云管理平台评估标准。
评估主要从多基础设施的整合能力、跨平台的编排能力、以服务目录为最主要载体的服务管理能力、多租户和多层次的资源访问管理能力、提供开放接口整合其他外围系统的能力等方面出发,评估关键指标包括多云接入、异构资源纳管、资源管理、服务编排、运维监控、计量计费、安全管理共7大项的26个测试项。
评估方案的正式出台,也意味着云管平台必备功能的浮出。
新一代多云的管理平台能通过单一入口广泛各等超大规模公有云的统一监控、资源编排、资产管理、成本管理管理功能,同时也支持私有云和物理裸机环境的统一纳管。
平台具有统一门户、CMDB 配置数据库、IT服务管理、运维自动化和监控告警等主要模块,支持客户自助在线处理订单、付款销账、申报问题、管理维护等商务运营流程,而且安畅网络对客户的管理、交付、技术支持也都完全在平台上运行,这极大提升了整体运营效率并大幅降低成本,业务交付速度更快、自动化程度更高、成本更具竞争力、用户体验更佳。
现在各大云管理服务商正在构建适应业务创新发展的云管理平台,实现从服务中提炼普惠性的服务方案,并构建软件化、工具化、自动化的快速上线对外提供服务的通道。
易讯通云管理平台解决方案北京易讯通信息技术股份有限公司2016年5月目录1总论1.1概述1.2建设背景2需求分析2.1客户现状2.2客户需求1)提高运维管理效率,降低成本目前管理维护人员都是进入机房,在机架旁操作服务器,但由于各主机都有自己的维护界面,造成系统维护人员需要逐个进行维护管理,显然这种单点式的维护需要耗费大量的人员成本,且效率很低。
2)提升数据中心安全性通常在出现问题的情况下,可能进入机房进行查看与维护,而由于各系统的数量及种类在不断增加,以往单一的管理模式已经不能满足数据中心发展的需求,需要一个统一的管理门户来对数据中心进行管理维护,且在整个过程中,保证公安系统的安全,做到一站式的授权、认证,操作,审计。
3)业务保密性、可用性,稳定性公安系统相关涉密系统都需要特别管理,对其上所载的业务需要做到安全、稳定,可用。
尤其在在特殊服务器出现宕机等情况下,不能及时的连接或查看相关故障,延误了时间,可能会造成损失,这就需要做到服务器主机的高可用,高稳定,高安全。
4)提升整体办公及运维安全性在公安系统中,内外电脑用于各种日常办公业务的开展,外网电脑用于信息资料的采集,从内部管理上,严格禁止“一机两用”,且在运维管理上,由于大多采用的是传统的PC电脑形式,有些可能已经服役较长年限,如何保障日常办公的正常开展,以及内外网的专网专用,提升整体办公水平以及运维安全。
5)专网专用,在安全的前提下满足业务和管理需求一机一用,禁止“一机两用”,从根本上杜绝可能发生的数据风险。
通常,安全来自外部或内部的侵袭,而来自内部的数据损坏,更需要我们采用更加有效的手段来规避,在保证安全的前提上,满足公安系统人员的办公和业务需求。
6)信息安全、可控性随着国家将信息化和信息安全作为国家发展的最高战略方向,作为公安系统,建设“安全可控”的业务系统安全体系,有着非常重要的战略意义,尤其是在涉密网,保证数据的绝对安全。
为了避免潜在的安全隐患,使用自主可控的国产软硬件产品和服务,把信息安全掌握在自己手中,确保信息安全,打造一个安全可信的计算机环境。
专利名称:异构云管理平台
专利类型:发明专利
发明人:刘晋元,张嘉锐,王茜,朱悦,赵燕,徐旻昕,周喆,崔丽春,吴洁,李敏
申请号:CN201911367469.8
申请日:20191226
公开号:CN111190730A
公开日:
20200522
专利内容由知识产权出版社提供
摘要:本申请提供一种异构云管理平台,包括云控制层,包括与异构云进行交互的一或多个API,以对云资源进行统一控制与管理;云服务层,连接所述云控制层,用于对云控制层提供资源对接服务、云服务以及运维运营服务。
解决了现存的云管平台普遍存在过程冗长、审批繁复、手工操作易出错等问题以使用户不能以统一的方式申请使用资源和提供自服务能力,使得管理异构资源的工作效率大大降低的问题,本申请整合了新建的、已有的,异构的、同构的云资源,帮助用户以统一的方式申请使用资源和提供自服务能力,帮助管理人员统一管理异构资源;采用具有一键申请、审批流程简化、自动交付标准化的云化资源交付方式、去中心化自助运维方式以及透明自治的运营模式,使得管理异构资源的工作效率提升。
申请人:上海科技发展有限公司
地址:200052 上海市徐汇区淮海中路1634号3幢514、516、518、519、520、522室
国籍:CN
代理机构:上海光华专利事务所(普通合伙)
代理人:倪静
更多信息请下载全文后查看。
60收稿日期:2018-06-23*基金项目:湖北省气象局科技发展基金重点项目(2016Z05);湖北省气象局科技发展基金重点项目(2017Z05)作者简介:杨代才(1980—),男,湖北仙桃人,本科,高级工程师,研究方向:通信网络。
我省从2013年起经过多年时间初步搭建了湖北省气象云平台,实现服务器虚拟化和桌面虚拟化,拥有混合异构的VMware资源、KVM资源和CTRIX资源池[1]。
分阶段多厂商参与建设,导致当前阶段分散、异构的多资源池普遍存在,解决如何将不同的虚拟化技术架构下的集群环境采用一种统一的方式来进行监控管理,避免监控管理不同的池化资源需要采用不同的管理方法和工具,要达到的效果是在一个统一管理的工具环境下就可以监控管理VMware资源池、CTRIX资源池、KVM资源池,管理范围包括网络层、存储资源层、服务器层,粒度能够监控管理到服务器操作系统进程级别、磁盘组RAID级别、网络VLAN级别。
如何快速、有效的监控和管理云平台中大量的网络设备、计算资源、存储设备,保障各种应用系统稳定可靠运行变的越来越重要,迫切需要开发建设混合异构的资源池的统一管理监控平台。
1 总体设计基础设施资源池监控涵盖对虚拟化环境和物理主机各项性能指标的监控,同时支持按业务系统维度、部门维度和地理位置维度进行的监视功能[2][3]。
通过SNMP协议、IPMI协议、Agent代理等采集方式,对资源的KPI性能指标包括CPU使用率、内存使用率、存储使用率、I/O速率、告警等,按设定监控时间进行主动轮询收集,并在此基础上达到实时监控资源健康状态、主动发现故障、及时运维的目的。
(1)综合视图。
综合视图为总体展示界面,从物理地域的角度、业务使用的角度以及部门角度对云系统中的资源进行展示。
具体包括资源池运行概况、资源池运行趋势、核心业务系统和各部门资源池使用情况。
(2)资源池监控。
对资源池中单个虚拟机及物理主机进行监控,用颜色直观展示机器状态,可进行精准查找和分组查看,支持图形界面与表格界面切换。