云计算平台详细方案设计
- 格式:docx
- 大小:5.93 MB
- 文档页数:76
智慧园区云计算服务平台建设方案
一、智慧园区云计算服务平台简介
智慧园区云计算服务平台是一种利用云计算技术和大数据技术来实现
智慧园区信息和服务的基础设施。
该平台采用分布式架构,通过共享计算
资源、实时信息交换、协同优化和社会服务功能,帮助智慧园区提高园区
服务质量,提升效率,提高公众服务水平。
二、智慧园区云计算服务平台架构
此智慧园区云计算服务平台的架构主要由三层组成:应用层、平台层
和基础设施层。
应用层是面向客户端的用户界面,主要提供用户操作和用户体验功能。
也可以集成与业务服务相关的系统,如支付系统,消息系统,统计分析系
统等。
平台层主要负责通过云计算技术,实现智慧园区大数据的采集、存储、处理和分析,以及相关的统计分析服务等功能。
基础设施层主要提供智慧园区云计算服务平台所需的计算资源、网络
资源、存储资源,以及服务器资源等。
三、智慧园区云计算服务平台功能
1.资源共享:提供"计算资源,网络资源,存储资源"等资源共享,帮
助智慧园区改善服务质量,提升效率。
2.安全性:提供防火墙。
云平台建设方案范文一、引言随着互联网的快速发展,云计算已经成为了企业信息化建设的重要一环。
云平台作为云计算的核心基础设施,承载着企业的业务系统、数据存储和服务交付等功能。
本文将介绍一个云平台建设方案,包括云平台的设计、部署和运维等环节,旨在帮助企业实现业务的弹性扩展、高可用性和灵活运营。
二、云平台设计1.架构设计云平台的架构设计应该具备以下几个特点:-分布式存储:数据应该能够分散在多个节点上,以提升存储容量和性能。
-弹性扩展:可以根据业务需求动态地增加或减少计算资源,以应对突发流量和业务扩展。
-高可用性:采用冗余和备份的方式,保证系统的可用性和数据的安全性。
-服务划分:将不同的服务划分为独立的模块,实现松耦合和灵活组合。
2.数据安全云平台的数据安全是至关重要的,应该具备以下几个方面的保护措施:-数据加密:对云平台中的数据进行加密,以保证数据的机密性和完整性。
-审计日志:记录用户的操作行为、系统的异常事件等,以便及时发现和处理安全问题。
-访问控制:设立严格的权限管理和用户认证机制,确保只有授权用户才能访问平台。
-数据备份与恢复:定期备份数据,并建立快速恢复机制,以防止数据丢失或损坏。
三、云平台部署1.硬件设施云平台的硬件设施选择应该满足以下几个要求:-高性能:选择性能强劲的服务器和网络设备,以保证云平台的响应速度和数据传输速率。
-高可靠性:采用冗余和备份的方式,确保云平台的高可用性和故障恢复能力。
-弹性扩展:硬件设施应该具备高扩展性,能够根据业务需求灵活地增加或减少计算资源。
2.软件环境云平台的软件环境应该具备以下几个要求:-虚拟化技术:采用虚拟化来实现资源的隔离和共享。
-自动化运维:建立自动化运维系统,包括自动化部署、监控和故障处理等功能。
-开发工具支持:提供一套开发工具和接口,方便开发人员进行应用程序的开发和调试。
四、云平台运维1.监控与调优为了保证云平台的稳定性和性能,应该进行定期的监控和调优工作,包括以下几个方面:-系统监控:监控各个节点的负载情况、网络带宽使用率等指标,及时发现和解决性能问题。
云计算平台的规划与设计随着云计算技术的快速发展,越来越多的企业开始关注和采用云计算平台。
云计算平台具有高度灵活性、可扩展性和安全性,可以帮助企业降低成本、提高效率。
然而,要想构建一个高效稳定的云计算平台,并不是一件容易的事情。
本文将探讨云计算平台的规划与设计,以帮助企业更好地利用云计算技术。
首先,云计算平台的规划是非常关键的。
规划应该着重考虑以下几个方面。
第一,确定云计算平台的目标。
企业应该明确自己构建云计算平台的目标,是为了提高效率,还是为了降低成本,或者是为了满足用户需求。
明确目标有助于确定云计算平台的功能和要求,以及相应的架构和技术选择。
第二,制定合理的架构和设计。
云计算平台的架构应该能够满足企业的需求,具有高可用性、高扩展性和灵活性。
架构设计应该考虑到数据存储、计算资源管理、网络安全等方面,以确保平台的稳定性和安全性。
第三,选择适合的云计算平台解决方案。
根据企业的需求和资源情况,选择合适的云计算平台解决方案非常重要。
主流的云计算平台解决方案有公有云、私有云和混合云,每种解决方案有其优势和适用场景。
企业应该根据自身情况选择最适合的解决方案。
其次,云计算平台的设计是关键的一步。
设计应该考虑到以下几个方面。
第一,数据安全是最重要的。
云计算平台存储着大量的数据,必须确保数据的安全性和隐私性。
设计应该包括严格的访问控制、加密技术、数据备份和恢复机制等,以保护数据的安全。
第二,性能优化是关键。
云计算平台的性能对于用户体验和业务运营至关重要。
设计应该考虑到负载均衡、缓存优化、并发处理等方面,以提高平台的性能和响应速度。
第三,可扩展性是必须的。
随着业务的发展,云计算平台的需求会不断增长。
设计应该具有良好的扩展性,能够快速响应业务需求的增长,支持横向和纵向的扩展。
第四,用户体验要优化。
云计算平台的用户体验对于用户的满意度和粘性至关重要。
设计应该考虑到用户界面的友好性、交互性和响应速度,以提供优秀的用户体验。
云计算平台建设方案1.引言随着信息技术的快速发展,云计算作为一种灵活、可扩展且高度可靠的计算模式,受到越来越多企业的青睐。
本文将为企业提供一份云计算平台建设方案,帮助企业充分利用云计算技术实现业务的快速发展和灵活扩展。
2.背景介绍云计算平台是基于云计算技术的一种运行环境,可提供强大的计算和存储资源。
通过搭建云计算平台,企业可以实现数据的共享、计算能力的弹性调整、成本的降低以及业务的快速响应等优势。
3.需求分析在制定云计算平台建设方案之前,首先需要对企业的需求进行全面分析。
包括但不限于以下几个方面:- 业务需求:根据企业的业务特点和目标,明确所需的计算和存储资源,以及对安全性和可靠性的要求。
- 技术需求:确定平台所需的硬件设备,操作系统,虚拟化平台和云管理软件等技术要求。
- 成本需求:基于企业的财务预算,确定云计算平台建设的成本预算,包括硬件设备、软件许可、人力资源等方面的开支。
4.架构设计在完成需求分析后,我们将提出一个针对企业的云计算平台架构设计方案。
该方案将基于以下几个关键组件:- 虚拟化技术:利用虚拟化技术实现服务器的资源池化,提高计算资源的利用效率。
- 自动化管理工具:选择适合企业的云管理软件,实现资源的自动化管理、监控和配置,提高整体系统的稳定性和管理效率。
- 存储系统:通过搭建高性能的存储系统,实现数据的备份、恢复和迁移,确保数据的安全性和可靠性。
- 安全防护策略:制定完善的安全策略,包括访问控制、用户认证、加密通信等,确保云平台的安全性。
5.实施步骤根据架构设计方案,我们将提供一份详细的实施步骤,以帮助企业顺利完成云计算平台的建设:- 环境准备:确定硬件设备的购买计划,并进行相关设备的采购和安装。
- 软件部署:选择合适的云管理软件,并进行软件的安装、配置和测试,确保软件的稳定运行。
- 数据迁移:对企业现有的数据进行分析、备份和迁移,确保数据的完整性和安全性。
- 系统集成:将各个组件进行集成,测试整体系统的功能和性能,确保各组件的协同工作。
云计算平台扩容建设方案详细一、需求分析1.容量需求分析:对已有的云计算平台进行分析,确定扩容的容量需求,包括计算资源、存储资源以及网络带宽等方面。
2.性能需求分析:根据当前的业务量和用户量,预测未来的增长趋势,确定扩展后的性能需求,包括处理能力、响应时间等方面。
3.系统可用性需求分析:确定扩容后的系统可用性需求,包括服务的高可用性、容错能力、灾备能力等方面。
二、架构设计1.扩容策略:根据需求分析的结果,确定适合的扩容策略,可以选择垂直扩容或者水平扩容,或者二者的结合。
2.资源规划:根据扩容策略,对扩容后的计算、存储资源进行规划和分配,包括服务器、存储设备、网络设备等。
3.网络架构设计:设计合理的网络拓扑结构,保证扩容后的网络带宽和时延满足需求,包括互联网接入、内部网络和数据中心网络等方面。
三、硬件选型根据需求和架构设计的结果,选择适合的硬件设备,包括服务器、存储设备、网络设备等。
在选择硬件设备时需要考虑性能、可扩展性、可靠性、成本等因素,可以进行性能测试和压力测试以验证硬件设备的性能和稳定性。
四、设备部署根据架构设计和硬件选型的结果,对设备进行部署,包括服务器、存储设备、网络设备等。
在部署设备时需要考虑设备的配置和连接方式,保证设备的可靠性和可维护性。
五、系统配置根据需求和设备部署的结果,对系统进行配置,包括操作系统、虚拟化平台、存储系统、网络设备的配置等。
在配置系统时需要考虑系统的性能优化、安全配置、容错配置等方面。
六、数据迁移如果扩容涉及到数据的迁移,需要进行数据迁移的规划和实施。
根据数据的体量和迁移的时间窗口,选择合适的迁移方式,可以采用离线迁移或者在线迁移,保证数据的完整性和一致性。
七、系统测试对扩容后的系统进行测试,包括功能测试、性能测试、安全测试等方面。
根据测试结果对系统进行调优和改进,保证系统的稳定性和可用性。
八、系统上线在系统测试通过后,将扩容后的系统投入使用。
在系统上线前需要进行用户培训和技术支持的准备工作,确保系统的顺利过渡并满足用户的需求。
最全的云计算平台设计方案云计算平台是指通过互联网提供各种计算资源和服务,以实现低成本、高可靠、高扩展性和高性能的计算能力供应。
设计一个最全的云计算平台方案需要考虑以下几个方面:1.基础设施层:-服务器硬件:选择高性能的服务器硬件,包括高性能处理器、大容量内存和高速存储,以满足大规模并行计算的需求。
-网络设备:使用高性能的网络设备,包括交换机和路由器,以实现高速、低延迟和可靠的网络传输。
-存储设备:选择高速、可扩展的存储设备,如分布式存储系统或网络存储设备,以满足大规模数据存储和访问的需求。
-虚拟化技术:使用虚拟化技术,如虚拟机或容器,以实现资源的灵活分配和管理。
2.软件平台层:- 操作系统:选择适合云计算平台的操作系统,如Linux或Windows Server,以提供稳定的操作环境和高性能的计算能力。
- 虚拟化管理软件:选择适合的虚拟化管理软件,如OpenStack或VMware vSphere,以实现虚拟机的创建、管理和迁移。
- 容器管理平台:选择适合的容器管理平台,如Kubernetes或Docker Swarm,以实现容器的管理和部署。
- 数据管理软件:选择适合的数据管理软件,如Hadoop或Spark,以提供大规模数据的存储、处理和分析能力。
-安全管理软件:选择适合的安全管理软件,如防火墙、入侵检测系统和访问控制系统,以保护云平台免受攻击和数据泄露。
3.服务层:- 基础设施即服务(IaaS):提供虚拟化的服务器、存储和网络资源,以满足用户的计算需求。
- 平台即服务(PaaS):提供开发、部署和运行应用程序的平台,以简化开发过程和降低运维成本。
- 软件即服务(SaaS):提供各种应用程序和服务,以满足用户的特定需求,如电子邮件、在线办公和视频会议。
4.管理与监控层:-自动化管理:实现自动化的资源分配和管理,如自动扩展和负载均衡,以提供高可用性和高性能的计算能力。
-用户管理:提供用户管理功能,包括用户认证、授权和账户管理,以保证资源和数据的安全性和隐私性。
云平台规划设计方案引言云计算已经成为现代企业和组织的核心技术之一,它提供了高度可扩展的计算和存储资源,同时降低了IT基础设施的成本和复杂性。
为了充分利用云计算的优势,许多企业开始规划和设计自己的云平台。
本文将介绍云平台规划设计方案的关键内容,以帮助企业在构建云基础设施时做出明智的决策。
目标和需求分析在规划和设计云平台之前,首先需要明确目标和需求。
公司的需求可能包括以下几个方面: - 弹性扩展:能够根据业务需求快速扩展和缩小计算和存储资源。
- 高可用性:确保系统在故障情况下仍然可用,并提供冗余和备份机制。
- 安全性:保护数据和系统免受未经授权的访问和攻击。
- 成本效益:通过合理的资源管理和优化,降低基础设施和运维成本。
- 灵活性:能够支持多种应用程序和工作负载,包括容器化应用程序和虚拟机。
基础设施规划在云平台规划设计中,基础设施是核心要素之一。
以下是一些基础设施规划的关键考虑因素: - 云提供商选择:根据业务需求和预算选择合适的云提供商,例如Amazon Web Services(AWS)、Microsoft Azure或Google Cloud Platform (GCP)等。
- 虚拟化技术:选择适当的虚拟化技术,如VMware、KVM或Hyper-V等,用于实现虚拟机的管理和部署。
- 存储和网络:设计合适的存储和网络架构,确保数据的高可靠性和可用性。
- 容器化技术:考虑使用容器化技术,如Docker或Kubernetes,以支持轻量级和可移植的应用程序部署。
安全规划安全是任何云平台规划设计方案中的关键因素。
以下是一些安全规划的关键考虑因素: - 访问控制:实施合适的身份验证和授权机制,确保只有合法用户有权访问系统和数据。
- 加密:采用数据加密技术,包括数据传输加密和数据存储加密,以保护数据的机密性和完整性。
- 漏洞管理:定期进行漏洞扫描和漏洞修补,确保系统的安全性。
- 审计和监控:实施适当的审计和监控机制,用于检测潜在的安全风险和异常活动。
最全的云计算平台设计方案随着云计算的快速发展和广泛应用,越来越多的企业和组织将其业务迁移到了云计算平台上。
一个全面的云计算平台设计方案需要考虑到各种因素,如硬件架构、软件架构、安全性、可扩展性等。
以下是一个最全的云计算平台设计方案,介绍了每个方面的要点。
1.硬件架构:-服务器集群:搭建多台服务器构成集群,实现负载均衡和高可用性。
-存储系统:采用分布式存储系统,将数据冗余备份,提高可靠性和可用性。
-网络设备:使用高性能网络设备,实现快速数据传输和低延迟。
-数据中心:建立多个分布式的数据中心,提供地理冗余,增加系统的稳定性。
2.软件架构:-虚拟化技术:使用虚拟化技术将物理服务器划分为多个虚拟机,提高硬件资源的利用率。
-容器化技术:采用容器化技术,将应用程序打包成独立的容器,实现快速部署和扩展。
-服务编排:使用服务编排工具,管理和自动化各个组件之间的部署和通信。
-流程调度:设计智能的流程调度算法,根据不同的任务负载进行资源调度和任务分配。
3.安全性:-认证和授权:通过身份验证和权限管理,确保只有经过授权的用户能够访问平台和数据。
-数据加密:对数据进行加密,保护数据的机密性和完整性。
-安全审计:记录和监控用户的操作,及时发现和应对安全事件。
-防火墙和入侵检测系统:建立防火墙和入侵检测系统,保护平台免受网络攻击。
4.可扩展性:-弹性扩展:设计平台具备弹性扩展的能力,根据业务需求自动增加或减少资源。
-水平扩展:采用水平扩展的方式,通过增加更多的服务器来扩展平台的处理能力。
-自动化管理:引入自动化的管理工具,实现自动化运维和资源管理。
-分布式架构:设计平台为分布式架构,将任务分发到多个节点上并行处理,提高系统的性能和吞吐量。
5.弹性计算:-弹性计算是云计算平台的核心功能,提供了按需分配计算资源的能力。
-实时监控:实时监控各个资源的使用情况,根据需要分配和释放资源。
-资源池化:将资源组织成一个资源池,按需分配给用户,提供灵活的计算环境。
云计算平台详细方案设计第1章数据中心云平台设计1.1云平台总体架构设计基于当前IT基础架构的现状,未来云平台架构必将朝着开放、融合的方向演进,因此,云平台建议采用开放架构的产品。
目前,越来越多的云服务提供商开始引入Openstack,并投入大量的人力研发自己的openstack版本,如VMware、华三等,各厂商基于Openstack架构的云平台其逻辑架构都基本相同,具体参考如下:图2-1:云平台逻辑架构图从上面的云平台的逻辑架构图中可以看出,云平台大概分为三层,即物理资源池、虚拟抽象层、云服务层。
1、物理资源层物理层包括运行云所需的云数据中心机房运行环境,以及计算、存储、网络、安全等设备。
2、虚拟抽象层资源抽象与控制层通过虚拟化技术,负责对底层硬件资源进行抽象,对底层硬件故障进行屏蔽,统一调度计算、存储、网络、安全资源池。
3、云服务层云服务层是通过云平台Portal提供IAAS服务的逻辑层,用户可以按需申请相关的资源,包括:云主机、云存储、云网络、云防火墙与云负载均衡等。
基于未来云平台的发展趋势及华北油田数据中心云平台的需求,华北油田的云平台应具备异构管理能力,能够对多种虚拟化平台进行统一的管理、统一监控、统一运维,同时,云平台能够基于业务的安全需要进行安全防护,满足监控部门提出的安全等级要求。
下面是本次云平台架构的初步设计,如下图所示:图2-2:云平台总体架构图1.2资源池总体设计从云平台的总体架构可以看出,资源池是云平台的基础。
因此,在构建云平台的过程中,资源的池化迈向云的是第一步。
目前,计算资源的池化主要包括两种,一种是X86架构的虚拟化,主要的虚拟化平台包括VMware、KVM、Hyper-V等;另一种是小型机架构的虚拟化,主要的虚拟化平台为PowerVM,这里主要关注基于X86架构的虚拟化。
存储资源的池化也包括两种,一种是当前流行的基于X86服务本地磁盘实现的分布式存储技术,如VMware VSAN、华为FusionStorage、华三vStor等;另一种是基于SAN 存储实现的资源池化,实现的方式是利用存储虚拟化技术,如EMC VPLEX、华为VIS(虚拟化存储网关型)和HDS VSG1000(存储型)等。
这两种方式分别适用于不同的场景,对于普通的数据存储可以尝试使用分布式存储架构,如虚拟机文件、OLAP类数据库等,而对于关键的OLTP类数据库则建议采用基于SAN存储的架构。
网络资源池化也包括两种,一种是基于硬件一虚多技术实现的网络资源池,如华为和华三的新型的负载均衡、交换机、防火墙等设备;另一种是基于NFV技术实现的网络资源池。
这两种方式分别适用于不同的场景,对于南北向流量的网络服务建议采用基于硬件方式实现的网络资源池化,而对于东西向流量的网络服务建议采用基于NFV技术实现的网络资源池化。
图2-2-1:华北油田资源池总体设计示例1.2.1X86计算资源池设计1.2.1.1计算资源池设计服务器是云计算平台的核心之一,其承担着云计算平台的“计算”功能。
对于云计算平台上的服务器,通常都是将相同或者相似类型的服务器组合在一起,作为资源分配的母体,即所谓的服务器资源池。
在这个服务器资源池上,再通过安装虚拟化软件,使得其计算资源能以一种虚拟服务器的方式被不同的应用使用。
这里所提到的虚拟服务器,是一种逻辑概念。
对不同处理器架构的服务器以及不同的虚拟化平台软件,其实现的具体方式不同。
在x86系列的芯片上,其主要是以常规意义上的VMware虚拟机或者H3Cloud虚拟机的形式存在。
后续的方案描述中,都以H3C 虚拟化软件进行描述。
•CVK:Cloud Virtualization Kernel,虚拟化内核平台运行在基础设施层和上层操作系统之间的“元”操作系统,用于协调上层操作系统对底层硬件资源的访问,减轻软件对硬件设备以及驱动的依赖性,同时对虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、性能优化等问题进行加固处理。
•CVM:Cloud Virtualization Manager,虚拟化管理系统主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化,形成虚拟资源池,对上层应用提供自动化服务。
其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可靠性(HA)、动态资源调度(DRS)、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机策略等。
采用购置的虚拟化软件对多台PC服务器虚拟化后,连接到共享存储,构建成虚拟化资源池,通过网络按需为用户提供计算资源服务。
同一个资源池内的虚拟机可以共享资源池内物理服务器的CPU、内存、存储、网络等资源,并可在资源池内的物理服务器上动态漂移,实现资源动态调配。
计算资源池逻辑组网架构图如下所示:计算资源池逻辑组网架构建成后的虚拟化系统,虚拟机之间安全隔离;虚拟机可以实现物理机的全部功能;兼容主要服务器厂商的主流X86服务器、主流存储阵列产品、运行在X86服务器上的主流操作系统,并支持主流应用软件的运行。
1.2.1.2资源池主机容量规划设计单台服务器所能支持虚机数量的决定因素主要取决与两方面:⏹服务器的硬件配置♦CPU性能---多核高主频技术使得CPU成为性能瓶颈的可能性越来越低♦内存大小---做为硬指标的内存,配置越高,所能支持的虚机数量越多♦网络端口---千兆网环境已很普遍,网络带宽大多有保证,更多从管理角度来考虑♦HBA卡---磁盘访问性能对虚机数量有一定影响,建议采用10G以太网或者8GbpsFC以减少链路影响♦本地磁盘---内置磁盘的可用性及IO吞吐能力均较弱,不建议在其上存放虚拟机,推荐使用外置高性能磁盘阵列⏹应用负载大小♦由于物理服务器资源自身的最大限制,应用负载越大,所能同时运行的虚机数量越少♦建议将不同应用访问特性的应用混合部署在同一物理服务器上♦灵活运用DRS和VMotion技术可将物理机与虚机的比率关系调到最优♦考虑到HA及DRS所要求的资源冗余,所有运行虚机在正常负载下,总体资源使用率不超过三分之二会比较合适在部署虚拟化时,对物理服务器的硬件配置需要考虑以下因素:♦可用的CPU目标数量尽可能多,单台服务器建议配置6个以上的CPU核。
♦超线程技术并不能提供等同于多核处理器的好处;建议关闭CPU的超线程功能♦使用具有EM64T能力的Intel VT 或AMD V 技术的CPU可以同时支持运行32位和64位的虚拟机♦采用同一厂商、同一产品家族和同一代处理器的服务器组成的集群,可以获得最好的虚拟机迁移兼容能力♦内存资源往往比CPU资源更会成为潜在的瓶颈,尽可能采用最大容量的内存条(单条8GB效果优于两条4GB)。
下表给出了部署虚拟化时的服务器建议配置:⏹虚拟机资源分配设计1.虚拟机CPU分配原则:♦尽量使用最少的vCPUs,如果是单线程应用,无需多线程处理。
♦虚拟CPU数量不要等于或超过物理CPU核数,如双路双核的服务器配置,虚机最多使用两个虚拟CPU2.内存分配原则:♦内存总量为在资源评估后,计算虚拟机评估结果所需实际内存尽量避免大于物理内存的总和。
因为应用程序而产生的更多内存需要用磁盘内存来解决,会导致系统性能下降。
如需要P2V迁移,在进行虚拟化迁移之前,应对每个应用系统虚拟化迁移后所需的虚拟计算进行合理的评估和计算,以确保迁移后应用系统的可用性、可靠性和各项性能指标可满足业务目标。
虚拟资源计算的原则是,如果客户希望业务系统迁移后,业务系统能够保持与原系统一致的体验,我们建议虚拟机的计算能力与原物理服务器的计算能力保持一致;如果客户希望通过P2V的迁移,提高资源的利用率,我们建议虚拟机的计算能力可以相比原先进行一定程度的压缩,具体的压缩计算方式如下图所示。
1.2.1.3高可用保障主机高可用H3C CAS虚拟化平台HA功能会监控该集群下所有的主机和物理主机内运行的虚拟主机。
当物理主机发生故障,出现宕机时,HA功能组件会立即响应并在集群内另一台主机上重启该物理主机内运行的虚拟机。
当某一虚拟服务器发生故障时,HA功能也会自动的将该虚拟机重新启动来恢复中断的业务。
除了对集群中的物理服务器节点进行持续检测之外,H3C CAS HA软件模块还对运行于物理服务器节点之上的虚拟机进行持续检测。
在每台服务器节点上都运行了一个LRMd(Local Resource Manager daemon,本地资源管理器守护进程),它是HA软件模块中直接操作所管理的各种资源的一个子模块,负责对本地的虚拟化资源进行状态检测,并通过shell脚本调用方式实现对资源的各种操作。
当LRMd守护进程检测到本机的某台虚拟机出现通信故障时,首先将事件通知给DC,由DC统一将该虚拟机状态告知集群内所有的物理服务器节点,并按照一定的策略算法,为该故障的虚拟机选择一个空闲的服务器节点,在该节点上重启该虚拟机。
操作系统蓝屏高可用蓝屏又称之为蓝屏死机(Blue Screen of Death,BSoD),是微软Windows操作系统无法从一个系统错误中恢复时,为保护计算机数据文件不被破坏而强制显示的屏幕图像。
从专业的角度来讲,蓝屏被定义为“当微软Windows操作系统由于出现灾难性错误或者内部条件阻止系统继续运行而显示的蓝色屏幕”。
Linux类型操作系统没有蓝屏的概念,与之对应的称之为内核崩溃(Kernel Panic),此时,可能会在终端输出内核栈,如果Linux操作系统开启了Core Dump选项,则会产生Core 文件。
H3C CAS CVK虚拟化内核系统支持虚拟机蓝屏(Windows)和崩溃(Linux)的故障检测及HA处理,前提条件是在虚拟机操作系统上必须安装CAStools工具,该工具的目的是通过虚拟串口通道保持与H3C CAS CVK虚拟化内核系统的实时通信,判定虚拟机的存活状态,如果在3个时间周期(一个周期为30秒)内没有接收到操作系统CAStools的应答,则通过探测虚拟机磁盘I/O读写来进一步判定虚拟机的存活状态,如果在6个时间周期(一个周期为30秒)内没有探测到虚拟机磁盘I/O读写活动,则判定虚拟机操作系统蓝屏。
当确定虚拟机出现蓝屏之后,有三种HA处理方式,可由系统管理员在H3C CAS CVM虚拟化管理平台上配置:(1)不处理:即使检测到虚拟机蓝屏故障,也不会做任何处理(默认配置)。
(2)故障重启:将蓝屏后的虚拟机在本地物理主机上重新启动。
(3)故障迁移:将蓝屏后的虚拟机迁移到集群内其它正常工作的物理主机上。
应用高可用应用HA是指运行于虚拟机操作系统内的业务系统的高可靠性,当业务系统由于自身原因导致无法对外正常提供服务时,可以借助应用HA功能,以最短的时间自动恢复业务。
企业级业务系统一般都以进程服务的方式驻留在操作系统内,H3C CAS CVM虚拟化管理平台利用CAStools工具来监控业务服务进程的状态,该工具安装在虚拟机操作系统上,通过虚拟串口通道保持与H3C CAS CVM虚拟化管理平台的实时通信,判定业务的存活状态。