VMware+高可用性配置(HA)(DRS)(FT)
- 格式:pdf
- 大小:1.61 MB
- 文档页数:25
VMware vCenter 高可用性 HA 详解时间: 2011-07-01 分类: VMware标签: DRS, HA, vCenter, VM, vMotion / 1,455 次浏览0 评论VM ware HA简介HA的全称是High Availability(高可用性)。
VM ware HA群集一般具有一个包括两个或者两个以上ESX 主机的逻辑队列。
在一个HA群集中,每一台VM ware ESX服务器配有一个HA代理,持续不断地检测群集中其他主的心跳信号。
假如某台ESX主机在连续三个时间间隔后都还没有发出心跳信号,那么该主机就被默认为发生了故障或者与网络的连接出现了问题。
在这种情况下,原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。
反之,如果一台主机无法接收到来自群集的其他主机的心跳信号,那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。
如果真的出现了问题,那么就会中断在这台主机上所有正在运行的虚拟机,并启动预先设定好的备用主机。
此外,VMware HA的另一个显著的特点是能够对一个群集中的多台ESX服务器(多达四台)上进行故障转移。
对于一次VMware HA故障转移,客户端操作系统认为只是一次因硬件的崩溃而进行的重启,并不会觉察到是一次有序的关机。
因此,这样的修复并不会改变操作系统的状态。
此外,虚拟机中任何正在进行的业务也不会丢失。
即使备用ESX服务器主机的硬件设备跟原ESX服务器主机的硬件设备有所不同,客户端操作系统也不会检测到这种不同。
所以,VMware HA的故障转移对于客户来说可以算是完全透明的,几乎不会出现任何停机的危险。
1. VMware HA 提供快速中断恢复VMware HA 利用配置为群集的多台 ESX/ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。
VMware HA 通过以下两种方式保护应用程序可用性:∙通过在群集内的其他主机上自动重新启动虚拟机,防止服务器故障。
VMware vCenter 高可用性 HA 详解时间: 2011-07-01 分类: VMware标签: DRS, HA, vCenter, VM, vMotion / 1,455 次浏览0 评论VM ware HA简介HA的全称是High Availability(高可用性)。
VM ware HA群集一般具有一个包括两个或者两个以上ESX 主机的逻辑队列。
在一个HA群集中,每一台VM ware ESX服务器配有一个HA代理,持续不断地检测群集中其他主的心跳信号。
假如某台ESX主机在连续三个时间间隔后都还没有发出心跳信号,那么该主机就被默认为发生了故障或者与网络的连接出现了问题。
在这种情况下,原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。
反之,如果一台主机无法接收到来自群集的其他主机的心跳信号,那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。
如果真的出现了问题,那么就会中断在这台主机上所有正在运行的虚拟机,并启动预先设定好的备用主机。
此外,VMware HA的另一个显著的特点是能够对一个群集中的多台ESX服务器(多达四台)上进行故障转移。
对于一次VMware HA故障转移,客户端操作系统认为只是一次因硬件的崩溃而进行的重启,并不会觉察到是一次有序的关机。
因此,这样的修复并不会改变操作系统的状态。
此外,虚拟机中任何正在进行的业务也不会丢失。
即使备用ESX服务器主机的硬件设备跟原ESX服务器主机的硬件设备有所不同,客户端操作系统也不会检测到这种不同。
所以,VMware HA的故障转移对于客户来说可以算是完全透明的,几乎不会出现任何停机的危险。
1. VMware HA 提供快速中断恢复VMware HA 利用配置为群集的多台 ESX/ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。
VMware HA 通过以下两种方式保护应用程序可用性:∙通过在群集内的其他主机上自动重新启动虚拟机,防止服务器故障。
VMware Vmotion、HA、DRS的介绍VmotionVmware Vmotion可以使运行中的虚拟机从一台物理服务器实时迁移到另一台物理服务器,它实现了零停机时间和连续可用的服务,并能全面保证事务的完整性。
Vmotion是一种用户创建动态、自动化、自我优化的数据中心的关键促成技术优势:不间断地自动分配资源池中的虚拟机可执行维护时不需要中断业务操作,从而提高了可用性。
工作原理使用Vmotion将虚拟机从一台物理服务器实时迁移到另外一台物理服务器的过程是通过三项基础技术实现的(1)首先,虚拟机的整个状态由存储在共享存储器(如光纤通道或iSCSI存储区域网络(SAN),或网络连接存储(NAS))上的一组文件封装起来。
VMWare群集Virtual Machine File System(VMFS)允许安装多个ESX Server,以并行访问同一组虚拟机文件(2)第二,虚拟机的活动内存及精确的执行状态通过高速网络快速传输,因而允许虚拟机立即从在源ESX Server上运行切换到在目标ESX Server上运行。
Vmotion通过在位图中连续跟踪内存事务来确保用户觉察不到此传输期。
一旦整个内存和系统状态已拷贝到目标ESX Server,Vmotion将中止源虚拟机的运行,将位图拷贝到目标ESX Server,并在目标ESX Server上恢复虚拟机的运行。
整个过程在以太网上需要不到两秒钟的时间(3)第三,虚拟机使用的网络也被底层ESX Server虚拟化,确保即使在迁移之后,虚拟机的网络身份和网络连接也能保留下来。
Vmotion在此过程中管理虚拟MAC地址。
一旦目标机被激活,Vmotion就会ping网络路由器,以确保它知道虚拟MAC地址的新物理位置。
因为用Vmotion进行虚拟机迁移可保持精确的执行状态、网络身份和活动网络连接,其结果是实现了零停机时间而且不中断用户操作。
前提条件(1)VM必须放置在共享存储里(2)esx的cpu类型需要要一样,简单说,就是不能一个是intel,一个是amd的,都是intel,不同型号,没有问题。
一、drs概念VMwareInfrastructure 3 DRS(Distributed Resource Scheduler) Vmware 分布式资源调度程序(DRS)跨聚合到逻辑资源池中的硬件资源集合来动态地分配和平衡计算容量。
Vmware DRS 跨资源池不间断地监控利用率,并根据反映了业务需要和不断变化的优先事务的预定义的规则,在多个虚拟机之间智能地分配可用资源。
当虚拟机遇到负载增大时,Vmware DRS将通过在资源池中的物理服务器之间重新分布虚拟机来自动为其分配更多资源二、实验设置基本步骤1、集群-右键-编辑设置(我们这里需要测试drs效果,所以将drs设置为手动)2、我们测试可以分为几种,A:不设置规则、B:聚集虚拟机、C:单独虚拟机、D:虚拟机到主机。
A、假定我们用3台虚拟机作为测试虚拟机,并且在虚拟机里面跑回环脚本bat,3台虚拟机会任意一台或者多台迁移到其他资源较大空闲的主机上。
B、假定我们把这3台虚拟机设置为一个test组,并且在虚拟机里面跑回环脚本bat,3台虚拟机会迁移到其他资源空闲较大的一台主机上(包括本机,在有加密狗的情况下,这种方法适用)C、假定我们把这3台虚拟机设置为一个test组,并且在虚拟机里面跑回环脚本bat,3台虚拟机会迁移到其他空闲较大的不同的虚拟机上。
D、假定我们把这3台虚拟机设置为一个test组,并且把其中3台主机创建为pc主机组,并且在虚拟机里面跑回环脚本bat。
这里就有集中情况,当然现在和B、C集合测试。
和B集合结果:3台虚拟机会迁移到pc主机组较大空闲的其中一台主机上。
3、上面几种测试,手动测试的情况下可以看到效果,因为drs是每30分钟抽取esxi主机的数据,8小时自动平衡一次。
所以我们测试用手动测试,如果是生产环境建议用自动。
以我给的标题写文档,最低1503字,要求以Markdown文本格式输出,不要带图片,标题为:vmware vsphere方案# VMware vSphere方案## 简介VMware vSphere是一款由VMware公司开发和推出的虚拟化解决方案,旨在提供可靠、灵活、高性能的虚拟化平台。
vSphere允许用户在单个物理服务器上同时运行多个虚拟机,实现资源的高度利用,并提供高级的管理和监控功能。
本文将介绍vSphere方案的基本特性、架构和实施。
## 特性vSphere具有以下一些核心特性:### 虚拟化vSphere采用硬件虚拟化技术,将物理服务器划分为多个独立的虚拟机,每个虚拟机可以运行不同的操作系统和应用程序。
虚拟化技术能够提供一致的运行环境,简化应用程序的部署和管理。
### 高可用性vSphere具备高可用性功能,当主机故障时,自动将虚拟机迁移到可用的主机上,确保应用程序的连续性和可靠性。
通过vSphere HA(高可用性)功能,可以减少因硬件故障或维护导致的服务中断。
### 负载均衡vSphere提供负载均衡功能,可根据虚拟机的资源使用情况自动调整虚拟机的位置。
通过vSphere DRS(分布式资源调度)功能,可以实现根据实时性能和资源需求自动平衡工作负载。
### 自动化管理vSphere支持自动化管理,可以通过vSphere vCenter Server进行集中管理,包括虚拟机的创建、部署、迁移和监控。
vCenter Server还提供了高级的管理功能,如可视化性能分析、运维任务自动化和资源利用报告等。
### 安全性vSphere具有强大的安全性功能,包括虚拟机加密、防火墙设置、访问控制和审计日志等。
通过vSphere的安全功能,可以保护虚拟机和敏感数据的安全性和完整性。
## 架构vSphere方案的架构主要包括以下几个组件:### ESXi主机ESXi是vSphere的核心组件之一,是一种轻量级的虚拟化操作系统,安装在物理服务器上。
VMware高可用性(集群HA)1 应用层高可用性:如实现mysql、oracle数据库应用程序的储群集,主要是判断mysql、oracle 应用程序是否停止运行。
2 操作系统高可用性:如windows的故障转移群集(windows failover clustering WFC)。
3 虚拟化层的高可用性:如vsphere high availability(HA)和vsphere fault tolerance(FT)。
4 物理层的高可用性:如:多网络适配器、SAN等。
vSphere HA 和 Fault Tolerance(FT)功能分别通过提供中断快速恢复和连续可用性来最小化或消除非计划停机时间。
使用 vSphere,企业可以轻松提高为所有应用程序提供的基准级别,并且以更低成本和更简单的操作来实现更高级别的可用性。
使用vSphere,你可以:a 独立于硬件、操作系统和应用程序提供更高可用性。
b 减少常见维护操作的计划停机时间。
c 在出现故障时提供自动恢复。
一、vSphere HA 提供快速中断恢复vSphere HA 利用配置为群集的多台 ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。
vSphere HA 通过以下方式保护应用程序可用性:1 通过在群集内的其他主机上重新启动虚拟机,防止服务器故障。
2 通过持续监控虚拟机(通过vmware tools实现主机向虚拟机发送检测信号)并在检测到故障时对其进行重新设置, 防止应用程序故障。
与其他群集解决方案不同,vSphere HA 提供基础架构并使用该基础架构保护所有工作负载:a 无需在应用程序或虚拟机内安装特殊软件。
所有工作负载均受 vSphere HA 保护。
配置 vSphere HA 之后,不需要执行操作即可保护新虚拟机。
它们会自动受到保护。
(需在开机状态下才受保护)b 可以将 vSphere HA 与 vSphere Distributed Resource Scheduler (DRS即负载均衡) 结合使用以防止出现故障,以及在群集内的主机之间提供负载平衡。
VMware vSphere新建集群及设置高可用性的方法作者:诚恺科技来源:浏览次数:1475日期:2014年3月11日10:30高可用和双机热备是VMware vSphere的最重要的群集功能,企业使用高可用就是为了服务的连续性和数据的安全性,下面,诚恺科技小编同大家一起主要来看看在VMware vSphere中新建集群及设置高可用性的方法。
相关产品:VMware vSphere相关产品详情介绍及报价一、VMware vSphere高可用性的优势VMware vSphere高可用性(HA)是以一群ESXi服务器为主的群集功能,主要是目的是当虚拟机运行的主机发生故障时能及时转移主机,避免长时间的停机。
vSphere HA 利用配置为群集的多台ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。
vSphere HA通过在群集内的其他主机上重新启动虚拟机,防止服务器故障,持续监控虚拟机并在检测到故障时对其进行重新设置,防止应用程序故障。
与其他群集解决方案不同,vSphere HA 提供基础架构并使用该基础架构保护所有工作负载,无需在应用程序或虚拟机内安装特殊软件,所有工作负载均受vSphere HA 保护,配置vSphere HA 之后,不需要执行操作即可保护新虚拟机,它们会自动受到保护。
二、VMware vSphere建立群集的方法1、VMware vSphere群集的优势多台电脑组成的集合就称为集群,集群的目的就是将计算机的负担分配到多台主机上,或是当运行某一个服务的物理服务器弹出问题时,让另一台服务器接手这些服务。
在VMware vSphere中,将多台ESX 物理服务器组成一个集群,在这个集群中某台服务器出现故障时,这台服务器上运行的虚拟机可用自动迁移到其他可用的ESX服务器上,从而保障业务的不间断运行。
集群就是把所有的ESX/ESXi组织起来,形成一个大的资源池,所有的虚拟机可在池中的任意主机上自由移动,并且Cluster可做到快速扩容和HA故障冗余;所以Cluster是服务器虚拟化通往数据中心的必备功能。
虚拟化解决方案目录一、VMware解决方案概述 (4)1.1 VMware服务器整合解决方案 (4)1.2 VMware商业连续性解决方案 (7)1.3 VMware测试和开发解决方案 (10)二、VMware虚拟化实施方案设计 (13)2.1 需求分析 (13)2.2 方案拓扑图 (14)2.3 方案构成部分详细说明 (14)2.3.1 软件需求 (14)2.3.2 硬件需求 (15)2.4 方案结构描述 (15)2.4.1 基础架构服务层 (15)2.4.2 应用程序服务层 (17)2.4.3 虚拟应用程序层 (24)2.4.4 VMware异地容灾技术 (25)2.5 方案带来的好处 (29)2.5.1 大大降低TCO (29)2.5.2 提高运营效率 (31)2.5.3 提高服务水平 (32)2.5.4 旧硬件和操作系统的投资保护 (32)2.6 与同类产品的比较 (32)2.6.1 效率 (32)2.6.2 控制 (32)2.6.3 选择 (33)三、VMware 虚拟化桌面应用实列 (34)3.1 拓扑图 (34)3.2 方案描述 (34)3.3 方案效果 (35)四、项目预算 (36)一、VMware解决方案概述1.1 VMware服务器整合解决方案随着企业的成长,IT部门必须快速地提升运算能力-以不同操作环境的新服务器形式而存在。
因此而产生的服务器数量激增则需要大量的资金和人力去运作,管理和升级。
IT部门需要:∙提升系统维护的效率∙快速部署新的系统来满足商业运行的需要∙找到减少相关资产,人力和运作成本的方法VMWARE服务器整合为这些挑战提供了解决方案。
虚拟构架提供前所未有的负载隔离,为所有系统运算和I/O设计的微型资源控制。
虚拟构架完美地结合现有的管理软件并在共享存储(SAN)上改进投资回报率。
通过把物理系统整合到有VMWARE虚拟构架的数据中心上去,企业体验到:∙更少的硬件和维护费用∙空闲系统资源的整合∙提升系统的运作效率∙性价比高,持续的产品环境整合IT基础服务器运行IT基础应用的服务器大多数是Intel构架的服务器这一类的应用通常表现为文件和打印服务器,活动目录,网页服务器,防火墙,NAT/DHCP服务器等。
1. VMware FT 容错简介Vmware fault tolerance(FT)功能创建一个虚拟机设置可以提供连续性能力。
FT建立在ESX/ESXi主机平台。
通过创建一个虚拟机一个完全相同的副本。
虚拟机的主要副本,处于活动状态,接受请求,服务信息,并运行程序。
次要副本,接收与主副本相同的输入。
次要副本完成的所有任务都依照主副本的变动。
主副本所有非决定性的活动都将被捕捉,发送到运行在其他host上的次要副本,次要副本在一秒内将活动进行重演。
FT启动后,VM Tools从每个虚机中发送心跳到VMM,此心跳与HA的心跳类似。
VMM检查以确保主要和次要副本都在运行。
如果主副本所在的host丢失,VMM将不再发送心跳。
此时,次要副本立刻变为活动的,并成为主要副本,服务不会经历任何中断。
FT提供了比HA更高的商业连续性级别。
FT发生时,次要立刻被激活,所有关于虚机状态的信息都会被完整的保留。
存储在内存中的数据不需要被re-entered或reloaded。
而HA则要将任何丢失的虚拟机进行重启。
这会结束所有虚拟机进程和状态信息,程序和未保存的用户输入信息都会丢失。
2. VMware FT 容错提供连续可用性VMware HA 通过在主机出现故障时重新启动虚拟机来为虚拟机提供基本级别的保护。
VMware 容错可提供更高级别的可用性,允许用户对任何虚拟机进行保护以防止主机发生数据、事务或连接丢失等故障。
容错使用ESX/ESXi 主机平台上的VMware vLockstep 技术以提供连续可用性。
通过确保主虚拟机和辅助虚拟机的状态在虚拟机的指令执行的任何时间点均相同来完成此过程。
vLockstep 通过使主虚拟机和辅助虚拟机执行相同顺序的x86 指令来完成此过程。
主虚拟机捕获所有输入和事件—从处理器到虚拟I/O 设备—并在辅助虚拟机上进行重放。
辅助虚拟机执行与主虚拟机同一系列的指令,而仅可看到单个虚拟机映像(主虚拟机)在执行工作负载。
VMware vSphere 5.1 高可用性在本节中主要讲的是集群的一些功能和配置,相比5.0的设置,没有太大的变化。
VMware vSphere为虚拟机提供虚拟化的基础架构,将现有的物理资源转化成虚拟资源,将物理资源分成若干资源,为每个虚拟机提供包括CPU、内存等虚拟资源。
要想很好地分配这些资源,就必须要使用资源池。
资源池是灵活管理资源的逻辑抽象。
资源池可以分组为层次结构,用于对可用的CPU 和内存资源按层次结构进行分区。
群集中的资源池比单个ESXi主机上的还要重要,因为在群集中创建资源之后,整个资源池管理的就是所有的ESXi主机资源了。
所管理的资源是所有ESXi主机上的CPU和内存的资源总和。
高可用性和双机热备是VMware vSphere 5.1最重要的一部分,高可用并不是vSphere独有的,企业使用高可用就是为了服务的连续性和数据的安全性,HA是以一群ESXi服务器为主的群集功能,主要是目的是当虚拟机运行的主机发生故障时能及时转移主机,避免长时间的停机。
而FT双机热备则是保证虚拟机最长时间不停机,将虚拟机以双机热备的方式同时在两台主机运行,大大增强了业务的可连续性。
本节中主要讲的是讲的一下内容:一、建立群集二、设置HA高可用性三、测试HA高可用性四、设置DRS五、建立FT双机热备无论是计划停机时间还是非计划停机时间,都会带来相当大的成本。
但是,用于确保更高级别可用性的传统解决方案都需要较大开销,并且难以实施和管理。
VMware 软件可为重要应用程序提供更高级别的可用性,并且操作更简单,成本更低。
使用vSphere,组织可以轻松提高为所有应用程序提供的基准级别,并且以更低成本和更简单的操作来实现更高级别的可用性。
使用vSphere,可以独立于硬件、操作系统和应用程序提供更高可用性,减少常见维护操作的计划停机时间,在出现故障时提供自动恢复。
vSphere 可以减少计划的停机时间,防止出现非计划停机,并迅速从断电中恢复。
1、 HA(高可用性)群集高可用性(HA)集群是群集的一种,平日较常见的为MSCS(微软群集服务),如SQL的故障转移群集。
高可用性群集,一般有两个或两个以上的节点,且分为活动节点及备用节点。
通常把正在执行业务的称为活动节点,而作为活动节点的一个备份的则称为备用节点。
当活动节点出现问题,导致正在运行的业务(任务)不能正常运行时,备用节点此时就会侦测到,并立即接续活动节点来执行业务。
从而实现业务的不中断或短暂中断(对客户端来说,基本上感觉不到故障的存在)。
高可用性群集的实现是基于资源切换来进行的。
这些资源包括节点的IP地址、主机名(NetBios名称)、磁盘卷、应用程序等。
而资源的监控和接续,是依靠HA软件来实现的如MSCS等,这些软件用来通过"心跳信号"监控群集中对方节点的运行状态,一旦发现对方存在了故障,就会强制将所有的资源据为已有并继续对外提供服务。
而VMwareHA也是高可用性的一种应用。
VMwareHA与传统的群集和高可用性解决方案都支持主机发生故障时的自动恢复。
它们是互为补充的,但是在软硬件要求、恢复时间及应用程序和操作系统的识别程度等方面有所不同。
2、 VMwareHA与VMware Infrastructure 3谈起VMwareHA,就不得不说说VMware Infrastructure 3,VMware Infrastructure3是一个功能丰富的套件,它提供创建响应性数据中心所需的经过生产验证的效率、可用性和动态管理:VMware ESX Server。
用于虚拟化服务器、存储和网络的平台。
VMware VMFS。
用于存储虚拟化的高性能群集文件系统。
VMware Virtual SMP。
为虚拟机提供多处理器支持。
VMware VirtualCenter。
为 IT 基础架构提供集中化管理、操作自动化和优化。
VMware High Availability (HA)。
vSphere HA部署测试文档修订与审阅表修订历史记录日期修订人版本修订说明审阅人姓名批准版本审阅签字日期目录1.概述 (3)1.1本次部署测试的目的 (3)1.2本次测试内容 (3)1.3硬件环境的准备 (3)1.4软件环境的准备 (3)1.5网络环境及拓扑 (3)2.创建数据中心、群集并向群集中添加主机 (4)3.为主机配置虚拟网络及iSCSI存储 (11)3.1添加虚拟交换机 (11)3.2添加iSCSI存储 (17)4.配置HA及DRS功能 (23)4.1建立测试虚拟机 (23)4.2为虚拟机安装操作系统 (26)4.3为虚拟机启用容错功能 (29)4.1测试容错功能是否实现 (34)5.测试总结 (36)1.概述本次测试目的是为提高vSphere平台上的业务连续性、减少计划的停机时间;以及防止非计划停机、提高故障中断的恢复速度;总体上实现提高可用性及降低停机导致的损失。
通过 vSphere HA 和 Fault Tolerance 解决方案提供业务连续性,内容包括如何建立vSphere High Availability (HA) 和 vSphere Fault Tolerance。
物理服务器及数量操作系统及配置用途Dell R720机架式服务器 *2 安装ESXi 6.0 用于建立HA的两台虚拟机宿主机Dell R420 机架式服务器 *1 安装ESXi 6.0 用于建立iSCSI存储器及vCneter服务器本次实验不再赘述ESXi、vCenter及iSCSI的安装部署。
具体环境参考下表:服务器功能操作系统及配置用途vSphere管理主机安装Server 2012 R2,配置vCenter 6.0 虚拟化环境的管理平台存储器安装Server 2012 R2,配置iSCSI功能模拟iSCSI存储器主机名IP地址TEST-vCenter 192.168.91.1TEST-Storage 192.168.91.9ESXi-01 192.168.91.2ESXi-02 192.168.91.32.创建数据中心、群集并向群集中添加主机使用vSphere Web Client登录vCenter Server,创建数据中心、群集,并向群集中添加虚拟化主机,主要步骤如下。
VMware 虚拟化平台高可用设计方案越来越多的企业考虑通过虚拟化来提高 IT 资源和应用程序的效率和减少运营成本。
而在传统的服务器维护中,如果一台服务器宕机,那么最多就是这台服务器上的应用无法正常提供服务,可以通过集群高可用等方法解决;但是在虚拟化环境中,如果一台虚拟主机端服务器宕机,那么运行在上面的虚拟机就都会无法正常运行。
虽然虚拟化将所有的资源都集中管理,但是出现故障时影响的面也广了,所以在虚拟化中集群高可用的功能就显得尤为重要。
保护物理服务器是不够的,还要保护包含重要商业数据和信息虚拟服务器。
虚拟服务器提供了灵活性,但是,与此同时,如果一台包含多个虚拟服务器的物理服务器出现故障,那将造成巨大的数据损失。
本文主要介绍如何优化现有的VMware虚拟化环境,利用架构改造将环境调整为高可用架构。
无论是网络资源层、计算资源层、还是存储资源层均实现双链路高可用。
在做任何架构的改动之前,一定要对现有环境有足够的认知和了解,掌握其变动对业务的影响。
•在调整架构之前,一定要先了解和熟悉现有架构缺点。
••在调整架构之前,解决现有环境的故障问题。
••了解现有架构与业务的匹配性。
••预评估现有架构改造的工作量和依赖条件。
•下面将详细介绍如何将现有VMware架构调整为高可用性双链路架构。
高可用方案背景VMwarevSphere是VMware公司推出的一套服务器虚拟化解决方案,vSphere本身是个软件套件,组件主要包括用于主机虚拟化的ESXi,用于虚拟化管理的vCenter,用于升级的Update Manager,以及自动化部署Auto deploy等。
在之前的架构中,集团已有的虚拟化架构已经存在2年了,整体运行良好,但是每次出现问题的时候,都会影响业务的运行,无论是网络设备故障还是SAN交换机、甚至计算节点。
整体方案采用千兆的网络交换机进行虚拟机的管理与迁移,群集之间未开启HA,SAN的划分层次不明确,名称没有规范。
如何应用VMware高可用性VMware在VI3版本中引入了高可用性特性,以防在物理主机发生故障时保护上层的虚拟机。
在一个VMware高可用性集群中,当物理主机发生故障,虚拟机会在该集群中的其它主机上自动重新启动。
这是一项非常重要的特性,一台物理主机的故障会影响其上层的大量虚拟机。
VMware高可用性很好地解决了虚拟化所带来的“将所有的鸡蛋放在一个篮子中”所引起的风险。
在本篇VMware高可用性指南中,您可以了解到VMware高可用性的工作原理,VMware高可用性的系统要求,如何激活“许可控制策略”以及其它的VMware高可用性部署技巧。
VMware高可用性工作原理VMware高可用性在集群系统中的每台主机上安装一个脚本程序,该脚本负责维持集群系统所和其它主机的“心跳”。
当心跳丢失时,该主机上的所有受影响的虚拟机会开始在其它主机上启动。
同样,vCenterServer也不会是单点故障,高可用性特性会在vCenterServer无法访问时继续工作。
高可用性集群中最初上电的5台主机会被指定为主服务器,而其余的主机会被默认为二级服务器。
主服务器的功能在于复制和维持集群状态,并促发故障切换操作。
当一台主服务器发生故障后,系统会随机从二级服务器中选取一台作为新的主服务器。
高可用性采用定期间隔的故障检测方式,其默认值为15秒;当某台主机发生故障并被检测到后,高可用性服务器会发出一个心跳指令给集群内的其它主机。
该心跳检测每秒进行一次;当主机在15秒内没有回复时,该主机被默认为已发生故障。
15秒的设置实际是比较紧的,各类网络丢失都可能会使你收到这类故障警告。
物理主机没有返回心跳的原因可能有网络故障导致的主机隔离,系统崩溃或硬件故障所导致完全的系统宕机。
一旦被检测出上述故障,集群内的其它主机就会接替该主机的工作,并将该主机从网络隔离。
主机故障发生后的响应机制根据默认设置,被隔离的主机上的虚拟机仍保持上电状态,不过对于这些虚拟机的隔离响应机制可以基于预虚拟机的方式进行重新配置。
VMware vCenter FT 容错详解1. VMware FT 容错简介Vmware fault tolerance(FT)功能创建一个虚拟机设置可以提供连续性能力。
FT建立在ESX/ESXi主机平台。
通过创建一个虚拟机一个完全相同的副本。
虚拟机的主要副本,处于活动状态,接受请求,服务信息,并运行程序。
次要副本,接收与主副本相同的输入。
次要副本完成的所有任务都依照主副本的变动。
主副本所有非决定性的活动都将被捕捉,发送到运行在其他host上的次要副本,次要副本在一秒内将活动进行重演。
FT启动后,VM Tools从每个虚机中发送心跳到VMM,此心跳与HA的心跳类似。
VMM检查以确保主要和次要副本都在运行。
如果主副本所在的host丢失,VMM将不再发送心跳。
此时,次要副本立刻变为活动的,并成为主要副本,服务不会经历任何中断。
FT提供了比HA更高的商业连续性级别。
FT发生时,次要立刻被激活,所有关于虚机状态的信息都会被完整的保留。
存储在内存中的数据不需要被re-entered或reloaded。
而HA则要将任何丢失的虚拟机进行重启。
这会结束所有虚拟机进程和状态信息,程序和未保存的用户输入信息都会丢失。
2. VMware FT 容错提供连续可用性VMware HA 通过在主机出现故障时重新启动虚拟机来为虚拟机提供基本级别的保护。
VMware 容错可提供更高级别的可用性,允许用户对任何虚拟机进行保护以防止主机发生数据、事务或连接丢失等故障。
容错使用 ESX/ESXi 主机平台上的 VMware vLockstep 技术以提供连续可用性。
通过确保主虚拟机和辅助虚拟机的状态在虚拟机的指令执行的任何时间点均相同来完成此过程。
vLockstep 通过使主虚拟机和辅助虚拟机执行相同顺序的 x86 指令来完成此过程。
主虚拟机捕获所有输入和事件—从处理器到虚拟 I/O 设备—并在辅助虚拟机上进行重放。
辅助虚拟机执行与主虚拟机同一系列的指令,而仅可看到单个虚拟机映像(主虚拟机)在执行工作负载。