当前位置：文档之家› SureHA 技术白皮书

SureHA 技术白皮书

SureHA100G2 技术白皮书

摘要

本白皮书论述Lenovo SureHA 100G2高可

用软件的功能以及实现原理。

Lenovo 确信本出版物在发布之日内容准确无

误。如有更新，恕不另行通知。

Lenovo 对本出版物的内容不提供任何形式的

陈述或担保，明确拒绝对有特定目的适销性或

适用性进行默示担保。使用、复制或分发本出

版物所描述的任何SureHA 100G2软件都要

有相应的软件许可证。

第 1 章 SureHA100G2集群系统概览

SureHA100G2 技术白皮书 .................................................................................................. 1 第 1 章何谓集群系统 ..................................................................................................... 4 集群系统的概要 ................................................................................................................................... 4 HA (High Availability)集群 ................................................................................................................ 4 共享磁盘型 ....................................................................................................................................................... 5 镜像磁盘型 ....................................................................................................................................................... 7 系统构成 .............................................................................................................................................. 7 故障保护原理 ..................................................................................................................................... 10 共享磁盘的互斥控制 ....................................................................................................................................... 11 网络分区症状 (Split-brain-syndrome) ......................................................................................................... 11 集群资源的交接 ................................................................................................................................. 11 数据的交接 ..................................................................................................................................................... 11 IP 地址的交接 .................................................................................................................................................. 12 应用程序的交接 .............................................................................................................................................. 12 失效切换总结 .................................................................................................................................................. 14 Single Point of Failure 的排除 ......................................................................................................... 14 共享磁盘 ......................................................................................................................................................... 15 共享磁盘的访问路径 ....................................................................................................................................... 16 LAN ................................................................................................................................................................ 16 支持可用性的操作 ............................................................................................................................. 17 操作前测试 ..................................................................................................................................................... 17 故障的监视 ..................................................................................................................................................... 17 第 2 章关于SureHA100G2......................................................................................... 19 SureHA100G2的产品结构 ................................................................................................................ 19 SureHA100G2的软件配置 ................................................................................................................ 19 SureHA100G2 的故障监视原理 ....................................................................................................... 20 何谓服务器监视 .............................................................................................................................................. 20 何谓业务监视 .................................................................................................................................................. 20 何谓内部监视 .................................................................................................................................................. 21 可监视的故障和无法监视的故障 ........................................................................................................ 21 通过服务器监视可以查出的故障和无法查出的故障 ........................................................................................ 21 通过业务监视可以查出的故障和无法查出的故障 ............................................................................................ 21 网络分区解析 ..................................................................................................................................... 22 失效切换的原理 ................................................................................................................................. 22 由SureHA100G2构建的共享磁盘型集群的硬件配置 ...................................................................................... 23 用SureHA100G2构建的镜像磁盘型集群的硬件配置 .. (24)

SureHA100G2 技术白皮书

用SureHA100G2构建的共享磁盘型集群的硬件配置 ..................................................................................... 26 何谓集群对象 ................................................................................................................................................. 28 何谓资源 ............................................................................................................................................ 28 心跳资源 ........................................................................................................................................................ 28 网络分区解析资源 .......................................................................................................................................... 29 组资源 ............................................................................................................................................................ 29 监视资源 ........................................................................................................................................................ 30 第 3 章 SureHA100G2的运行环境 ............................................................................. 33 硬件运行环境 .................................................................................................................................... 33 所需规格 ........................................................................................................................................................ 33 SureHA100G2 Server 的运行环境 .................................................................................................... 33 具体规格参见《兼容性支持列表》 .. (33)

第 1 章 SureHA100G2集群系统概览

集群系统的概要

现在的计算机社会中，持续的提供不停止的服务已经成为通往成功的关键。例如仅由于1台机器故障或超负荷而宕机就导致对客户的服务全面停止。这样的话，不但会带来莫大的损失，还会失去客户的信任。随着集群系统的导入，发生意外事故时会将系统停止时间(宕机时间)降低到最小限度、使负载均衡，提高其可用性。

所谓集群，有“集团”、“团”的意思，顾名思义是“将多个计算机汇集成一群(或者多群)，谋求提升可靠性及处理性能的系统”。集群系统有多个种类，可分为下列3种。其中，SureHA100G2属于High Availability 集群。

◆ HA (High Availability) 集群

是平时作为运行服务器作业，在运行服务器发生故障时将业务交接到待机服务器的集群。是

以高可用性为目的的集群。包括共享磁盘型、镜像磁盘型。

◆ 负载均衡集群

是将客户端的请求遵从恰当的负荷均衡原则分配给各节点的集群。是以高扩展性为目的的集

群、一般无法进行数据交接。包括load balance 集群、并列数据库集群。

◆ HPC (High Performance Computing)集群

是指计算量非常大的集群。是为使用超级计算机执行单一业务的集群。使用所有节点的CPU

来执行单一业务的网格计算技术近年来已成为热点。

HA (High Availability)集群

一般提升系统可用性时，会认为对构成系统的组件进行冗余化，消除Single Point of Failure 是重要的。所谓Single Point of Failure 指的是计算机的构成要素(硬件的组件)因为只有一个，所以该处发生故障时会有使业务停止的弱点。所谓HA 集群是使用多台节点进行冗余化操作、将系统停止时间控制在最小限度，提升业务可用性(availability)的集群系统。某些骨干业务系统等的宕机会给业务带来很大影响，因此此类系统不允许停止，需要导入HA 集群。

HA 集群可分为共享磁盘型和镜像磁盘型。

SureHA100G2 技术白皮书

5 图

共享磁盘型

集群系统中服务器间必须要交接数据。将这些数据从多个服务器放到像以SAN 连接的FibreChannel 磁盘阵列装置这样可以访问的外置磁盘（共享磁盘）上，通过该磁盘在服务器间交接数据即称为共享磁盘型集群系统。

运行业务应用程序的服务器(运行服务器)发生故障时，集群系统查出故障并在交接业务的服务器(待机服务器)中自动启动业务应用程序，交接业务。这称为失效切换。集群系统交接的业务由磁盘、IP 地址、应用程序等资源构成。

在没有集群化的系统中使用其它服务器重启应用程序时，客户端必须再次连接不同的IP 地址。但是多数的集群系统里不是以业务为单位给服务器分配IP ，而是分配其他网络的IP 地址(虚拟IP 地址)。因此客户端没必要去区分正在执行业务的是运行服务器还是待机服务器，如同连接同一个服务器一样，可以持续地运行业务。

由于运行服务器宕机发生失效切换时，共享磁盘上的数据没有进行妥当的结束处理就交接给待机服务器。因此待机服务器中有必要对交接的数据进行逻辑检查。这与一般未集群化的系统宕机后重启时进行的处理是一样的。例如，如果是数据库就需要回滚及前滚的处理。由此客户端仅运行未确认的SQL 就可以继续业务。

故障发生后，被查出故障的服务器经过物理隔离修复后，只要连接集群系统就可以作为待机服务器恢复运行。重视业务连续性的实际操作中，也可以不进行组的故障恢复。如果必须要在原来的服务器上运行业务时，请移动组。

- 因需要共享磁盘所以价格高

- 适于处理大规模数据的系统镜像链-因无需共享磁盘所以价格便宜 -由于建立镜像的缘故，适于数据量不大的系统

第 1 章 SureHA100G2集群系统概览

图 1-2

由于失效切换处的服务器配置不够、双向待机引起超负荷等原因而希望在原来的服务器上运行业务时，原来节点的恢复作业完成后将暂时停止业务，在原来的节点上重启业务。将失效切换的组

返回到原来的服务器称为故障恢复。

如图

1-3

所示，只有1个业务，待机服务器为不运行业务的待机形态称为单向待机。有

2个以上业务，各自的节点既为运行服务器又为待机服务器的形态称为双向待机。

图 1-3 HA

当前

服务器待机服务器业务A 的当前服务器

业务B 的待机服务器

业务B 的当前服务器业务A 的待机服务器

SureHA100G2 技术白皮书

镜像磁盘型

上述共享磁盘型适用于大规模系统，但共享磁盘大体价格较高因此构筑系统的成本也会增大。所以，不使用共享磁盘，而通过将各服务器磁盘在服务器间建立镜像，可以以更低的价格实现相同功能，这类集群系统称为镜像磁盘型集群系统。但是，由于需要在服务器间为数据建立镜像，因此不适用于需要大量数据的大规模系统。

应用程序发出Write 请求时，数据镜像引擎会将数据写入本地磁盘的同时，通过心跳线将Write 请求分发给待机服务器。所谓心跳线是连接在服务器之间的电缆，在集群系统中用于服务器的死活监视。数据镜像型中除死活监视外还用于数据的传送。待机服务器的数据镜像引擎通过将接收的数据写入待机服务器的本地磁盘中，使运行服务器和待机服务器间的数据实现同步。

对于应用程序发出的Read 请求，仅从运行服务器的磁盘中读取。

图 1-4 数据镜像的结构

系统构成

共享磁盘型集群将磁盘阵列装置在集群服务器间实现共享。服务器发生故障时待机服务器使用共享磁盘上的数据实现数据的交接。

镜像磁盘型集群是经过网络将集群服务器上的数据磁盘镜像化的构成。服务器故障时使用待机服务器上的镜像数据交接业务。数据的镜像化以I/O 为单位进行，因此从上层应用程序看是与共享磁盘相同的。

下图是共享磁盘型集群的构成图例。应用软件

文件系统

NIC

硬盘

NIC 数据镜像引擎数据镜像引擎

Write

Read

第 1 章 SureHA100G2集群系统概览

图

1-5 系统构成

根据运行形态可以将失效切换型集群分为下列几类。

◆ 单向待机集群

将其中一个服务器作为运行服务器作业、另一方的服务器作为待机服务器不进行作业的运行形态。可以以最简单的运行形态构建失效切换后没有性能下降的高可用性系统。

图 1-6 单向待机集群

◆ 同一应用程序双向待机集群

在多个服务器上运行相同的业务应用程序并互相待机的运行形态。各业务应用程序独立运行。失效切换时在一台服务器上将运行多个同一业务应用程序，所以必须是可以实现这种运行的应用程序。可以将某个业务数据分割成多个时，按照想要访问的数据变更客户端连接的服务器，可以构筑以数据分割为单位的负载均衡系统。

OS OS

业务

A P 失效切换

SureHA100G2 技术白皮书

图 1-7 同一应用程序双向待机集群

◆ 不同应用程序双向待机集群

是使多种业务应用程序在不同的服务器上运行并互相待机的运行形态。失效切换时在一台服务器上将运行多个业务应用程序，因此必须使这些应用程序可以共存。可以构筑以业务为单位的负荷均衡系统。

图 1-8 不同应用程序双向待机集群

◆ N + N 结构

应用以上的结构，可以扩展到使用更多的节点。下图是在3台服务器上运行3种不同业务，一旦发生问题时向1台待机服务器交接该业务的结构。在单向待机中正常时待机服务器不进行任何业务，因此闲置的资源比率为1/2。如果采用此结构，闲置的资源比率为1/4，可以降低成本。另外，另外如果有1台服务器发生异常，也不会降低性能。

第 1 章 SureHA100G2集群系统概览

图 1-9 N + N 结构

故障保护原理

集群软件一查出给持续业务带来问题的故障就会执行业务交接(失效切换)。在进入失效切换处理的具体内容之前，先简单地介绍一下集群软件是怎样查出故障的。

SureHA100G2为监视服务器，定期地与伙伴服务器进行生存确认。将此生存确认称为心跳。

◆心跳和服务器故障的查出

集群系统中应该查出的最基本的故障是构成集群的服务器的宕机。服务器的故障中包含电源异常以及内存错误等硬件故障或者OS 的崩溃等。为了查出此类故障，使用心跳来监视服务器的死活。

心跳可以仅通过确认ping 的应答这种死活监视方式，根据集群软件不同，也可以传送本地服务器的状态信息等内容。集群软件收发心跳，在心跳无应答时视作该服务器故障并开始失效切换处理。但考虑到由于服务器的高负荷等原因会导致心跳的收发延迟，所以到判定为服务器故障需要一定程度的缓冲时间。因此实际发生故障的时间和集群软件查出故障的时间会存在时间差。

◆资源故障的查出

业务停止的主要原因不仅仅是由于构成集群的服务器的宕机。例如，由于业务应用程序使用的磁盘装置以及NIC 的故障、或者业务应用程序本身的故障等也会导致业务停止。为了提升可用性，也必须查出这样的资源故障，实施失效切换。

作为查出资源异常的手段，所要监视的资源为物理设备时可以采用实际尝试访问的方法。应用程序的监视中，除了应用程序进程本身的死活监视以外，在对业务没有影响的范围内，也可以考虑尝试服务端口。

待机服务器

运行服务器运行服务器运行服务器发生故障！业务B 业务C

业务B

业务C 待机服务器运行服务器运行服务器

运行服务器

SureHA100G2 技术白皮书

11 共享磁盘的互斥控制

共享磁盘型的失效切换集群中，多个服务器上共享磁盘装置。一般而言，文件系统通过保持服务器内数据的缓存，可以激发超出磁盘装置物理I/O 性能界限的文件I/O 性能。

如果从多个服务器上mount 同时访问某个文件系统的话会怎么样呢？

通常的文件系统不考虑在自身以外的服务器上更新磁盘上的数据。因此缓存和磁盘上的数据会产生矛盾，最终将导致数据遭到损坏。失效切换集群系统中，为了防止后面提到的网络分区症状所引起的多个服务器同时mount 文件系统，会对磁盘装置采取互斥控制。

网络分区症状 (Split-brain-syndrome)

切断所有连接在服务器间的心跳线时，仅根据心跳所进行的死活监视将不能与服务器宕机进行区分。这种状态下会被当作是服务器宕机、实行失效切换处理，在多个服务器上同时mount 文件系统，将损坏共享磁盘上的数据。

图 1-10 网络分区症状

将这样的问题称为“网络分区症状”或者Split-brain-syndrome 。为了解决这个问题，在失效切换集群中所有的心跳线都被切断时，可以考虑运用能确切实现共享磁盘装置互斥控制的各种对策。

集群资源的交接

集群管理的资源中有磁盘、IP 地址、应用程序等内容。下面说明用于交接这些集群资源的失效切换集群系统的功能。

数据的交接

在共享磁盘型集群中，共享磁盘装置上的分区保存服务器之间的交接数据。也就是说，所谓的交接数据，就是在正常的服务器上对应用程序使用的文件所在分区的文件系统重新mount

。由于

第 1 章 SureHA100G2集群系统概览

共享磁盘装置与交接目标服务器是物理连接，因此，集群软件应该做就只有文件系统的mount 。

一个是文件系统以及数据库的恢复时间问题。要交接的文件在故障发生的前一刻被其他的服务器所使用，或者也许正在被更新。因此，有些文件系统，有时需要交接时进行一致性的检查，如果是数据库就需要进行回滚等处理。这种情况与电源故障造成宕机重启单个服务器时是一样的。此类恢复处理需要较长时间时，若就此追加在失效切换时间(业务的交接时间)上，将成为系统可用性低下的主要原因。

还有一个就是写入保证的问题。应用程序向共享磁盘里写入数据时，通常是通过文件系统写入。应用程序即使写入完成，文件系统仍会保留在磁盘缓存上，所以未写入共享磁盘，运行服务器就宕机的情况下，磁盘缓存上的数据将不能交接到待机服务器。因此，发生故障时，需要切实交接到待机服务器的重要数据，必须要通过同步写入等方法，切实地写入到磁盘中。这与单个服务器宕机时数据不因断电而丢失一样。也就是说，在设计集群系统时要考虑到：交接给待机服务器的只有共享磁盘中记录的数据，象磁盘缓存这样的内存上的数据不予交接。

IP 地址的交接

集群软件进行的下一个任务是IP 地址的交接。失效切换时、通过IP 地址的交接，所以不用在意业务在哪个服务器上运行。集群软件交接IP 地址的目的就在于此。

应用程序的交接

集群软件业务交接的最后任务是交接应用程序。与容错计算机(FTC)不同，在一般的失效切换集群中不交接包含应用程序运行中内存内容的进程状态等。也就是说，通过将故障服务器上运行的应用程序，在正常的服务器中重新执行，来完成应用程序的交接。

例如对DB 实例进行失效切换时，并非以发生故障前一刻的状态重启，而是和先宕机再启动一样，进行事务的回滚，并且需要从客户端再次连接。该数据库恢复所需要的时间可以通过DBMS 的Check Point Interval 的设置在某种程度上进行控制，但是一般都需要几分钟。

多数应用程序仅通过再次执行就可以再续业务，但是也有的应用程序需要在故障发生后进行业务恢复操作。为此，集群软件通过启动脚本替代应用程序以便能够描述业务恢复步骤。脚本中以描述脚本执行的主要原因以及执行服务器等信息为主，根据需要，也描述清除正在更新的文件等恢复查出故障

mount

SureHA100G2 技术白皮书

步骤。

第 1 章 SureHA100G2集群系统概览

失效切换总结

从上述内容可以理解以下集群软件的运行。

◆

查出故障(心跳／资源监视) ◆

解析网络分区症状(解析NP) ◆ 切换集群资源

? 数据的交接

? IP 地址的交接

? 应用程序的交接

图 1-12 失效切换时间一览表

集群软件为了实现失效切换，就是这样将所有处理一一在短时间内予以实施，来实现高可

用性（High Availability ）的。

Single Point of Failure 的排除

在构筑高可用性系统时把握所要求的或者说目标的可用性水平是很重要的。也就是说对于可能阻碍系统运行的各种故障，应采用冗余结构，以使运行得以持续并在短时间内能够恢复，讨论或设计系统时就需要从上述策略的性价比方面进行考虑。

所谓Single Point of Failure(SPOF)，前面讲过是指和系统停止相关联的部位。集群系统可以实现服务器的多重化，排除系统的SPOF 。但是共享磁盘等服务器间共享部分会成为SPOF 。设计多重化或者排除该共享部分的系统成为构筑高可用性系统的要点。

集群系统要提升可用性，但是失效切换中也需要几分钟的系统切换时间。因此也可以说失效切换时间是可用性低下的一个主要原因。为此在高可用性系统中，提高单个服务器可用性的ECC 存储以及冗余电源等的技术是重要的。但是在此并不涉及单个服务器的可用性提升技术，而是深入研究一下集群系统中容易造成SPOF 的下述3项内容，看看能有怎样的对策。

发

生

故

障查出故障完成交接 N P

解

析

交接数据 I P 交接时间

系统运行时间宕机时间查出故障

（心跳/资

源监视）交接应用程序

SureHA100G2 技术白皮书

◆

共享磁盘 ◆

通往共享磁盘的访问路径 ◆ LAN

共享磁盘

通常共享磁盘按照磁盘阵列组合RAID ，所以磁盘的成对驱动器不会成为SPOF 。但是由于内置RAID 控制器，所以控制器会有问题。多个集群系统中采用的共享磁盘里可以实现控制器的二重化。

为了发挥二重化RAID 控制器的长处，通常有必要实现共享磁盘访问路径的二重化。但是如果是由二重化的多个控制程序能够同时访问同一逻辑磁盘单元(LUN)的共享磁盘，每个控制器上连接1台服务器则在控制器发生异常时在节点间实施失效切换，就可以实现高可用性。

图 1-13 共享磁盘的RAID 控制器和访问路径变成SPOF 的例子(左)以及RAID 控制器和

访问路径分开的例子

一方面，在不使用共享磁盘的数据镜像型失效切换集群中，由于将所有的数据都在其他服务器的磁盘中建立镜像，所以可以实现不存在SPOF 的系统构成。但是需要考虑下列几点。

◆

通过网络实现数据镜像化导致磁盘I/O 性能(特别是write 性能)低下 ◆

服务器故障恢复时、镜像在再次同步中的系统性能(镜像复制通过后台实施)低下 ◆ 镜像的再次同步时间(镜像再次同步完成为止无法失效切换)

也就是说数据的链接多而数据容量不大的系统中，采用数据镜像型失效切换集群对于提升可用性是有效的。

失效切换

第 1 章SureHA100G2集群系统概览

共享磁盘的访问路径

共享磁盘型集群的一般结构中，共享磁盘的访问路径在构成集群的各服务器中是共享的。以

SCSI为例，1条SCSI路径上可以连接2台服务器和共享磁盘。因此，对共享磁盘的访问路径异常是整个系统瘫痪的重要原因。

解决办法：是准备多条访问共享磁盘的路径的冗余结构，使应用程序对共享磁盘的访问路径看起来像1条。实现该结构的设备驱动程序被称为路径失效切换驱动程序等。

图

LAN

不仅限于集群系统，在网络上执行某些服务的系统中，LAN的故障也是阻碍系统运行的重要因素。集群系统中，进行适当的设置，可在NIC故障时进行节点间失效切换，提高可用性。但是集群系统外的网络机器发生故障时，仍然会阻碍系统工作。

图

LAN的可用性时，可以同样利用单个服务器下的技术。比如，可以考虑通过不接通预备的网络机器的电源，在发生故障的情况下手动进行切换的原始方法，以及冗余配置高性能的网络机器，多重化网络路径

SPOF

SureHA100G2 技术白皮书

来自动切换路径的方法。另外，可以考虑利用如英特尔公司的ANS 之类，支持NIC 的冗余配置的驱动程序。

LoadBalance 装置 (Load Balance Appliance) 和防火墙服务器(Firewall Appliance)也是容易导致SPOF 的网络机器。这些通常使用标准或可选软件，来构建失效切换结构。同时，这些机器一般在系统整体中处于非常重要的位置，所以必须要考虑搭建冗余结构。

支持可用性的操作

操作前测试

我们常说产生系统故障的主要原因大多为设置的错误以及操作的维护。从这一点考虑，实现高可用性系统时，操作前的测试和恢复故障手册的完备对于系统的稳定运行是很重要的。作为测试观点，结合实际操作，执行下列工作成为提升可用性的要点。

◆

找出故障发生位置，商讨对策，进行模拟故障测试，并实际验证。 ◆

进行假设的集群“一系列状态变化”的测试，对降级运行时的性能进行验证。 ◆ 以这些测试为基础，完善系统操作/恢复故障手册。

设计简单的集群系统，可以简化上述的验证和手册，是提升系统可用性的要点。

故障的监视

虽然我们已经做了上述的努力，可能还是会发生故障。系统长期持续运行后，必然会发生故障，其原因可能是硬件老化、软件的内存泄漏、或者操作时超过系统当初设计的承受能力等。因此，在提高硬件、软件可用性的同时，需要进一步监视故障，在发生故障时采取恰当的处理，这一点非常重要。例如，万一服务器发生故障，可以通过搭建集群系统，只需要几分钟的切换时间就可以使系统继续运行，但是如果置之不管，系统失去冗余性，发生下一个故障时集群系统就没有任何意义了。

因此，发生故障时，系统管理员必须要采取措施防范下一故障的发生，排除新发生的SPOF 。在支持系统管理业务上，远程维护、故障通知等功能非常重要。

以上介绍了使用集群系统实现高可用性时所需的周边技术以及其他的一些要点。简单总结一下，就是要注意以下几点：

◆

排除或掌握Single Point of Failure ◆

进行不容易出故障的简洁设计，基于操作前的测试，完善系统操作/恢复故障手册 ◆ 及早查出发生的故障并进行恰当的处理

第 2 章关于SureHA100G2

SureHA100G2的产品结构

SureHA100G2可以大致分为3个模块。

◆ SureHA100G2 Server

是SureHA100G2的主体。安装在构成集群系统的各服务器上。在Server 中包含了所有SureHA100G2的高可用性功能。另外，也包含WebManager 以及Builder 的服务器端的功能。

◆ SureHA100G2 X WebManager (WebManager)

是进行SureHA100G2操作管理的管理工具。以Web 浏览器作为用户界面。实体嵌入在SureHA100G2 Server 中，但操作是在管理终端的Web 浏览器上进行。

◆ SureHA100G2 X Builder (Builder)

是创建SureHA100G2配置信息的工具。与WebManager 相同，使用Web 浏览器作为用户界面。分为在使用Builder 的终端上与SureHA100G2 Server 分开安装使用的脱机版，以及从WebManager 界面的工具栏左侧的下拉菜单选择设定模式或点击 [表示] 菜单的 [设定模式] 来进行转换的在线版。通常不需要安装，只有脱机使用时才需要另外进行安装。

SureHA100G2的软件配置

SureHA100G2的软件构成如下图所示。在构成集群的服务器上安装“SureHA100G2

Server(SureHA100G2主体)”。WebManager 以及Builder 的本体功能包含在

SureHA100G2 Server 内，因此无需另外安装。

图 2-1 SureHA100G2的软件构成

注： JRE 是指Java Runtime Environment 。

服务器2 服务器1 管理P C o w s 100w s 00G

SureHA100G2 的故障监视原理

在SureHA100G2 中通过执行服务器监视、业务监视、内部监视3个监视任务，可以迅速确切地查出故障。以下介绍这些监视的详细内容。

何谓服务器监视

所谓服务器监视是失效切换型集群系统最基本的监视功能，是监视构成集群的服务器是否停止运行的功能。

服务器监视（心跳）使用下列通信路径。

◆ 主网

是集群服务器间通信专用的LAN 。进行心跳

的同时在服务器间交换信息。

◆ 从网

用于与客户端通信用路径。也用于服务器间的信息交换以及心跳线的备份。

图2-2 服务器监视

何谓业务监视

所谓业务监视是对业务应用程序本身，以及使业务陷入无法执行状态的故障主要原因进行监视的功能。

◆ 按照监视可选软件对应用程序/协议的停止/结果异常进行监视

虽然需要另外购买License ，但是可以监视数据库应用程序(Oracle,DB2等)、协议(FTP ,HTTP 等) 、应用程序服务器(WebSphere ，WebLogic 等)的停止/结果异常。

◆ 应用程序的生存状态监视

能够使用启动资源(称为应用程序资源、服务资源)启动应用程序，通过监视用资源 (称为应用程序监视资源、服务监视资源) 定期监视进程的生存。在由于业务应用程序异常退出造成业务中断时有效。

注1：如果SureHA100G2直接启动的应用程序为启动、结束监视对象的常驻进程的应用程序，则无法查出常驻进程的异常。

注2：无法查出应用程序内部状态的异常 (应用程序的停止、结果异常) 。

数据中心交换机buffer需求分析白皮书

数据中心交换机 buffer 需求分析白皮书

目录 1引言 (3) 1.1DC 的网络性能要求 (3) 1.2国内OTT 厂商对设备Buffer 的困惑 (4) 1.3白皮书的目标 (4) 2Buffer 需求的经典理论 (5) 2.11BDP 理论 (5) 2.2Nick Mckeown 理论 (6) 2.3经典理论的适用性 (6) 3基于尾丢弃的buffer 需求 (9) 3.1丢包的影响 (9) 3.1.2丢包对带宽利用率的影响 (9) 3.1.3丢包对FCT 的影响 (12) 3.2大buffer 的作用 (13) 3.2.1吸收突发，减少丢包，保护吞吐 (13) 3.2.2带宽分配均匀 (14) 3.2.3优化FCT (15) 3.3DC 内哪需要大buffer (15) 3.4需要多大buffer (17) 3.5带宽升级后，buffer 需求的变化 (19) 3.6 小结 (19) 4基于ECN 的buffer 需求 (21) 4.1ECN 的作用 (21) 4.2ECN 水线设置 (23) 4.3基于ECN 的buffer 需要多大 (24) 5基于大小流区分调度的buffer 需求 (27) 5.1大小流差异化调度 (27) 5.2大小流差异化调度如何实现大buffer 相当甚至更优的性能 (27) 5.3基于大小流差异化调度的buffer 需要多大 (28) 6 总结 (28) 7 缩略语 (29)

1 引言 1.1DC 的网络性能要求近几年，大数据、云计算、社交网络、物联网等应用和服务高速发展，DC 已经成为承载这些服务的重要基础设施。随着信息化水平的提高，移动互联网产业快速发展，尤其是视频、网络直播、游戏等行业的爆发式增长，用户对访问体验提出了更高的要求；云计算技术的广泛应用带动数据存储规模、计算能力以及网络流量的大幅增加；此外，物联网、智慧城市以及人工智能的发展也都对DC 提出了更多的诉求。为了满足不断增长的网络需求，DC 内的网络性能要求主要体现在： ?低时延。随着深度学习、分布式计算等技术的兴起和发展，人工智能、高性能计算等时延敏感型业务增长迅速。计算机硬件的快速发展，使得这些应用的瓶颈已经逐渐由计算能力转移到网络，低时延已经成为影响集群计算性能的关键指标。因此，时延敏感型应用对DC 网络时延提出了更高的要求。目前DC 内，端到端5-10 微秒时延已经成为主流的目标要求。 ?高带宽高吞吐。数据时代的到来，产生了海量的数据，如图1-1。基于数据的应用（如图像识别）的推广，使得网络数据呈爆发式增长，小带宽已经无法满足应用对传输速率的需求。部分应用场景下，带宽成为制约用户体验的瓶颈。高带宽高吞吐对于提升大数据量传输的应用性能有着至关重要的影响。为了应对大数据量传输的应用需求，目前，百度、腾讯、阿里巴巴等互联网企业的DC 都已经全面部署100GE 网络，阿里巴巴更是规划2020 年部署400GE 网络。图1-1 数据中心内存储的实际数据数据来源：中国IDC 圈

计算虚拟化的发展历程

计算虚拟化的发展历程 1 早期的虚拟化技术雏形上世界60年代开始，美国的计算机学术界就开始了虚拟技术的萌芽。1959年6月在国际信息处理大会上，克里斯托弗的一篇《计算机分时应用》的论文，被认为是虚拟化技术的最早论述。 1960年美国的Atlas计算机项目，以及1965年IBM公司按照以上论述进行的一些列计算机项目试验，其中的M44/44X计算机项目，定义了虚拟内存管理机制，用户程序可以运行在虚拟的内存中，对于用户来说，这些虚拟内存就好像一个个“虚拟机”。 IBM提出的虚拟机技术，使一批新产品涌现了出来，比如：IBM360/40，IBM360/67，以及VM/370，这些机器在当时都具有虚拟机功能，通过一种叫VMM（虚拟机监控器）的技术在物理硬件之上生成了很多可以运行独立操作系统软件的虚拟机实例。 2 虚拟化技术的推广很早以前，商业Unix厂商就在他们的企业级产品中加入了虚拟化的功能，这就是当时为什么大型主机卖得如此之火的原因了。但由于虚拟化的门槛很高，而且应用也很有限。虚拟化技术始终没有得到有力的推广。随着x86平台上虚拟化技术的实现，首次向人们展示了虚拟化应用的广阔前景，因为x86平台可以提供便宜的、高性能和高可靠的服务器。更重要的是，一些用户已经开始配置虚拟化的生产环境，他们需要得到新的管理工具，从而随着虚拟化技术的发展而得到更大的收益。 3 计算虚拟化成为流行趋势用户对虚拟化感兴趣的底线是希望把成本降低，这是中型企业采用虚拟化架构的驱动力。许多小型企业开始进入数年前部署的Windows 2000/2003的更新期，有两种选择：买一或两台高性能的服务器或者购买6、7台普通的服务器。前者采用虚拟化技术就能达到后者所能提供的性能和存储容量，但占用的空间更小，成本也不高。对于大型企业，虚拟化技术更吸引人。他们的数据中心往往由数十台甚至上百台机架式服务器组成，功耗很大。然而，大量服务器的CPU被闲置着。在大量调研后得出的结论：只有15%左右的资源在被充分利用。 CPU在高速发展，但操作系统却相对滞后，应用就更不用说了。这使得用户花大量的钱买新的服务器，运行的却是老的应用。那些已经运行数年的应用可能并不需要更大容量的内存和最新的CPU，但为了保证系统的可靠和对新硬件的支持，用户别无选择。

网络功能虚拟化白皮书-中文版 v1.2

网络功能虚拟化 ----概念、益处、推动者、挑战及行动呼吁目标本文是由网络运营商撰写的无版权白皮书。本文的主要目标是概要的描述网络功能虚拟化（不同于云和软件定义网络SDN）的益处，推动者及面临的挑战，以及为什么要鼓励国际间的合作，来加速推动基于高市场占有率的行业标准服务器通信解决方案的开发和部署。推动组织和作者 AT&T: Margaret Chiosi. BT: Don Clarke, Peter Willis, Andy Reid. CenturyLink: James Feger, Michael Bugenhagen, Waqar Khan, Michael Fargano. China Mobile: Dr. Chunfeng Cui, Dr. Hui Deng. Colt: Javier Benitez. Deutsche Telekom: Uwe Michel, Herbert Damker. KDDI: Kenichi Ogaki, Tetsuro Matsuzaki. NTT: Masaki Fukui, Katsuhiro Shimano. Orange: Dominique Delisle, Quentin Loudier, Christos Kolias. Telecom Italia: Ivano Guardini, Elena Demaria, Roberto Minerva, Antonio Manzalini. Telefonica: Diego López, Francisco Javier Ramón Salguero. Telstra: Frank Ruhl. Verizon: Prodip Sen. 发布日期 2012年10月22至24日，发布于软件定义网络（SDN）和OpenFlow世界大会, Darmstadt-德国。

社会医疗保险数据中心管理平台技术白皮书(20090730)

社会医疗保险数据中心管理平台技术白皮书创智和宇

目录 1简介 (4) 1.1应用背景 (4) 1.2范围 (4) 1.3参考资料 (4) 2系统概述 (5) 2.1医疗保险数据中心管理平台概述 (5) 2.2总体结构图 (5) 2.2.1医疗保险数据中心管理平台的的总体结构 (6) 2.2.2医疗保险数据中心管理平台的逻辑结构 (6) 2.2.3医疗保险数据中心管理平台的的网络拓扑结构 (7) 2.3.1数据库内部组成 (7) 2.3.2生产库定义（地市级） (7) 2.3.3交换库定义（地市级） (7) 2.3.4决策分析库（地市级） (8) 2.3.5决策分析库（省级） (8) 2.4 医疗保险数据中心管理平台与其他系统关系 (8) 2.4.1与本公司开发的社保产品关系及实现接口 (8) 2.4.2与其它公司开发的社保产品关系及实现接口 (8) 2.4.3与全国联网软件关系 (9) 3业务逻辑的总体设计 (9) 3.1数据抽取建立交换数据库 (9) 3.2数据分析与决策 (9) 3.3数据交换服务 (10) 4系统采用的关键技术 (11) 4.1数据抽取 (11) 4.2增量更新 (11) 4.2.1增量更新实现步骤 (11) 4.2.3 历史数据变化情况记录 (12) 4.3数据展现 (12) 4.4数据传输 (12) 4.4.1数据传输涉及的三大元素及关系 (12) 4.4.2数据传输策略总体设计思路. (12) 4.4.3数据传输策略总体设计方案图 (12) 4.4.4数据传输策略实现概要. (14) 4.4.5打包数据的来源 (14) 4.4.6传输策略的维护 (14) 5系统开发平台和运行平台 (14) 5.1开发平台 (14) 5.2运行平台 (14) 6医疗保险数据中心管理平台功能介绍 (15) 6.1参保情况管理 (16)

工业大数据白皮书2017版

一张图读懂工业大数据 1. 工业大数据工业大数据是指在工业领域中，围绕典型智能制造模式，从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据及相关技术和应用的总称。工业大数据的主要来源有三类：第一类是生产经营相关业务数据。主要来自传统企业信息化范围，被收集存储在企业信息系统内部。此类数据是工业领域传统的数据资产，正在逐步扩大范围。第二类是设备物联数据。主要指工业生产设备和目标产品在物联网运行模式下，实时产生收集的涵盖操作和运行情况、工况状态、环境参数等体现设备和产品运行状态的数据。此类数据是工业大数据新的、增长最快的来源。第三类是外部数据。指与工业企业生产活动和产品相关的企业外部互联网来源数据。 2. 工业大数据的地位 2.1 在智能制造标准体系中的定位工业大数据位于智能制造标准体系结构图的关键技术标准的左侧，属于智能制造标准体系五大关键技术之一。

2.2与大数据技术的关系工业领域的数据累积到一定量级，超出了传统技术的处理能力，就需要借助大数据技术、方法来提升处理能力和效率，大数据技术为工业大数据提供了技术和管理的支撑。首先，工业大数据可以借鉴大数据的分析流程及技术，实现工业数据采集、处理、存储、分析、可视化。其次，工业制造过程中需要高质量的工业大数据，可以借鉴大数据的治理机制对工业数据资产进行有效治理。 2.3与工业软件和工业云的关系工业软件承载着工业大数据采集和处理的任务，是工业数据的重要产生来源，工业软件支撑实现工业大数据的系统集成和信息贯通。工业大数据技术与工业软件结合，加强了工业软件分析与计算能力，提升场景可视化程度，实现对用户行为和市场需求的预测和判断。工业大数据与工业云结合，可实现物理设备与虚拟网络融合的数据采集、传输、协同处理和应用集成，运用数据分析方法，结合领域知识，形成包括个性化推荐、设备健康管理、物品

FusionSphere虚拟化套件存储虚拟化技术白皮书

华为FusionSphere 6.5.0虚拟化套件存储虚拟化技术白皮书

目录 1简介/Introduction (3) 2解决方案/Solution (4) 2.1 FusionSphere 存储虚拟化解决方案 (4) 2.1.1架构描述 (4) 2.1.2特点描述 (5) 2.2存储虚拟化的磁盘文件解决方案 (6) 2.2.1厚置备磁盘技术 (6) 2.2.2厚置备延时置零磁盘技术 (6) 2.2.3精简置备磁盘技术 (6) 2.2.4差分磁盘技术 (7) 2.3存储虚拟化的业务管理解决方案 (7) 2.3.1磁盘文件的写时重定向技术 (7) 2.3.2磁盘文件的存储热迁移 (8) 2.3.3磁盘文件高级业务 (8) 2.4存储虚拟化的数据存储扩容解决方案 (9) 2.4.1功能设计原理 (9) 2.5存储虚拟化的数据存储修复解决方案 (10) 2.5.1功能设计原理 (10)

1 简介/Introduction 存储设备的能力、接口协议等差异性很大，存储虚拟化技术可以将不同存储设备进行格式化，将各种存储资源转化为统一管理的数据存储资源，可以用来存储虚拟机磁盘、虚拟机配置信息、快照等信息。用户对存储的管理更加同质化。虚拟机磁盘、快照等内存均以文件的形式存放在数据存储上，所有业务操作均可以转化成对文件的操作，操作更加直观、便捷。基于存储虚拟化平台提供的众多存储业务，可以提高存储利用率，更好的可靠性、可维护性、可以带来更好的业务体验和用户价值。华为提供基于主机的存储虚拟化功能，用户不需要再关注存储设备的类型和能力。存储虚拟化可以将存储设备进行抽象，以逻辑资源的方式呈现，统一提供全面的存储服务。可以在不同的存储形态，设备类型之间提供统一的功能。

华为fusionsphere6.0云套件安全技术白皮书(云数据中心)

华为F u s i o n S p h e r e6.0 云套件安全技术白皮书(云数据中心) -标准化文件发布号：（9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

华为FusionSphere 云套件安全技术白皮书（云数据中心）文档版本发布日期 2016-04-30 华为技术有限公司

华为FusionSphere 云套件安全技术白皮书 (云数据中心) Doc Number:OFFE00019187_PMD966ZH Revision:A 拟制/Prepared by: chenfujun ; 评审/Reviewed by: huangdenghui 00283052;zouxiaowei 00348656;pengzhao jun 00286002;youwenwei 00176512;yanzhongwei 00232184 批准/Approved by: youwenwei 00176512 2015-12-29 Huawei Technologies Co., Ltd. 华为技术有限公司 All rights reserved 版权所有侵权必究

版权所有 ?华为技术有限公司 2016。保留一切权利。非经本公司书面许可，任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部，并不得以任何形式传播。商标声明和其他华为商标均为华为技术有限公司的商标。本文档提及的其他所有商标或注册商标，由各自的所有人拥有。注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束，本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定，华为公司对本文档内容不做任何明示或暗示的声明或保证。由于产品版本升级或其他原因，本文档内容会不定期进行更新。除非另有约定，本文档仅作为使用指导，本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。华为技术有限公司地址：深圳市龙岗区坂田华为总部办公楼邮编：518129 网址：

FusionSphere虚拟化套件分布式虚拟交换机技术白皮书

华为FusionSphere 6.5.0 虚拟化套件分布式虚拟交换机技术白皮书

目录 1 分布式虚拟交换机概述 (1) 1.1 产生背景 (1) 1.2 虚拟交换现状 (2) 1.2.1 基于服务器CPU实现虚拟交换 (2) 1.2.2 物理网卡实现虚拟交换 (2) 1.2.3 交换机实现虚拟交换 (3) 2 华为方案简介 (5) 2.1 方案是什么 (5) 2.2 方案架构 (7) 2.3 方案特点 (7) 3 虚拟交换管理 (8) 3.1 主机 (8) 3.2 分布式虚拟交换机 (8) 3.3 端口组 (8) 4 虚拟交换特性 (9) 4.1 物理端口/聚合 (9) 4.2 虚拟交换 (9) 4.2.1 普通交换 (9) 4.2.2 SR-IOV直通 (10) 4.2.3 用户态交换 (10) 4.3 流量整形 (11) 4.3.1 基于端口组的流量整形 (11) 4.4 安全 (11) 4.4.1 二层网络安全策略 (11) 4.4.2 广播报文抑制 (12) 4.4.3 安全组 (12) 4.5 Trunk端口 (12) 4.6 端口管理 (13) 4.7 存储面三层互通 (13) 4.8 配置管理VLAN (13)

4.9 业务管理平面 (13) 5 虚拟交换应用场景 (14) 5.1 集中虚拟网络管理 (14) 5.2 虚拟网络流量统计功能 (14) 5.3 分布式虚拟端口组 (14) 5.4 分布式虚拟上行链路 (14) 5.5 网络隔离 (14) 5.6 网络迁移 (15) 5.7网络安全 (15) 5.8 配置管理VLAN (15) 5.9 业务管理平面 (15) 6 缩略语 (16)

互联网数据中心交换网络技术白皮书

互联网数据中心交换网络的设计 1 引言互联网数据中心(internet data center，IDC)是指拥有包括高速宽带互联网接入、高性能局域网络、提供安全可靠的机房环境的设备系统、专业化管理和完善的应用级服务的服务平台。在这个平台上，IDC服务商为企业、ISP、ICP和ASP等客户提供互联网基础平台服务以及各种增值服务。作为业务承载与分发的基础网络系统，就成为IDC平台的动脉。随着中国IDC产业不断发展和业务需求多样化，基础网络逐步发展出一套相对比较通用和开放的方案架构。 2 当前主要的IDC基础网络架构虽然各IDC机房各有度身定制的业务需求，网络设计也有各自的关于带宽、规模、安全和投资的考虑因素，但最基本的关注点仍然集中在高可靠、高性能、高安全和可扩展性上。 2.1 通用的IDC架构在整体设计上，层次化和模块化是IDC架构的特征，如图1，这种架构设计带来了整体网络安全和服务部署的灵活性，给上层应用系统的部署也提供了良好的支撑。图1IDC层次化&模块化设计架构分区结构采用模块化的设计方法，它将数据中心划分为不同的功能区域，用于部署不同的应用，使得整个数据中心的架构具备可伸缩性、灵活性和高可用性。数据中心的服务器根据用户的访问特性和核心应用功能，分成不同组，并部署在不同的区域中。由于整个数据中心的很多服务是统一提供的，例如数据备份和系统管理，因此为保持架构的统一性，避免不必要的资源浪费，功能相似的服务将统一部署在特定的功能区域内，例如与管理相关的服务器将被部署在管理区。分区结构另一个特点是以IDC的客户群为单位进行划分，将具体客户应用集中在一个物理或逻辑范围内，便于以区域模块为单位，提供管理和其它增值服务。层次化是将IDC具体功能分布到相应网络层、计算层和存储层，分为数据中心前端网络和后端管理等。网络本身根据不同的IDC规模，可以有接入层、汇聚层和核心层。一般情况下，数据中心网络分成标准的核心层、汇聚层和接入层三层结构。1）核心层：提供多个数据中心汇聚模块互联，并连接园区网核心；要求其具有高交换能力和突发流量适应能力；大型数据中心核心要求多汇聚模块扩展能力，中小型数据中心共用园区核心；当前以10G 接口为主，高性能的将要求4到8个10GE端口捆绑。2）汇聚层：为服务器群（server farm）提供高带宽出口；要求提供大密度GE/10GE 端口，实现接入层互联；具有较多槽位数提供增值业务模块部署。3）接入层：支持高密度千兆接入和万兆接入；接入总带宽和上行带宽存在收敛比和线速两种模式；基于机架考虑，1RU 更具灵活部署能力；支持堆叠，更具扩展能力；上行双链路冗余能力。

中国虚拟化技术发展路线图

IDC：提出中国虚拟化技术发展路线图 2008-04-15 04:05:24 通过多年以来对中国服务器市场的跟踪研究，IDC认为虚拟化技术--尤其是基于x86服务器平台的虚拟化技术在近年来已经逐渐成为市场的热点。IDC进一步提出了中国虚拟化技术发展的路线图，并认为虚拟化技术将在目前的基础上有更深远的发展空间。 IDC中国计算机系统研究部，高级分析师周震刚观点：目前中国仍然处于虚拟化1.0时代，绿色IT将推动虚拟化进程——通过多年以来对中国服务器市场的跟踪研究，IDC认为虚拟化技术--尤其是基于x86服务器平台的虚拟化技术在近年来已经逐渐成为市场的热点。IDC进一步提出了中国虚拟化技术发展的路线图，并认为虚拟化技术将在目前的基础上有更深远的发展空间。 IDC认为，虚拟化技术的发展会经历四个阶段，在2000年左右开始兴起的服务器集中化可以被看作是虚拟化发展的准备阶段，可称作虚拟化0.5时代。而从2005年开始持续至今的虚拟化热则可以被看作虚拟化的起步阶段。在这个阶段中，企业将计算资源的动态集中和共享作为实施虚拟化的主要任务。从2007年开始，在一些信息化水平较高的国家，虚拟化技术已经发展到了一个新的阶段，这时虚拟化实施的重点已经转移到了灾备、迁移以及负载均衡上。IDC预测，在2010年左右，虚拟化将达到成熟阶段。这时的虚拟化实施，将形

成以服务为导向、成本可控、基于策略且能够实现自动控制的数据中心，IDC把这个阶段称作虚拟化3.0时代。中国虚拟化技术发展路线图根据IDC对虚拟化发展进程的划分和对中国相关市场的研究，周震刚指出目前中国市场仍然处于虚拟化的起步阶段，即虚拟化1.0时代。在虚拟化的普及程度上也印证了这一点。IDC在北美市场的研究表明，在大型企业中，虚拟化应用的普及程度达到了67%以上。而在中国市场的调研显示，即使在信息化水平较高的发达城市，应用虚拟化技术的大型企业仍然不超过22%。但是，随着中国政府“节能减排”的政策出台，建设“绿色IT”成为各地企业和政府关注的重点。这将带动虚拟化技术在未来几年中

HC大数据产品技术白皮书

H3C大数据产品技术白皮书杭州华三通信技术有限公司 2020年4月

目录 1 H3C大数据产品介绍 (1) 1.1产品简介 (1) 1.2产品架构 (1) 1.2.1 数据处理 (2) 1.2.2 数据分层 (3) 1.3产品技术特点 (4) 先进的混合计算架构 (4) 高性价比的分布式集群 (4) 云化ETL (5) 数据分层和分级存储 (5) 数据分析挖掘 (6) 数据服务接口 (6)

可视化运维管理 (7) 1.4产品功能简介 (7) 管理平面功能： (12) 业务平面功能： (14) 2DataEngine HDP核心技术 (15) 3DataEngine MPP Cluster核心技术 (16) 3.1MPP + Shared Nothing架构 (16) 3.2核心组件 (16) 3.3高可用 (17) 3.4高性能扩展能力 (18) 3.5高性能数据加载 (18) 3.6OLAP函数 (19) 3.7行列混合存储 (19)

1H3C大数据产品介绍 1.1产品简介 H3C大数据平台采用开源社区Apache Hadoop2.0和MPP分布式数据库混合计算框架为用户提供一套完整的大数据平台解决方案，具备高性能、高可用、高扩展特性，可以为超大规模数据管理提供高性价比的通用计算存储能力。H3C大数据平台提供数据采集转换、计算存储、分析挖掘、共享交换以及可视化等全系列功能，并广泛地用于支撑各类数据仓库系统、BI 系统和决策支持系统帮助用户构建海量数据处理系统，发现数据的内在价值。 1.2产品架构 H3C大数据平台包含4个部分：第一部分是运维管理，包括：安装部署、配置管理、主机管理、用户管理、服务管理、监控告警和安全管理等。第二部分是数据ETL，即获取、转换、加载，包括：关系数据库连接Sqoop、日志采集Flume、ETL工具 Kettle。

FusionSphere虚拟化套件技术白皮书

华为FusionSphere 6.5.0 虚拟化套件技术白皮书 pg. i

1 摘要云计算并不是一种新的技术，而是在一个新理念的驱动下产生的技术组合。这个理念就是—敏捷IT。在云计算之前，企业部署一套服务，需要经历组网规划，容量规划，设备选型，下单，付款，发货，运输，安装，部署，调试的整个完整过程。这个周期在大型项目中需要以周甚至月来计算。在引入云计算后，这整个周期缩短到以分钟来计算。 IT业有一条摩尔定律，芯片速度容量每18个月提升一倍。同时，IT行业还有一条反摩尔定律，所有无法追随摩尔定律的厂家将被淘汰。IT行业是快鱼吃慢鱼的行业，使用云计算可以提升IT设施供给效率，不使用则会拖慢产品或服务的扩张脚步，一步慢步步慢。云计算当然还会带来别的好处，比如提升复用率缩减成本，降低能源消耗，缩减维护人力成本等方面的优势，但在反摩尔定律面前，已经显得不是那么重要。业界关于云计算技术的定义，是通过虚拟化技术，将不同的基础设施标准化为相同的业务部件，然后利用这些业务部件，依据用户需求自动化组合来满足各种个性化的诉求。云着重于虚拟化，标准化，和自动化。 FusionSphere是一款成熟的Iaas层的云计算解决方案，除满足上面所述的虚拟化，标准化和自动化诉求外，秉承华为公司二十几年电信化产品的优秀基因，向您提供开放，安全可靠的产品。本文档向您讲述华为FusionSphere解决方案中所用到的相关技术，通过阅读本文档，您能够了解到： ?云的虚拟化，标准化，自动化这些关键衡量标准是如何在FusionSphere解决方案中体现的； ?FusionSphere解决方案是如何做到开放，安全可靠的；

数据中心空调系统节能技术白皮书

数据中心空调系统节能技术白皮书目录 1. 自然冷却节能应用 3 概述 3 直接自然冷却 3 中国一些城市可用于直接自然冷却的气候数据: 8间接自然冷却 8 中国一些城市可用于间接自然冷却的气候数据: 16 2. 机房空调节能设计 17 动态部件 17 压缩机 17 风机 18 节流部件 19 加湿器 19 结构设计 21 冷冻水下送风机组超大面积盘管设计 21 DX型下送风机组高效后背板设计 22 控制节能 22

主备智能管理 22 EC风机转速控制 23 压差控制管理 23 冷水机组节能控制管理 26 1.自然冷却节能应用概述随着数据中心规模的不断扩大，服务器热密度的不断增大，数据中心的能耗在能源消耗中所占的比例不断增加。制冷系统在数据中心的能耗高达40%，而制冷系统中压缩机能耗的比例高达50%。因此将自然冷却技术引入到数据中心应用，可大幅降低制冷能耗。自然冷却技术根据应用冷源的方式有可以分为直接自然冷却和间接自然冷却。直接自然冷却又称为新风自然冷却，直接利用室外低温冷风，作为冷源，引入室内，为数据中心提供免费的冷量；间接自然冷却，利用水（乙二醇水溶液）为媒介，用水泵作为动力，利用水的循环，将数据中心的热量带出到室外侧。自然冷却技术科根据数据中心规模、所在地理位置、气候条件、周围环境、建筑结构等选择自然冷却方式。直接自然冷却直接自然冷却系统根据风箱的结构，一般可分为简易新风自然冷却新风系统和新风自然冷却系统。简易新风直接自然冷却系统主要由普通下送风室内机组和新风自然冷却节能风帽模块组成。节能风帽配置有外部空气过滤器，过滤器上应装配有压差开关，并可以传递信号至控制器，当过滤器发生阻塞时，开关会提示过滤器报警。该节能风帽应具备新风阀及回风阀，可比例调节风阀开度，调节新风比例。该系统根据检测到的室外温度、室内温度以及系统设定等控制自然冷却的启动与停止。

桌面虚拟化技术发展分析

桌面虚拟化技术发展分析-标准化文件发布号：（9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

桌面虚拟化技术（VDI）发展分析

目录 1.1 桌面虚拟化现状与发展 (3) 1.1.1 虚拟桌面简介 (3) 1.1.2 虚拟化技术 (4) 1.1.3 虚拟桌面/应用的优势 (19) 1.1.4 常用三维虚拟桌面平台分析 (20) 1.1.5 虚拟桌面需求分析 (23) 1.1.6 桌面虚拟化安全需求分析 (26)

1.1桌面虚拟化现状与发展 1.1.1虚拟桌面简介桌面虚拟化“Desktop Virtualization (或者成为虚拟桌面架构“Virtual Desktop Infrastructure”) 是一种基于服务器的计算模型，VDI概念最早由桌面虚拟化厂商VMware提出，目前已经成为标准的技术术语。虽然借用了传统的瘦客户端的模型，但是让管理员与用户能够同时获得两种方式的优点：将所有桌面虚拟机在数据中心进行托管并统一管理；同时用户能够获得完整PC的使用体验。在后端，虚拟化桌面通常通过以下两种方式之一来实现：运行若干Windows虚拟机的Hypervisor，每个用户以一对一的方式连接到他们的VM （虚拟机）。安装Windows系统的服务器，每个用户以一对一的方式连接到服务器。（这种方法有时被称作bladed PC（刀片PC））无论何种方式，都是让终端用户使用他们想使用的任何设备。他们可以从任何地方连接到他们的桌面，IT人员可以更易于管理桌面，数据更安全，因为它位于数据中心之内。 VDI方式最有趣的是，虽然这些技术是新兴的，但把桌面作为一种服务来提供的概念在十多年前就已经被提出了。与传统的基于服务器计算的解决方案最主要的区别是，基于服务器计算的解决方案在于为Windows的共享实例提供个性化的桌面，而VDI的解决方案是为每个用户提供他们自己的Windows桌面机器。能提供虚拟桌面的厂商有国外的VMware，Citrix和微软Hyper-v，的自己研制的Cloudview，集成了虚拟桌面和云计算的功能，包括对外提供云桌面、云应用和云服务等。将桌面操作系统虚拟化带来很多好处，包括： ●数据更安全，通过策略配置，用户无法将机密数据保存在本地设备上，只能在数据中心进行存储，备份，保证数据的安全性和可用性； ●提高网络安全，由于只使用需要开放有限几个端口，所以可以实现网络的逻辑隔离和严格控制，在不影响应用的前提下，全面提升网络安全性； ●用户可以随时随地，通过网络，访问到被授权的桌面与应用； ●终端设备支持更广泛，可以通过PC，瘦客户端、甚至是手机来访问传统PC上才

FusionSphere虚拟化套件安全技术白皮书

华为FusionSphere 虚拟化套件安全技术白皮书

目录 1虚拟化平台安全威胁分析 (1) 1.1概述 (1) 1.2云安全威胁分析 (1) 1.2.1传统的安全威胁 (1) 1.2.2云计算带来的新的安全威胁 (3) 1.3云计算的安全价值 (4) 2 FusionSphere安全方案 (6) 2.1 FusionSphere总体安全框架 (6) 2.2网络安全 (7) 2.2.1网络平面隔离 (7) 2.2.2 VLAN隔离 (8) 2.2.3防IP及MAC仿冒 (9) 2.2.4端口访问限制 (9) 2.3虚拟化安全 (10) 2.3.1 vCPU调度隔离安全 (10) 2.3.2内存隔离 (11) 2.3.3内部网络隔离 (11) 2.3.4磁盘I/O隔离 (11) 2.4数据安全 (11) 2.4.1 数据加密 (11) 2.4.2用户数据隔离 (12) 2.4.3数据访问控制 (12) 2.4.4剩余信息保护 (12) 2.4.5数据备份 (13)

2.4.6软件包完整性保护 (14) 2.5运维管理安全 (14) 2.5.1管理员分权管理 (14) 2.5.2账号密码管理 (14) 2.5.3日志管理 (14) 2.5.4传输加密 (15) 2.5.5数据库备份 (15) 2.6基础设施安全 (15) 2.6.1操作系统加固 (16) 2.6.2 Web安全 (16) 2.6.3数据库加固 (17) 2.6.4 Web容器加固 (17) 2.6.5安全补丁 (17) 2.6.6防病毒 (18)

1 虚拟化平台安全威胁分析 1.1 概述云计算虚拟化平台作为一种新的计算资源提供方式，用户在享受它带来的便利性、低成本等优越性的同时，也对其自身的安全性也存在疑虑。如何保障用户数据和资源的机密性、完整性和可用性成为云计算系统急需解决的课题。本文在分析云计算带来的安全风险和威胁基础上，介绍了华为云计算虚拟化平台针对这些风险和威胁所采取策略和措施，旨在为客户提供安全可信的服务器虚拟化解决方案。 1.2 云安全威胁分析 1.2.1 传统的安全威胁来自外部网络的安全威胁的主要表现 ?传统的网络IP攻击如端口扫描、IP地址欺骗、Land攻击、IP选项攻击、IP路由攻击、IP分片报文攻击、泪滴攻击等。 ?操作系统与软件的漏洞在计算机软件（包括来自第三方的软件，商业的和免费的软件）中已经发现了不计其数能够削弱安全性的缺陷（bug）。黑客利用编程中的细微错误或者上下文依赖关系，已经能够控制操作系统，让它做任何他们想让它做的事情。常见的操作系统与软件的漏洞有：缓冲区溢出、滥用特权操作、下载未经完整性检查的代码等。 ?病毒、木马、蠕虫等。 ?SQL注入攻击

各种虚拟化技术总结

各种虚拟化技术总结《各种虚拟化技术总结》是一篇好的范文，好的范文应该跟大家分享，这里给大家转摘到。篇一：主流的四大虚拟化架构对比分析主流四大虚拟化架构对比分析云计算平台需要有资源池为其提供能力输出，这种能力包括计算能力、存储能力和网络能力，为了将这些能力调度到其所需要的地方，云计算平台还需要对能力进行调度管理，这些能力均是由虚拟化资源池提供的。云计算离不开底层的虚拟化技术支持。维基百科列举的虚拟化技术有超过 60种，基于X86(CISC)体系的超过50种，也有基于RISC体系的，其中有 4 种虚拟化技术是当前最为成熟而且应用最为广泛的，分别是：VMWARE的ESX、微软的Hyper-V、开源的XEN和KVM。云计算平台选用何种虚拟化技术将是云计算建设所要面临的问题，文章就4种主流虚拟化技术的架构层面进行了对比分析。形成资源池计算能力的物理设备，可能有两种，一种是基于RISC的大小型机，另一种是基于CISC的 X86服务器。大小型机通常意味着高性能、高可靠性和高价格，而X86服务器与之相比有些差距，但随着Inter和AMD等处理器厂商技术的不断发展，原本只在小型机上才有的技术已经出现在了X86处理器上，如64位技术、虚拟化技术、多核心技术等等，使得X86服务器在性能上突飞猛进。通过TPC组织在20XX年3月份所公布的单机计算机性能排名中可以看出，4路32核的X86服务器性能已经位列前10名思想汇报专题，更重要的是X86服务器的性价比相对小型机有约5倍的优势。因此，选择X86服务器作为云计算资源池，更能凸显出云计算的低成本优势。由于单机计算机的处理能力越来越大，以单机资源为调度单位的颗粒度就太大了，因此需要有一种技术让资源的调度颗粒更细小，使资源得到更有效和充分

虚拟实验室技术白皮书

虚拟实验室技术白皮书上海庚商网络信息技术有限公司 2015年9月

目录 1 产品概述 (3) 1.1 云教育基础架构分类 (5) 1.1.1 服务器虚拟化 (5) 1.1.2 桌面虚拟化 (6) 1.2 教育虚拟技术应用分类 (7) 1.1.1 模拟 (7) 1.1.2 仿真 (8) 1.1.3 虚拟现实 (8) 1.1.4 增强现实 (9) 1.1.5 远程实验 (9) 2 总体设计 (13) 2.1 系统架构 (13) 2.2 系统说明 (13) 3 系统功能 (17) 3.1开放管理 (17) 3.2知识地图 (18) 3.3二维码 (20) 3.4微课与实验支架 (21) 3.5虚拟实验 (22) 3.6 可视化环境监控 (23) 3.7 电流检测 (23) 3.8 科研协同 (24) 3.9 云桌面 (26) 4 预算清单 (28)

1 产品概述随着计算机技术和网络技术的迅速发展，以及科学研究进一步深入的需要，虚拟仿真实验技术日渐成熟和完善，虚拟实验作为继理论研究和实验研究之后的第三种科学研究方法，对社会发展和科技进步起到了越来越重要的作用，代表着科学研究方法的重要发展方向。虚拟实验是指以计算机为控制中心，利用软件技术，构建系统的逻辑结构模型，基于模块化和层次化的设计思想，采用软硬件相结合的方式，协调相关硬件和效应设备，形成虚拟实验系统，并利用网络技术，实现虚拟实验系统的网络化，形成运行在个人计算机上、实现自行设计与开发，以及远程控制与协作的实验方式。

庚商虚拟实验室作为实验资源综合服务平台，不同于传统的虚拟平台，割裂实体资源与在线资源的联系，而是面向最终实践教学、科研与管理活动，对数据与应用资源的整合与开发，是实体资源的延伸与增强。同时，通过对实践教学、科研等核心活动数据的采集，为管理活动提供第一手的信息，有效辅助管理决策。系统建设目标如下： 1）提供良好实验平台，提高实验教学水平传统教学中，理论教学与实验教学是分开的。理论课上没有实验，建设虚拟实验室，借助虚拟仿真实验，就可以将实验带进理论课。 2）整合实验教学资源，实现实验室的真正开放虚拟实验室可以提供开放式实验环境，真正实现实验室向学生开放。学生可以打破时间和地域的限制完成相关的教学实验。由于虚拟仪器系统的支持，学生可以自拟、自选实验题目，自行组织实验，使用现成的仪器为开发自己的仪器进行实验，摒弃传统的灌输式教学方式，让学生自主参与到教学中来，最大限度地发挥学生的主动性和创造性。

KVM虚拟化技术发展史及未来

2008年9月，红帽收购了一家名叫Qumranet的以色列小公司，由此入手了一个叫做KVM的虚拟化技术（KVM，全称Kernel-based Virtual Machine，意为基于内核的虚拟机）。当时的虚拟化市场上主要以VMware为主，而KVM只是在Ubuntu 等非商用发行版上获得了一些关注。 2009年9月，红帽发布其企业级Linux的5.4版本（RHEL 5.4），在原先的Xen 虚拟化机制之上，将KVM添加了进来。 2010年11月，红帽发布其企业级Linux的6.0版本（RHEL 6.0），这个版本将默认安装的Xen虚拟化机制彻底去除，仅提供KVM虚拟化机制。 2011年初，红帽的老搭档IBM找上红帽，表示KVM这个东西值得加大力度去做。于是到了5月，IBM和红帽，联合惠普和英特尔一起，成立了开放虚拟化联盟（O pen Virtualization Alliance），一起声明要提升KVM的形象，加速KVM投入市场的速度，由此避免VMware一家独大的情况出现。联盟成立之时，红帽的发言人表示，“大家都希望除VMware之外还有一种开源选择。未来的云基础设施一定会基于开源。……我们想要营造一个小厂商们可以轻松加入的生态环境。” 于是，开放虚拟化联盟红红火火的成立了。从5月到8月这短短3个月间，开放虚拟化联盟的成员已经增加到将近300个，联盟发展的速度十分可观。IBM现在全线硬件都对红帽Linux和KVM进行了大量的优化，有60多名开发者专门开发KVM 相关的代码。原本采用Xen技术的红帽，为什么会想要再去搞一个KVM？而在虚拟化方面一直以来和Vmware、思杰、微软都有着紧密合作的IBM，为什么会对红帽的KVM展现出这样大的兴趣？这一切，还需要从整个虚拟化，乃至云计算市场的发展说起…… 虚拟化发展简史虚拟化技术最早出现在大型机时代。上世纪60年代，IBM开始在其CP-40大型机系统中尝试虚拟化的实现，后来在System/360-67中采用，并衍生出VM/CMS到后来的z/VM等产品线。大型机上的虚拟化技术在之后20多年的发展中愈发成熟，但随着小型机以及x86的流行，大型机在新兴的服务器市场中已经失去了影响力。由于处理器架构的不同，在大型机上已经成熟的虚拟化技术却并不能为小型机及 x86所用。直到2001年，VMware发布了第一个针对x86服务器的虚拟化产品。之后的几年间，英国剑桥大学的一位讲师发布了同样针对x86虚拟化的开源虚拟化项目Xen，并成立XenSource公司；惠普发布了针对HP-UX的Integrity虚拟机；Sun跟Solaris 10一同发布了同时支持x86/x64和SPARC架构的Solaris Zone；而

深信服服务器虚拟化-技术白皮书

深信服服务器虚拟化产品技术白皮书深信服科技

声明市深信服电子科技所有，并保留对本文档及本声明的最终解释权和修改权。本文档中出现的任何文字叙述、文档格式、插图、照片、方法、过程等容，除另有特别注明外，其著作权或其它相关权利均属于市深信服电子科技。未经市深信服电子科技书面同意，任何人不得以任何方式或形式对本文档的任何部分进行复制、摘录、备份、修改、传播、翻译成其他语言、将其全部或部分用于商业用途。免责条款本文档仅用于为最终用户提供信息，其容如有更改，恕不另行通知。市深信服电子科技在编写本文档的时候已尽最大努力保证其容准确可靠，但市深信服电子科技不对本文档中的遗漏、不准确、或错误导致的损失和损害承担责任。信息反馈如果您有任何宝贵意见，请反馈：信箱：省市学苑大道1001号南山智园A1栋邮编：518055 电话：09 传真：09 您也可以访问深信服科技：https://www.doczj.com/doc/155534297.html,获得最新技术和产品信息

缩写和约定英文缩写英文全称中文解释 Hypervisor Hypervisor 虚拟机管理器（和VMM同义） VMM VMM Virtual Machine Manager 虚拟机监视器 HA HighAvailability 高可用性 vMotion vMotion 实时迁移 DRS Distributed Resource Scheduler 分布式资源调度程序 FC Fibre Channel 光纤通道 HBA Host Bus Adapter 主机总线适配器 RAID Redundant Arrays of Independent Disks 磁盘阵列 IOPS Input/Output Operations Per Second 每秒读写（I/O）操作的次数VM Virtual Machine 虚拟机 LUN Logical Unit Number 逻辑单元号

数据中心空调系统节能技术白皮书

数据中心空调系统节能技术白皮书数据中心空调系统节能技术白皮书

目录 1.自然冷却节能应用 (3) 1.1概述 (3) 1.2直接自然冷却 (3) 1.2.1简易新风自然冷却系统 (3) 1.2.2新风直接自然冷却 (5) 1.2.3 中国一些城市可用于直接自然冷却的气候数据: (8) 1.3间接自然冷却 (8) 1.3.1间接自然冷却型机房精密空调解决方案 (8) 1.3.2风冷冷水机组间接自然冷却解决方案 (12) 1.3.3水冷冷水机组间接自然冷却解决方案 (15) 1.3.4 中国一些城市可用于间接自然冷却的气候数据: (16) 2.机房空调节能设计 (17) 2.1动态部件 (17) 2.1.1压缩机 (17) 2.1.2风机 (18) 2.1.3节流部件 (19) 2.1.4加湿器 (19) 2.2结构设计 (21) 2.2.1冷冻水下送风机组超大面积盘管设计 (21) 2.2.2DX型下送风机组高效后背板设计 (22) 2.3控制节能 (22) 2.3.1主备智能管理 (22) 2.3.2EC风机转速控制 (23) 2.3.3压差控制管理 (23) 2.3.4冷水机组节能控制管理 (26)

1.自然冷却节能应用自然冷却节能应用概述 1.1概述随着数据中心规模的不断扩大，服务器热密度的不断增大，数据中心的能耗在能源消耗中所占的比例不断增加。制冷系统在数据中心的能耗高达40%，而制冷系统中压缩机能耗的比例高达50%。因此将自然冷却技术引入到数据中心应用，可大幅降低制冷能耗。自然冷却技术根据应用冷源的方式有可以分为直接自然冷却和间接自然冷却。直接自然冷却又称为新风自然冷却，直接利用室外低温冷风，作为冷源，引入室内，为数据中心提供免费的冷量；间接自然冷却，利用水（乙二醇水溶液）为媒介，用水泵作为动力，利用水的循环，将数据中心的热量带出到室外侧。自然冷却技术科根据数据中心规模、所在地理位置、气候条件、周围环境、建筑结构等选择自然冷却方式。直接自然冷却 1.2直接自然冷却直接自然冷却系统根据风箱的结构，一般可分为简易新风自然冷却新风系统和新风自然冷却系统。简易新风自然冷却系统 1.2.1简易新风自然冷却系统 1.2.1.1简易新风自然冷却系统原理简易新风自然冷却系统原理简易新风直接自然冷却系统主要由普通下送风室内机组和新风自然冷却节能风帽模块组成。节能风帽配置有外部空气过滤器，过滤器上应装配有压差开关，并可以传递信号至控制器，当过滤器发生阻塞时，开关会提示过滤器报警。该节能风帽应具备新风阀及回风阀，可比例调节风阀开度，调节新风比例。