当前位置：文档之家› 大神分析raid磁盘阵列的安全性和常见故障类型

大神分析raid磁盘阵列的安全性和常见故障类型

Raid磁盘阵列的安全性分析及故障类型列举

问题：

数据恢复既然是数据灾难的一种补救措施，那设计安全的RAID磁盘阵列系统也会出现数据灾难吗？

回答：

RAID设计的初衷大约有3个原因：解决容量问题、解决IO性能问题与解决存储安全(冗余)问题。从数据恢复的角度看，我们暂不讨论容量与IO性能方面，仅讨论存储安全。

RAID中可以起到存储安全的组织方案常见的为RAID1、RAID5及其变形，基本设计思路是相似的，都是能过一定的算法，用多块硬盘之间的算法维护来保证当部分数据异常时，可通过特定算法还原出来。拿RAID5的设计方式来看，举个简单的例子说明一下，如果我们要记录两个数字，那么可以通过再多记录他们的和来达到记录的冗余性，就像我们记录3和5，同时再记录一下8(为3+5的和)，那么如果我们不记得到底是几和5，只需要用8-5就可以算出这个丢失的数字了，其余情况依此。在磁盘阵列里同样是以某种算法来达到保全数据的目的，当一组3块盘的RAID5正常工作时，所有写入RAID里的数据都正确地写到特定磁盘地址，同时再生成一个特定的计算值(通常称为校验和)，这个时候的读写效率是最好的。但当其中一块盘出现故障时，存储在这块故障盘上的原有数据就要通过其他硬盘的数据恢复出来，当然这个过程中控制器(硬RAID为RAID卡，软RAID实际上是个驱动)会负责这个工作，同时为了保证不宕机，控制器也会保证存储的正常化，不会让操作系统认为硬盘系统出了问题。

从上面的原理来看，RAID提供的存储安全还有一些不太容易避免的漏洞，虽然可能性不大，但存储在RAID上的数据价值可能无法评估，出丝毫的故障都可能会导致一场大的信息灾难。

转入正题，RAID通常出现的故障可能性有：

1、处于降级状态时，未及时rebuild：RAID是通过多出来的部分存储空间来提供算法上的数据安全冗余的，但当某些盘出现故障下线后，RAID便不能再提供这种存储冗余，如果管理员不及时更换盘，REBUILD整个卷，这时候其余工作中的硬盘再出现故障，RAID卷便无法正常工作了。这类故障在RAID数据恢复中比例相当高，服务器维护管理跟不上很容易发生。

2、控制器故障：控制器是连接物理硬盘与操作系统之间的数据存储纽带，同时因RAID的组

成方式并非自然约定(特定)，硬盘容量的大小，硬盘数量的多少，RAID组成级别，逻辑磁盘分割方式，块大小，校验方式等因素组合成不同的RAID信息(RAID元数据)，这些RAID信息有时候会写在阵列卡上，有时候会写在硬盘上，还有的时候两者皆有。如果控制器出现故障，很多情况下更换新的控制器并不能RAID信息还原，中低端的控制器出于成本考虑，这方面漏洞更会大得多。同时即使记得住原先的RAID结构，再次重建也都是错误的数据恢复方法(见相关文章)。

3、固件算法缺陷：RAID的创建、重建、降级、保护等工作在控制器的实现上是非常复杂的算法，当然这里面的复杂更多地是提供尽可能万无一失的无漏洞算法，尽管厂商不会轻易承认控制器的BUG，但毫无疑问，这些问题在任何一款控制器上都无法避免。因为固件算法上BUG，可能会产生很多无法解释的故障。比如在部分服务器数据恢复案例中，有一些早期生产的DELL2950服务器，会有RAID一块盘OFFLINE后故障盘与报警灯不一致的情况，导致客户在更换故障盘REBUILD时拔错盘，整个RAID组崩溃。

4、IO通道受阻导致RAID掉盘：RAID控制器在设计时为了数据的绝对安全，会尽可能避免写数据到不稳定的存储介质上，这样，当控制器与物理硬盘进行IO时，如果时间超过某个阀值，或不满足校验关系，便会认为对应的存储设备已不具备持续工作的能力，但会让其强制下线，通知管理员尽快解决问题。这种设计的初衷很好，同时也是正确的设计方式，但对于如物理链接线路松动，或因硬盘机械工作时反应超时（可能硬盘还是完好的）等随机原因对控制器而言无法分辨设备是否具备和之前一样的稳定状态，所以很不在意的某些小环节，便会导致RAID卷出现故障，此类故障的发生概率极大，而且无法避免。这也是大多数RAID 出现故障后，硬盘并未有故障的原因，我们好多数据恢复服务的客户会因此质疑服务器厂商，实际上是有苦难言的，一定程度上，越是设计安全的控制器，越会发生此类现象。

5、控制器的稳定性：RAID的控制器在ONLINE状态下(无离线盘)工作是最稳定的，相对而言，当部分硬盘损坏(可能是逻辑故障)后离线，控制器便会工作在一个比较吃力的状态，这也是

好多中低端的RAID控制器在一块盘离线后读写性能急速下降的原因。控制器的负载太重便会极大地增加数据吞吐时出现IO滞留的可能性，从而导致如上面第4点提及的RAID离线。一个不具备高速硬件处理芯片，不具备高速缓冲的控制器发生这类故障的概率要高得多。为了避免出现故障后数据恢复带来的业务停顿与额外开销，还是尽量不要选择这类磁盘阵列控制器。

6、坏硬盘：这类情况很有趣，好多人会认为正常工作的RAID里不会有坏硬盘，因为只要硬盘一坏，RAID就会让他这块坏硬盘脱机，更换新硬盘后REBUILD就又是好硬盘了。但实际上，这类情况却是不可避免的，原因是：一组RAID卷在工作很长时间以后也很少会读到物理硬盘的所有磁盘空间，同一时间更是不可能。部分情况下，硬盘会在没有读到的区域或者以前读取是良好的区域产生坏道，这类坏道因为没有读写过，所以在控制器看来是好的。产生这种坏磁道的最直接危害是在REBUILD过程中。当一块物理硬盘离线后，通常所有的技术人员及官方资料都会写尽快做REBUILD，但如果其他硬盘存在这类平常不知的坏磁道，REBUILD又都是对全盘做全面同步，就一定会读写到那些坏道，这时候REBUILD没完成，新盘无法上线，因旧盘里又发现了坏道，便会导致RAID又多出一些下线的硬盘，这样就可能会导致RAID出现故障，无法自行进行数据恢复了。

7、人为误操作：涉及数据恢复的数据灾难有相当一部分也是可以避免的，但总会有这样的情况：无关人员误拔RAID里的硬盘、没准备备件盘、不及时换盘、给RAID除尘时忘了原来的顺序、不小心删除了原RAID配置等。

8、其他我暂时想不起来的原因。

这些灾难原因除人为原因外，大多数很难直接避免，只能通过结合备份，构建整体存储安全方案来解决。其他文章会提到原因，以及抛开数据恢复话题的安全建议。

磁盘阵列配置全程解

磁盘阵列配置全程解（图) 说到磁盘阵列（RAID，Redundant Array of Independent Disks），现在几乎成了网管员所必须掌握的一门技术之一，特别是中小型企业，因为磁盘阵列应用非常广泛，它是当前数据备份的主要方案之一。然而，许多网管员只是在各种媒体上看到相关的理论知识介绍，却并没有看到一些实际的磁盘阵列配置方法，所以仍只是一知半解，到自己真正配置时，却无从下手。本文要以一个具体的磁盘阵列配置方法为例向大家介绍磁盘阵列的一些基本配置方法，给出一些关键界面，使各位对磁盘阵列的配置有一个理性认识。当然为了使各位对磁盘阵列有一个较全面的介绍，还是先来简要回顾一下有关磁盘阵列的理论知识，这样可以为实际的配置找到理论依据。一、磁盘阵列实现方式磁盘阵列有两种方式可以实现，那就是“软件阵列”与“硬件阵列”。软件阵列是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘，组成阵列。如微软的Windows NT/2000 Server/Server 2003和NetVoll的NetWare两种操作系统都可以提供软件阵列功能，其中Windows NT/2000 Server/ Server 2003可以提供RAID 0、RAID 1、RAID 5；NetWare操作系统

可以实现RAID 1功能。软件阵列可以提供数据冗余功能，但是磁盘子系统的性能会有所降低，有的降代还比较大，达30%左右。硬件阵列是使用专门的磁盘阵列卡来实现的，这就是本文要介绍的对象。现在的非入门级服务器几乎都提供磁盘阵列卡，不管是集成在主板上或非集成的都能轻松实现阵列功能。硬件阵列能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。磁盘阵列卡拥有一个专门的处理器，如Intel的I960芯片，HPT370A/372 、Silicon Image SIL3112A等，还拥有专门的存贮器，用于高速缓冲数据。这样一来，服务器对磁盘的操作就直接通过磁盘阵列卡来进行处理，因此不需要大量的CPU及系统内存资源，不会降低磁盘子系统的性能。阵列卡专用的处理单元来进行操作，它的性能要远远高于常规非阵列硬盘，并且更安全更稳定。二、几种磁盘阵列技术 RAID技术是一种工业标准，各厂商对RAID级别的定义也不尽相同。目前对RAID级别的定义可以获得业界广泛认同的有4种，RAID 0、RAID 1、RAID 0＋1和RAID 5。 RAID 0是无数据冗余的存储空间条带化，具有成本低、读写性能极高、存储空间利用率高等特点，适用于音、视频信号存储、临时文件的转储等对速度要求极其严格的特殊应用。但由于没有数据冗

磁盘阵列详解配置

磁盘阵列(Disk Array) 1.为什么需要磁盘阵列如何增加磁盘的存取(access)速度,如何防止数据因磁盘的故障而失落及如何有效的利用磁盘空间,一直是电脑专业人员和用户的困扰;而大容量磁盘的价格非常昂贵,对用户形成很大的负担。磁盘阵列技术的产生一举解决了这些问题。 1 过去十年来,CPU的处理速度增加了五十倍有多,内存(memory)的存取速度亦大幅增加,而数据储存装置--主要是磁盘(hard disk)--的存取速度只增加了三、四倍,形成电脑系统的瓶颈,拉低了电脑系统的整体性能(throughput),若不能有效的提升磁盘的存取速度,CPU、内存及磁盘间的不平衡将使CPU及内存的改进形成浪费。目前改进磁盘存取速度的的方式主要有两种。一是磁盘快取控制(disk cache controller),它将从磁盘读取的数据存在快取内存(cache memory)中以减少磁盘存取的次数,数据的读写都在快取内存中进行,大幅增加存取的速度,如要读取的数据不在快取内存中,或要写数据到磁盘时,才做磁盘的存取动作。这种方式在单工环境(single-tasking environment)如DOS之下,对大量数据的存取有很好的性能(量小且频繁的存取则不然),但在多工(multi-tasking)环境之下(因为要不停的作数据交换(swapping)的动作)或数据库(database)的存取(因为每一记录都很小)就不能显示其性能。这种方式没有任何安全保障。其二是使用磁盘阵列的技术。磁盘阵列是把多个磁盘组成一个阵列,当作单一磁盘使用,它将数据以分段(striping)的方式储存在不同的磁盘中,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。磁盘阵列所利用的不同的技术,称为RAID level,不同的level针对不同的系统及应用,以解决数据安全的问题。一般高性能的磁盘阵列都是以硬件的形式来达成,进一步的把磁盘快取控制及磁盘阵列结合在一个控制器(RAID controller)?或控制卡上,针对不同的用户解决人们对磁盘输出入系统的四大要求: (1)增加存取速度, (2)容错(fault tolerance),即安全性 (3)有效的利用磁盘空间; (4)尽量的平衡CPU,内存及磁盘的性能差异,提高电脑的整体工作性能。 2.磁盘阵列原理磁盘阵列中针对不同的应用使用的不同技术,称为RAID level, RAID是Redundant Array of Inexpensive Disks的缩写,而每一level代表一种技术,目前业界公认的标准是RAID 0~RAID 5。这个level并不代表技术的高低,level 5并不高于level 3,level 1也不低过level 4,至于要选择那一种RAID level的产品,纯视用户的操作环境(operating environment)及应用(application)而定,与level的高低没有必然的关系。RAID 0及RAID 1适用于PC及PC相关的系统如小型的网络服务器(network server)及需要高磁盘容量与快速磁盘存取的工作站等,因为比较便宜,但因一般人对磁盘阵列不了解,没有看到磁盘阵列对他们价

磁盘阵列技术详解

由磁盘阵列角度来看磁盘阵列的规格最重要就在速度，也就是CPU的种类。我们知道SCSI的演变是由SCSI 2 (Narrow, 8 bits, 10MB/s), SCSI 3 (Wide, 16bits, 20MB /s), Ultra Wide (16bits, 40MB/s), Ultra 2 (Ultra Ultra Wide, 80MB /s), Ultra 3 (Ultra Ultra Ultra Wide, 160MB/s)，在由SCSI到Serial I/O，也就是所谓的 Fibre Channel (FC- AL, Fibre Channel - Arbitration Loop, 100 – 200MB/s), SSA (Serial Storage Architecture, 80 – 16 0 MB /s), 在过去使用 Ultra Wide SCSI, 40MB/s 的磁盘阵列时，对CPU的要求不须太快，因为SCSI本身也不是很快，但是当SCSI演变到Ultra 2, 80MB/s时，对CPU的要求就非常关键。一般的CPU, (如 586)就必须改为高速的RISC CPU, (如 Intel RISC CPU, i960RD 32bits, i960RN 64 bits)，不但是RISC CPU, 甚至于还分 32bits, 64 bits RISC CPU 的差异。586 与 RISC CPU 的差异可想而知 ! 这是由磁盘阵列的观点出发来看的。由服务器的角度来看服务器的结构已由传统的 I/O 结构改为 I2O ( Intelligent I/O, 简称 I2O ) 的结构，其目的就是为了减少服务器CPU的负担，才会将系统的 I/O 与服务器CPU负载分开。Intel 因此提出 I2O 的架构，I2O 也是由一颗 RISC CPU ( i960RD 或I960RN ) 来负责 I/O 的工作。试想想若服务器内都已是由 RISC i960 CPU 来负责 I/O，结果磁盘阵列上却仍是用 586 CPU，速度会快吗 ? 由操作系统的角度来看在操作系统都已由 32 bits 转到 64 bits，磁盘阵列上的CPU 必须是 Intel i960 RISC CPU 才能满足速度的要求。586 CPU 是无法满足的! 磁盘阵列的功能使用磁盘阵列的好处，在于数据的安全、存取的速度及超大的存储容量。如何确保数据的安全，则取决于磁盘阵列的设计与品质。其中几个功能是必须考虑的：是否有环境监控器针对温度、电压、电源、散热风扇、硬盘状态等进行监控。磁盘阵列内的硬盘连接方式是用SCA-II整体后背板还是只是用SCSI 线连的？在 SCA-II整体后背板上是否有隔绝芯片以防硬盘在热插拔时所产生的高/低电压，使系统电压回流，造成系统的不稳定，产生数据丢失的情形。我们一定要重视这个问题，因为在磁盘阵列内很多硬盘都是共用这同一SCSI 总线！一个硬盘热插拔，可不能引响其它的硬盘！甚幺是热插拔或带电插拔？硬盘有分热插拔硬盘， 80针的硬盘是热插拔硬盘，68针的不是热插拔硬盘，有没有热插拔，在电路上的设计差异就在于有没有保护线路的设计，同样的硬盘拖架也是一样有分真的热插拔及假的热插拔的区别。磁盘阵列内的硬盘是否有顺序的要求？也就是说硬盘可否不按次序地插回阵列中，数据仍能正常的存取？很多人认为不是很重要，不太会发生，但是可能会发生的，我们就要防止它发生。假如您用六个硬盘做阵列，在最出初始化时，此六个硬盘是有顺序放置在磁盘阵列内，分为第一、第二…到第六个硬盘，是有顺序的，如果您买的磁盘阵列是有顺序的要求，则您要注意了：有一天您将硬盘取出，做清洁时一定要以原来的摆放顺序插

RAID技术概述

RAID技术概述 RAID的形式是多种多样的，它们都是高可用性和高性能存储的骨干力量。RAID设备的最初应用可以追溯到上世纪80年代末，而在今天，RAID已经成为我们IT生活中一个应用广泛且非常重要部分，以至于很多人已经忘记RAID这个缩写到底是什么意思。 RAID是Redundent Array of Inexpensive Disks的缩写，直译为“廉价冗余磁盘阵列”，也简称为“磁盘阵列”。后来RAID中的字母I被改作了Independent，RAID就成了“独立冗余磁盘阵列”，但这只是名称的变化，实质性的内容并没有改变。简单地讲，RAID技术就是利用多个硬盘的组合提供高效率及冗余的功能。 RAID这个概念最早是由1987年加州伯克利大学的David Patterson，Garth Gibson, Randy Katz提出的，他们的目标是展示一个RAID的性能可以达到或超过当时的一个单一的，大容量的，昂贵的磁盘。在项目开发的过程中，随着频繁的磁盘失败，通过磁盘的冗余来避免磁盘数据的丢失已经是必须的了。这样一来，该项目的研究对于将来的RAID变得至关重要。一、RAID 的优点 RAID的采用为存储系统（或者服务器的内置存储）带来巨大利益，其中提高传输速率和提供容错功能是最大的优点。 RAID通过同时使用多个磁盘，提高了传输速率。RAID通过在多个磁盘上同时存储和读取数据来大幅提高存储系统的数据吞吐量（Throughput）。在RAID 中，可以让很多磁盘驱动器同时传输数据，而这些磁盘驱动器在逻辑上又是一个磁盘驱动器，所以使用RAID可以达到单个磁盘驱动器几倍、几十倍甚至上百倍

10分钟认识RAID磁盘阵列技术

在计算机发展的初期，"大容量"硬盘的价格还相当高，解决数据存储安全性问题的主要方法是使用磁带机等设备进行备份，这种方法虽然可以保证数据的安全，但查阅和备份工作都相当繁琐。1987年，Patterson、Gibson和Katz这三位工程师在加州大学伯克利分校发表了题为《 A Case of Redundant Array of Inexpensive Disks（廉价磁盘冗余阵列方案）》的论文，其基本思想就是将多只容量较小的、相对廉价的硬盘驱动器进行有机组合，使其性能超过一只昂贵的大硬盘。这一设计思想很快被接受，从此RAID技术得到了广泛应用，数据存储进入了更快速、更安全、更廉价的新时代。磁盘阵列对于个人电脑用户，还是比较陌生和神秘的。印象中的磁盘阵列似乎还停留在这样的场景中：在宽阔的大厅里，林立的磁盘柜，数名表情阴郁、早早谢顶的工程师徘徊在其中，不断从中抽出一块块沉重的硬盘，再插入一块块似乎更加沉重的硬盘......终于，随着大容量硬盘的价格不断降低，个人电脑的性能不断提升，IDE-RAID作为磁盘性能改善的最廉价解决方案，开始走入一般用户的计算机系统。一、RAID技术规范简介 RAID技术主要包含RAID 0～RAID 7等数个规范，它们的侧重点各不相同，常见的规范有如下几种： RAID 0：RAID 0连续以位或字节为单位分割数据，并行读/写于多个磁盘上，因此具有很高的数据传输率，但它没有数据冗余，因此并不能算是真正的RAID结构。RAID 0只是单纯地提高性能，并没有为数据的可靠性提供保证，而且其中的一个磁盘失效将影响到所有数据。因此，RAID 0不能应用于数据安全性要求高的场合。 RAID 1：它是通过磁盘数据镜像实现数据冗余，在成对的独立磁盘上产生互为备份的数据。当原始数据繁忙时，可直接从镜像拷贝中读取数据，因此RAID 1可以提高读取性能。RAID 1是磁盘阵列中单位成本最高的，但提供了很高的数据安全性和可用性。当一个磁盘失效时，系统可以自动切换到镜像磁盘上读写，而不需要重组失效的数据。 RAID 0+1: 也被称为RAID 10标准，实际是将RAID 0和RAID 1标准结合的产物，在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的同时，为每一块磁盘作磁盘镜像进行冗余。它的优点是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性，但是CPU 占用率同样也更高，而且磁盘的利用率比较低。 RAID 2：将数据条块化地分布于不同的硬盘上，条块单位为位或字节，并使用称为"加重平均纠错码（海明码）"的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息，使得RAID 2技术实施更复杂，因此在商业环境中很少使用。 RAID 3：它同RAID 2非常类似，都是将数据条块化分布于不同的硬盘上，区别在于RAID 3使用简单的奇偶校验，并用单块磁盘存放奇偶校验信息。如果一块磁盘失效，奇偶盘及其他数据盘可以重新产生数据；如果奇偶盘失效则不影响数据使用。RAID 3对于大量的连续数据可提供很好的传输率，但对于随机数据来说，奇偶盘会成为写操作的瓶颈。 RAID 4：RAID 4同样也将数据条块化并分布于不同的磁盘上，但条块单位为块或记录。RAID 4使用一块磁盘作为奇偶校验盘，每次写操作都需要访问奇偶盘，这时奇偶校验盘会成为写操作的瓶颈，因此RAID 4在商业环境中也很少使用。 RAID 5：RAID 5不单独指定的奇偶盘，而是在所有磁盘上交叉地存取数据及奇偶校验信息。在RAID 5上，读/写指针可同时对阵列设备进行操作，提供了更高的数据流量。RAID 5更适合于小数据块和随机读写的数据。RAID 3与RAID 5相比，最主要的区别在于RAID 3每进行一次数据传输就需涉及到所有的阵列盘；而对于RAID 5来说，大部分数据传输只对一块磁盘操作，并可进行并行操作。在RAID 5中有"写损失"，即每一次写操作将产生四个实际的读/写操作，其中两次读旧的数据及奇偶信息，两次写新的数据及奇偶信息。RAID

磁盘阵列技术原理分析

磁盘阵列技术原理分析认识磁盘阵列技术由磁盘阵列角度来看磁盘阵列的规格最重要就在速度，也就是CPU的种类。我们知道SCSI的演变是由SCSI 2 (Narrow, 8 bits, 10MB/s), SCSI 3 (Wide, 16bits, 20MB/s), Ultra Wide (16bits, 40MB/s), Ultra 2 (Ultra Ultra Wide, 80MB/s), Ultra 3 (Ultra Ultra Ultra Wide, 160MB/s)，在由SCSI到Serial I/O，也就是所谓的 Fibre Channel (FC-AL, Fibre Channel - Arbitration Loop, 100 –200MB/s), SSA (Serial Storage Architecture, 80 –160 MB/s), 在过去使用 Ultra Wide SCSI, 40MB/s 的磁盘阵列时，对CPU的要求不须太快，因为SCSI 本身也不是很快，但是当SCSI演变到Ultra 2, 80MB/s时，对CPU的要求就非常关键。一般的CPU, (如 586)就必须改为高速的RISC CPU, (如 Intel RISC CPU, i960RD 32bits, i960RN 64 bits)，不但是RISC CPU, 甚至于还分 32bits, 64 bits RISC CPU 的差异。586 与 RISC CPU 的差异可想而知 ! 这是由磁盘阵列的观点出发来看的。由服务器的角度来看服务器的结构已由传统的 I/O 结构改为 I2O ( Intelligent I/O, 简称 I2O ) 的结构，其目的就是为了减少服务器CPU的负担，才会将系统的 I/O 与服务器CPU负载分开。Intel 因此提出 I2O 的架构，I2O 也是由一颗 RISC CPU ( i960RD 或I960RN ) 来负责 I/O 的工作。试想想若服务器内都已是由 RISC i960 CPU 来负责 I/O，结果磁盘阵列上却仍是用 586 CPU，速度会快吗 ? 由操作系统的角度来看 ? SCO OpenServer 5.0 32 bits ? MicroSoft Windows NT 32 bits ? SCO Unixware 7.x 64 bits ? MicroSoft Windows NT 2000 32 bit 64 bits ?SUN Solaris 64 bits ……..其他操作系统在操作系统都已由 32 bits 转到 64 bits，磁盘阵列上的CPU 必须是 Intel i960 RISC CPU才能满足速度的要求。586 CPU 是无法满足的 ! 磁盘阵列的功能使用磁盘阵列的好处，在于数据的安全、存取的速度及超大的存储容量。如何确保数据的安全，则取决于磁盘阵列的设计与品质。其中几个功能是必须考虑的：是否有环境监控器针对温度、电压、电源、散热风扇、硬盘状态等进行监控。磁盘阵列内的硬盘连接方式是用SCA-II 整体后背板还是只是用SCSI线连的？在SCA-II整体后背板上是否有隔绝芯片以防硬盘在热插拔时所产生的高/低电压，使系统电压回流，造成系统的不稳定，产生数据丢失的情形。我们一定要重视这个问题，因为在磁盘阵列内很多硬盘都是共用这同一SCSI总线！一个硬

硬盘RADE技术详解

硬盘RAID技术详解一．Raid定义 RAID(Redundant Array of Independent Disk 独立冗余磁盘阵列)技术是加州大学伯克利分校1987年提出，最初是为了组合小的廉价磁盘来代替大的昂贵磁盘，同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术。RAID就是一种由多块廉价磁盘构成的冗余阵列，在操作系统下是作为一个独立的大型存储设备出现。RAID可以充分发挥出多块硬盘的优势，可以提升硬盘速度，增大容量,提供容错功能够确保数据安全性，易于管理的优点，在任何一块硬盘出现问题的情况下都可以继续工作，不会受到损坏硬盘的影响。二、RAID的几种工作模式 1、RAID0 即Data Stripping数据分条技术。RAID 0可以把多块硬盘连成一个容量更大的硬盘群，可以提高磁盘的性能和吞吐量。RAID 0没有冗余或错误修复能力，成本低，要求至少两个磁盘，一般只是在那些对数据安全性要求不高的情况下才被使用。（1）、RAID 0最简单方式就是把x块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起，形成一个独立的逻辑驱动器，容量是单独硬盘的x倍,在电脑数据写时被依次写入到各磁盘中，当一块磁盘的空间用尽时，数据就会被自动写入到下一块磁盘中，它的好处是可以增加磁盘的容量。速度与其中任何一块磁盘的速度相同，如果其中的任何一块磁盘出现故障，整个系统将会受到破坏，可靠性是单独使用一块硬盘的1/n。（2）、RAID 0的另一方式是用n块硬盘选择合理的带区大小创建带区集，最好是为每一块硬盘都配备一个专门的磁盘控制器,在电脑数据读写时同时向n块磁盘读写数据,速度提升n倍。提高系统的性能。 2、RAID 1 RAID 1称为磁盘镜像：把一个磁盘的数据镜像到另一个磁盘上，在不影响性能情况下最大限度的保证系统的可靠性和可修复性上，具有很高的数据冗余能力，但磁盘利用率为50%，故成本最高，多用在保存关键性的重要数据的场合。RAID 1有以下特点：（1）、RAID 1的每一个磁盘都具有一个对应的镜像盘，任何时候数据都同步镜像，系统可以从一组镜像盘中的任何一个磁盘读取数据。（2）、磁盘所能使用的空间只有磁盘容量总和的一半，系统成本高。（3）、只要系统中任何一对镜像盘中至少有一块磁盘可以使用，甚至可以在一半数量的

磁盘阵列RAID详解_图文并茂.pdf

磁盘阵列磁盘阵列(Disk Array)(Disk Array) 1.为什么需要磁盘阵列如何增加磁盘的存取(access)速度,如何防止数据因磁盘的故障而失落及如何有效的利用磁盘空间,一直是电脑专业人员和用户的困扰;而大容量磁盘的价格非常昂贵,对用户形成很大的负担。磁盘阵列技术的产生一举解决了这些问题。过去十年来,CPU 的处理速度增加了五十倍有多,内存(memory)的存取速度亦大幅增加,而数据储存装置--主要是磁盘(hard disk)--的存取速度只增加了三、四倍,形成电脑系统的瓶颈,拉低了电脑系统的整体性能(throughput),若不能有效的提升磁盘的存取速度,CPU、内存及磁盘间的不平衡将使CPU 及内存的改进形成浪费。目前改进磁盘存取速度的的方式主要有两种。一是磁盘快取控制(disk cache controller),它将从磁盘读取的数据存在快取内存(cache memory)中以减少磁盘存取的次数,数据的读写都在快取内存中进行,大幅增加存取的速度,如要读取的数据不在快取内存中,或要写数据到磁盘时,才做磁盘的存取动作。这种方式在单工环境(single-tasking environment)如DOS 之下,对大量数据的存取有很好的性能(量小且频繁的存取则不然),但在多工(multi-tasking)环境之下(因为要不停的作数据交换(swapping)的动作)或数据库(database)的存取(因为每一记录都很小)就不能显示其性能。这种方式没有任何安全保障。其二是使用磁盘阵列的技术。磁盘阵列是把多个磁盘组成一个阵列,当作单一磁盘使用,它将数据以分段(striping)的方式储存在不同的磁盘中,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。磁盘阵列所利用的不同的技术,称为RAID level,不同的level 针对不同的系统及应用,以解决数据安全的问题。一般高性能的磁盘阵列都是以硬件的形式来达成,进一步的把磁盘快取控制及磁盘阵列结合在一个控制器(RAID controller) 或控制卡上,针对不同的用户解决人们对磁盘输出入系统的四大要求: (1)增加存取速度, (2)容错(fault tolerance),即安全性 (3)有效的利用磁盘空间; (4)尽量的平衡CPU,内存及磁盘的性能差异,提高电脑的整体工作性能。 2.磁盘阵列原理磁盘阵列中针对不同的应用使用的不同技术,称为RAID level, RAID 是Redundant Array of Inexpensive Disks 的缩写,而每一level 代表一种技术,目前业界公认的标准是RAID 0~RAID 5。这个level 并不代表技术的高低,level 5并不高于level 3,level 1也不低过level 4,至于要选择那一种RAID level 的产品,纯视用户的操作环境(operating environment)及应用(application)而定,与level 的高低没有必然的关系。RAID 0及RAID 1适用于PC 及PC 相关的系统如小型的网络服务器(network server)及需要高磁盘容量与快速磁盘存取的工作站等,因为比较便宜,但因一般人对磁盘阵列不了解,没有看到磁盘阵列对他们价值,市场尚未打开;RAID 2及RAID 3适用于大型电脑及影像、CAD/CAM 等处理;RAID 5多用于OLTP,因有金融机构及大型数据处理中心的迫切需要,故使用较多而较有名气,但也因此形成很多人对磁盘阵列的误解,以为磁盘阵列非要RAID 5不可;RAID 4较少使用,因为两者有其共同之处,而RAID 4有其先天的限制。其

RAID技术详解

第1章RAID技术详解自从计算机问世以来，存储技术就伴随着计算机的发展而飞速发展，但从重要性和影响力方面来说，没有哪项存储技术的发明能够与RAID相提并论，RAID技术理念引发了数据存储的重大变革，也成为现在虚拟化存储技术的奠基石。 RAID技术有各种级别之分，包括RAID-0、RAID-1、RAID-10、RAID-1E、RAID-2、RAID-3、RAID-4、RAID-5、RAID-5E、RAID-5EE、RAID双循环、RAID-6、JBOD等，本章将详细讲解各个级别RAID的数据组织原理、故障原因分析及其数据恢复思路。 1.1 什么是RAID 这一节首先对RAID做一个基本介绍，包括RAID的概念、RAID的作用、RAID级别的分类、软RAID和硬RAID的组建方法，同时还会对RAID中常用的一些专业术语进行讲解。 1.1.1 RAID基础知识 RAID最初是1987年在加利福尼亚大学进行的一个科研项目，后来由伯克利分校的D.A. Patterson教授在1988年正式提出。 RAID（Redundant Array of Inexpensive Disks），直译为“廉价冗余磁盘阵列”，最初是为了组合多块小容量的廉价磁盘来代替大容量的昂贵磁盘，同时希望在磁盘失效时不会对数据造成影响而开发出的一种磁盘存储技术。后来随着硬盘研发技术的不断提升，硬盘的容量越来越大，成本却在不断下降，所以RAID中Inexpensive（廉价）一词已经失去意义，于是将这个词用Independent（独立）来替代，RAID就成了“独立冗余磁盘阵列”，也简称为“磁盘阵列”，但这只是名称的变化，实质性的内容并没有改变。 1.1.2 RAID能解决什么问题通俗地说，RAID就是通过将多个磁盘按照一定的形式和方案组织起来，通过这样的形式能够获取比单个硬盘更高的速度、更好的稳定性、更大的存储能力的存储解决方案，用户不必关心磁盘阵列究竟由多少块硬盘组成，使用中整个阵列就如同一块硬盘一样。所以，RAID技术能够为计算机系统提供以下三个方面的优异性能：

RAID10磁盘阵列优势全面详解

RAID10磁盘阵列优势全面详解当前影响计算机运算速度的不是CPU,也不是内存而是硬盘。为了是硬盘能有更好的性能表现人们开使使用一种新的磁盘技术——磁盘阵列技术。下面为大家详细介绍各种磁盘阵列技术的特点。当时，RAID是解决我们存储问题的灵丹妙药。通过RAID，我们可以将文件系统扩展得更大，获得更高的吞吐率，甚至还可以增加冗余度以便让我们可以承受磁盘损失的风险--这种风险在这段时间发生得尤其经常。随着NAS（网络附加存储）和SAN（存储局域网）设备的兴起，我们已经不是很需要那种深入到物理存储然后调整物理存储以满足系统需求的技能了。这不是一件好事。我们仅仅是将存储卸载到外部设备，这并不能改变我们需要深入理解存储的事实，我们还是需要在理解的基础上调整存储以满足系统的特定需求。过去五到十年来，人们似乎误以为RAID某种程度上相当于系统备份。其实它不是。RAID是一种容错形式。备份和容错是不同的概念。备份让你可以在灾难发生后恢复数据。容错是减少灾难发生的概率。你可以想象成容错是在悬崖顶部立一条护栏，而备份是在悬崖底部设立一座医院。护栏和医院都是你想要的，但是它们是完全不同的事物。一旦我们开始在驱动器上实施RAID，无论是本地连接的还是存储网络上的远程设备，如今的我们可以根据业务需要选择四种主要的RAID解决方案：RAID 1（镜像）；RAID 5（带校验码的条带化）；RAID 6（带双校验码的条带化）；RAID 10（带条带的镜像）。市场上还有其他类型的RAID，比如RAID 0，不过如果你真正理解你的驱动器子系统需求的话，你就知道RAID 0只适用于很罕见的场合。RAID 50和51也被人们所使用，但是更加少见。十年前，RAID 1和RAID 5是很常见的，但是如今我们有更多的选择。

光纤磁盘阵列技术选型

光纤磁盘阵列技术选型当前市场上的磁盘阵列呈现出一番花团锦簇的景象。在用户有了众多选择的同时，也有了选择上的困惑。因此，本文就从体系结构的角度，简要分析目前磁盘阵列的差异性，供用户参考。当今世界信息爆炸式的增长，除了给科技与技术的发展带来更大的发展动力外，也给企业的数据存储带来了巨大的挑战。然而，作为企业信息存储系统中的最关键部分――磁盘阵列，很多人未必能说得清楚。磁盘阵列技术诞生于1987年，由美国加州大学伯克利分校提出。这项技术的核心设计理念是RAID技术。原来的名称是“Redundant Array of Inexpensive Disk”，最初研制它的目的是为了组合小型的廉价磁盘来代替大的昂贵磁盘，以降低大批量数据存储的费用。同时也希望通过冗余信息的方式，使得单一磁盘失效时不会丢失数据，因此开发出不同级别的RAID数据保护技术，并在此基础上逐渐致力于提升数据访问速度。这个名字后来改为“Redundant Array of Independent Disk”，但仍然称作“RAID”。类型分析

经过多年的发展，企业中数据的价值越来越高，而承载这些数据的磁盘阵列也越发受到用户的重视。从市场分布可以看出，存储与服务器所占比例呈逐年上升趋势。用户的强大需求同时也给存储系统供应商创造了巨大的商机。目前市场上不但有老牌厂商提供的各种产品，也有初创公司新推的各种系统。自然，当前市场上的磁盘阵列也是一番花团锦簇的景象。然而，在用户有了众多选择的同时，也有了选择上的困惑。因此，本文从体系结构的角度，简要分析目前磁盘阵列的差异性，供用户在选择磁盘阵列时参考。目前的磁盘接口有IDE、SATA、SCSI、SAS、FC等几种。其中IDE接口磁盘正在被SATA接口硬盘取代，将逐渐退出历史舞台，两者主要用于桌面; SAS接口磁盘也正在逐渐淘汰SCSI接口，很快将占领企业应用的低端市场; 而FC(Fibre Channel，光纤)接口硬盘一出世就是专门针对高可靠、高可用、高性能的企业存储应用的，不但接口速度快，而且支持双端口访问，又经过严格的生产工艺控制，可靠性很好。由于这些天生优势，FC接口硬盘在企业用户中尤其是关键数据存储应用中占据着绝对优势，也是高端存储应用的首选磁盘。基于SATA、SCSI接口的磁盘阵列已经很普遍了，这里就不再赘述，本文重点介绍的是光纤接口磁盘阵列。光纤磁

磁盘阵列技术介绍

磁盘阵列技术介绍 1.为什么需要磁盘阵列? 如何增加磁盘的存取(access)速度,如何防止数据因磁盘的故障而失落及如何有效的利用磁盘空间,一直是电脑专业人员和用户的困扰;而大容量磁盘的价格非常昂贵,对用户形成很大的负担。磁盘阵列技术的产生一举解决了这些问题。过去十几年来,CPU的处理速度增加了五十倍有多,内存(memory)的存取速度亦大幅增加,而数据储存装置--主要是磁盘(harddisk)--的存取速度只增加了三、四倍,形成电脑系统的瓶颈,拉低了电脑系统的整体性能(throughput),若不能有效的提升磁盘的存取速度,CPU、内存及磁盘间的不平衡将使CPU及内存的改进形成浪费。目前改进磁盘存取速度的的方式主要有两种。一是磁盘快取控制(diskcachecontroller),它将从磁盘读取的数据存在快取内存(cachememory)中以减少磁盘存取的次数,数据的读写都在快取内存中进行,大幅增加存取的速度,如要读取的数据不在快取内存中,或要写数据到磁盘时,才做磁盘的存取动作。这种方式在单工环境(single-taskingenvioronment)如DOS之下,对大量数据的存取有很好的性能(量小且频繁的存取则不然),但在多工(multi-tasking)环境之下(因为要不停的作数据交换(swapping)的动作)或数据库(database)的存取(因为每一记录都很小)就不能显示其性能。这种方式没有任何安全保障。其二是使用磁盘阵列的技术。磁盘阵列是把多个磁盘组成一个阵列,当作单一磁盘使用,它将数据以分段(striping)的方式储存在不同的磁盘中,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。磁盘阵列所利用的不同的技术,称为RAIDlevel,不同的level针对不同的系统及应用,以解决数据安全的问题。一般高性能的磁盘阵列都是以硬件的形式来达成,进一步的把磁盘快取控制及磁盘阵列结合在一个控制器(RAIDcontroler或控制卡上,针对不同的用户解决人们对磁盘输出入系统的四大要求: (1)增加存取速度, (2)容错(faulttolerance),即安全性 (3)有效的利用磁盘空间; (4)尽量的平衡CPU,内存及磁盘的性能差异,提高电脑的整体工作性能。 2.磁盘阵列原理磁盘阵列中针对不同的应用使用的不同技术,称为RAIDlevel,RAID是RedundentArrayofInexpensiveDisks的缩写,而每一level代表一种技术,目前业界公认的标准是

RAID3和RAID5技术详解

RAID3和RAID5技术详解热插拔一些面向高端应用的磁盘镜像系统都可以提供磁盘的热插拔功能。所谓热插拔功能，就是允许用户在不关闭系统，不切断电源的情况下取出和更换损害的硬盘。如果没有热插拔功能，即使磁盘损坏不会造成数据的丢失，用户仍然需要暂时关闭系统，以便能够对硬盘进行更换。现在，使用热插拔技术只要简单的打开连接开关或者转动手柄就可以直接取出硬盘，而系统仍然可以不间断的正常运行。校验 RAID 3和RAID 5都分别使用了校验的概念提供容错能力。简单的说，我们可以把校验想象为一种二进制的校验和，一个可以告诉你其它所有字位是否正确的特殊位。在数据通信领域，奇偶校验被用来确定数据是否被正确传送。例如，对于每一个字节，我们可以简单计算数字位1的个数，并在字节内加入附加校验位。在数据的接收方，如果数字位1的个数为奇数，而我们使用的又是奇数校验的话，则说明该字节是正确的。同样对偶数校验也是如此。然而，如果数字位1的个数和校验位的奇偶性不一致的话，则说明数据在传送过程中出现了错误。 RAID系统也采用了相似的校验方法，可以在磁盘系统中创建校验块，校验块中的每一位都用来对其它关联块中的所有对应位进行校验。在数据通讯领域，虽然校验位可以告诉我们某个字节是否正确，但是无法告诉我们到底是哪一位出现了问题。这就是说我们可以检测错误，但是不能改正错误。对于RAID，这是远远不够的。固然错误的检测非常重要，但是如果不能对错误进行修复，我们就无法提高整个系统的可靠性。举个例子来说，假设我们发现校验块中第10个字节的第5位不正确。如果这个校验块包含的是另外8个数据块的校验信息，那么哪一个数据块才是问题的罪魁祸首呢?也许你可能会想为每一个数据块都建立一个校验块就可以解决问题。但是这种方法很难实现。事实上，RAID主要是借助磁盘控制器的错误报告检测错误位置，并进行修复。如果磁盘控制器在读取数据时没有发出任何“抱怨”，那么系统将会视该数据为正确数据，继续使用。 RAID 3 RAID 3采用的是一种较为简单的校验实现方式，使用一个专门的磁盘存放所有的校验数据，而在剩余的磁盘中创建带区集分散数据的读写操作。例如，在

RAID1-RAID5技术详解

RAID1-RAID5技术详解随着计算机应用的日益普及，人们对计算速度和性能的要求也逐渐提高。在一个完整的计算机系统中，CPU和内存的作用固然重要，但是数据存储设备性能的好坏和速度的快慢也直接影响到整个系统的表现。本文所要讲解的RAID技术起初主要应用于服务器高端市场，但是随着个人用户市场的成熟和发展，正不断向低端市场靠拢，从而为用户提供了一种既可以提升硬盘速度，又能够确保数据安全性的良好的解决方案。本文将对RAID技术进行较为详细的介绍，希望能够对广大读者有所帮助。入门基础 RAID是英文Redundant Array of Inexpensive Disks的缩写，中文简称为磁盘阵列。其实，从RAID的英文原意中，我们已经能够多少知道RAID就是一种由多块廉价磁盘构成的冗余阵列。虽然 RAID包含多块磁盘，但是在操作系统下是作为一个独立的大型存储设备出现。RAID技术分为几种不同的等级，分别可以提供不同的速度，安全性和性价比。人们在开发RAID时主要是基于以下设想，即几块小容量硬盘的价格总和要低于一块大容量的硬盘。虽然目前这一设想还没有成为现实，RAID在节省成本方面的作用还不是很明显，但是RAID可以充分发挥出多块硬盘的优势，实现远远超出任何一块单独硬盘的速度和吞吐量。除了性能上的提高之外，RAID还可以提供良好的容错能力，在任何一块硬盘出现问题的情况下都可以继续工作，不会受到损坏硬盘的影响。 RAID 0 我们在前文中已经提到RAID分为几种不同的等级，其中，RAID 0是最简单的一种形式。RAID 0可以把多块硬盘连接在一起形成一个容量更大的存储设备。最简单的RAID 0技术只是提供更多的磁盘空间，不过我们也可以通过设置，使用RAID 0来提高磁盘的性能和吞吐量。RAID 0没有冗余或错误修复能力，但是实现成本是最低的。

磁盘阵列技术白皮书

目录磁盘阵列基本知识 1.1磁盘阵列技术 1.1.1什么是磁盘阵列磁盘阵列是一种把若干硬磁盘驱动器按照一定要求组成一个整体，整个磁盘阵列由阵列控制器管理的系统? 冗余磁盘阵列RAID(Redundant Array of Independent Disks)技术1987年由加州大学伯克利分校提出，最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用(当时RAID称为Redundant Array of Inexpensive Disks 廉价的磁盘阵列),同时也希望采用冗余信息的方式，使得磁盘失效时不会使对数据的访问受损失，从而开发出一定水平的数据保护技术? 1.1.2磁盘阵列的工作原理与特征 RAID的基本结构特征就是组合(Striping),捆绑2个或多个物理磁盘成组，形成一个单独的逻辑盘?组合套(Striping Set)是指将物理磁盘组捆绑在一块儿?在利用多个磁盘驱动器时，组合能够提供比单个物理磁盘驱动器更好的性能提升数据是以块(Chunks)的形式写入组合套中的，块的尺寸是一个固定的值，在捆绑过程实施前就已选定?块尺寸和平均I/O需求的尺寸之间的关系决定了组合套的特性?总的来说，选择块尺寸的目的是为了最大程度地提高性能，以适应不同特点的计算环境应用. 实际的计算环境依据其不同的特点，可被划分为转换速率密集(Transfer Rate Intensive)环境或需求速率密集(Request Rate Intensive)，一个计算环境若通常服务于小的用户数量和大的I/O需求，可以被认为是转换速率密集环境，工程学和科学应用属于转换速率密集，例如CAM/CAD，图象处理和数据集合等. 一个计算环境，如果它是自然存在的多用户或在线交易系统(OLTP)，可以被认为是一个标准的需求速率密集，交互式的数据库应用能产生大量的小的I/O需求，由这些应用产生的I/O负荷可被称为需求速率密集?具备独立驱动器操作功能的组合套可提供对于需求速率密集环境来说高的性能? 对于转换速率密集，I/O需求的尺寸比块尺寸大得多，这样可导致每一个I/O需求分布于所有驱动器,数据由组合套转换的速率可以增加，因为所有的驱动器可并行地传输数据，这样,组合套就象一个单磁盘一样有非常高的容许速度? 需求速率密集中I/O需求尺寸比块尺寸小很多，这将导致每一个I/O需求落于一个单个的驱动器中，在这种情况下，由于有数个驱动器，阵列可同时处理数个需求，或者说比单磁盘快数倍. 一个单磁盘某一时刻只能满足一个处理业务，一个转换速率密集应用的阵列某一时刻虽也满足一个处理业务，但能比单磁盘转换数据速度快X倍(X是磁盘数),一个需求速率密集应用的阵列可满足的需求为单一磁盘的X倍,而其转换数据的速率与单磁盘相同. RAID的另一特征是具备数据校验(Parity)功能,校验可被描述为用于RAID级别2,3,4,5的额外的信息，当磁盘失效的情况发生时，校验功能结合完好磁盘中的数据，可以重建失效磁盘上的数据.对于RAID系统来说，在任何有害条件下绝对保持数据的完整性(Data Integrity)是最基本的要求.数据完整性指的是阵列面对磁盘失效时保持数据不丢失的能力，由于数据的破坏通常会带来灾难性的后果，所以选择RAID阵列的基础条件是它能提供什么级别的数据完整性此外，数据可用性(Data Availability)也是RAID系统的指标之一，数据可用性指的是阵列内部容错能力的水平，数据可用性程度越高，可被理解为当发生越多的部件失效时而数据访问仍不丢失.一个RAID阵列能提供的高可用性级别范围可从简单的磁盘冗余到所有部件的冗余性.当选择一个阵列时，重要的是了解所选的设备是否能够满足期望的可使用时间目标. RAID阵列能够适应不同环境，在不同类型的主机之间以及操作系统之间移动一个RAID阵列的能力越高，一般说来，可带来更好的投资保护?