RAID校验技术
- 格式:pdf
- 大小:277.45 KB
- 文档页数:5
数据库存储的关键技术 raid一、RAID的概述RAID(Redundant Array of Inexpensive Disks)是一种数据存储技术,通过将多个磁盘组合起来形成一个逻辑上的单个磁盘,提高数据的可靠性和性能。
二、RAID的类型1. RAID 0:条带化存储,将数据分块存储到不同的物理磁盘上,提高读写速度。
但是如果其中一个磁盘损坏,则所有数据都无法恢复。
2. RAID 1:镜像存储,将数据同时写入两个物理磁盘中,当一个磁盘损坏时可以从另一个磁盘中恢复数据。
3. RAID 5:带奇偶校验的条带化存储,将数据分块存储到不同的物理磁盘上,并在每个块中加入奇偶校验信息。
当其中一个磁盘损坏时可以通过奇偶校验信息恢复数据。
4. RAID 6:带双重奇偶校验的条带化存储,与RAID 5类似但加入了额外的奇偶校验信息以提高容错能力。
三、RAID的实现方式1. 硬件RAID:使用专门设计的硬件卡来实现RAID功能,具有较高的性能和可靠性,但价格较高。
2. 软件RAID:使用操作系统提供的软件来实现RAID功能,成本较低但性能和可靠性不如硬件RAID。
四、RAID的应用场景1. 数据库服务器:数据库存储对数据的可靠性要求非常高,使用RAID 可以提高数据的容错能力和读写速度。
2. 大型文件服务器:大型文件服务器需要处理大量数据并保证数据的完整性,使用RAID可以提高读写速度和容错能力。
3. 视频监控系统:视频监控系统需要长期存储大量视频数据,并且要保证数据的完整性和可靠性,使用RAID可以提高容错能力和读写速度。
五、RAID的注意事项1. RAID并不是万无一失的,当多个磁盘同时损坏时仍然会导致数据丢失。
2. 在使用RAID时需要选择合适的类型和实现方式,并进行正确配置和管理。
3. 使用硬件RAID时需要注意兼容性问题,不同厂商的硬件卡可能存在兼容性问题。
4. 在进行磁盘更换时需要按照正确的步骤进行操作,否则可能会导致数据丢失。
RAID⼏种⽅式RAID(Redundant Array of Independent Disk 独⽴冗余磁盘阵列)技术是加州⼤学伯克利分校1987年提出,最初是为了组合⼩的廉价磁盘来代替⼤的昂贵磁盘,同时希望磁盘失效时不会使对数据的访问受损失⽽开发出⼀定⽔平的数据保护技术。
RAID就是⼀种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为⼀个独⽴的⼤型存储设备出现。
RAID可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增⼤容量,提供容错功能够确保数据安全性,易于管理的优点,在任何⼀块硬盘出现问题的情况下都可以继续⼯作,不会受到损坏硬盘的影响。
RAID 为 Redundant Array of Indepent Disks (独⽴磁盘冗余阵列) 的缩写,最常⽤的四种RAID为 RAID 0、RAID 1、RAID 5、RAID 10,下⾯以图解的⽅式解释这四种RAID的特点和区别。
在后⾯的图⽰中,⽤到以下标识:A,B,C,D,E和F - 表⽰数据块p1,p2,p3 - 表⽰奇偶校验信息块RAID 0RAID 0的特点:最少需要两块磁盘数据条带式分布没有冗余,性能最佳(不存储镜像、校验信息)不能应⽤于对数据安全性要求⾼的场合RAID 1以下为RAID 1的特点:最少需要2块磁盘提供数据块冗余性能好RAID 5RAID 5特点:最少3块磁盘数据条带形式分布以奇偶校验作冗余适合多读少写的情景,是性能与数据冗余最佳的折中⽅案RAID 10RAID 10(⼜叫RAID 1+0)特点:最少需要4块磁盘先按RAID 0分成两组,再分别对两组按RAID 1⽅式镜像兼顾冗余(提供镜像存储)和性能(数据条带形分布)在实际应⽤中较为常⽤RAID 0即Data Stripping(数据分条技术)。
整个逻辑盘的数据是被分条(stripped)分布在多个物理磁盘上,可以并⾏读/写,提供最快的速度,但没有冗余能⼒。
要求⾄少两个磁盘。
raid技术详解(raid大全)一、RAID 概述1988 年美国加州大学伯克利分校的 D. A. Patterson 教授等首次在论文“A Case of Redundant Array of Inexpensive Disks”中提出了 RAID 概念[1] ,即廉价冗余磁盘阵列( Redundant Array of Inexpensive Disks )。
由于当时大容量磁盘比较昂贵, RAID 的基本思想是将多个容量较小、相对廉价的磁盘进行有机组合,从而以较低的成本获得与昂贵大容量磁盘相当的容量、性能、可靠性。
随着磁盘成本和价格的不断降低, RAID 可以使用大部分的磁盘,“廉价”已经毫无意义。
因此, RAID 咨询委员会( RAID Advisory Board, RAB )决定用“独立”替代“廉价”,于时 RAID 变成了独立磁盘冗余阵列( Redundant Array of Independent Disks )。
但这仅仅是名称的变化,实质内容没有改变。
RAID 这种设计思想很快被业界接纳, RAID 技术作为高性能、高可靠的存储技术,已经得到了非常广泛的应用。
RAID 主要利用数据条带、镜像和数据校验技术来获取高性能、可靠性、容错能力和扩展性,根据运用或组合运用这三种技术的策略和架构,可以把 RAID 分为不同的等级,以满足不同数据应用的需求。
D. A. Patterson 等的论文中定义了 RAID1-RAID5 原始 RAID 等级, 1988 年以来又扩展了 RAID0 和 RAID6 。
近年来,存储厂商不断推出诸如 RAID7 、 RAID10/01 、 RAID50 、 RAID53 、 RAID100 等 RAID 等级,但这些并无统一的标准。
目前业界公认的标准是 RAID0-RAID5 ,除 RAID2外的四个等级被定为工业标准,而在实际应用领域中使用最多的 RAID 等级是RAID0 、 RAID1 、 RAID3 、 RAID5 、 RAID6 和 RAID10。
RAID简介——RAID 的英文全称为Redundant Array of Inexpensive(或Independent)Disks,中文名称是廉价(独立)磁盘冗余阵列。
RAID 的初衷主要是为了大型服务器提供高端的存储功能和冗余的数据安全。
在系统中,RAID 被看作是一个逻辑分区,但是它是由多个硬盘组成的(最少两块)。
它通过在多个硬盘上同时存储和读取数据来大幅提高存储系统的数据吞吐量(Throughput),而且在很多RAID 模式中都有较为完备的相互校验/恢复的措施,甚至是直接相互的镜像备份,从而大大提高了RAID 系统的容错度,提高了系统的稳定冗余性,这也是Redundant 一词的由来。
RAID通俗的说就是通过将多个存储设备按照一定的形式和方案组织起来,如同使用一个硬盘一样但是却通过这样的形式获取了比单个存储设备更高的速度、更好的稳定性、更大的存储能力的存储设备的解决方案。
根据你的需要不同,可以采用不同形式以及不同价格(从几千元到上百万元)的RAID解决方案--很显然,越好的RAID系统,价格越昂贵,所以几乎没有最好的RAID系统。
另外,选择Raid系统要适应不同的应用程序。
一般来说RAID是用于比较昂贵的服务器系统中的。
不过,随着便宜的RAID控制器的出现,它已经渐渐向市场主流发展了。
当然在目前的主流市场实现RAID有一定的局限性,它并不适用于每一个人。
优点——传输速率高:在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个磁盘驱动器几倍、几十倍甚至上百倍的速率。
这是RAID最初想要解决的问题。
因为CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以RAID 解决了。
可以提供容错功能。
这是使用RAID的第二个原因,因为普通磁盘驱动器无法提供容错功能,如果不包括写在磁盘上的CRC(循环冗余校验)码的话。
RAID7工作原理RAID(冗余阵列独立磁盘)是一种数据存储技术,旨在提供数据冗余和容错能力,以提高数据的可靠性和性能。
RAID7是RAID技术的一种进化版本,它结合了RAID5和RAID6的特点,具有更高的容错能力和性能。
RAID7采用分布式奇偶校验技术,将数据和奇偶校验信息分布存储在多个磁盘上。
它通常由至少3个磁盘驱动器组成,其中一个磁盘用于存储奇偶校验信息。
RAID7使用奇偶校验信息来恢复数据,即使多个磁盘发生故障,也可以保持数据的完整性。
RAID7的工作原理如下:1. 数据分块:首先,将输入数据分成固定大小的块,每个块通常为512字节或更大。
这些数据块被编号,并按顺序写入多个磁盘驱动器。
2. 奇偶校验计算:对于每个数据块,RAID7使用分布式奇偶校验算法计算奇偶校验信息。
奇偶校验信息是通过对数据块进行异或运算得到的。
3. 数据分布:RAID7将数据块和奇偶校验信息分布存储在多个磁盘上。
数据块和奇偶校验信息被交错存储,以增加数据的可靠性和性能。
4. 冗余容错:RAID7使用多个磁盘来存储冗余数据,以提供容错能力。
当一个磁盘发生故障时,RAID7可以使用奇偶校验信息来恢复丢失的数据。
5. 数据恢复:当一个磁盘故障时,RAID7可以使用奇偶校验信息来恢复丢失的数据。
它通过对其他磁盘上的数据块进行异或运算来计算丢失数据块的值。
6. 容量利用率:RAID7的容量利用率取决于奇偶校验信息的存储方式。
如果每个数据块都有一个对应的奇偶校验块,那么容量利用率将为50%。
如果使用更高级别的奇偶校验计算方法,容量利用率可以更高。
RAID7相对于其他RAID级别的优势在于其更高的容错能力和性能。
由于使用了分布式奇偶校验算法,RAID7可以同时容忍多个磁盘故障,并能够快速恢复数据。
此外,RAID7还可以提供更高的读写性能,因为数据和奇偶校验信息可以并行访问。
总结起来,RAID7是一种具有高容错能力和性能的数据存储技术。
RAID5的原理及应用简介RAID(Redundant Array of Independent Disks)是一种通过数据分布在多个磁盘上的方式来提高存储系统性能和数据可靠性的技术。
RAID5是其中一种常见的RAID级别,通过数据条带化和奇偶校验来实现数据的冗余和提供读写性能的增强。
本文将介绍RAID5的原理及其在实际应用中的使用。
原理RAID5通过将数据分散存储在多个磁盘上,并使用奇偶校验码来实现数据冗余和恢复。
具体原理如下:1.数据条带化:RAID5将每个数据条带分散地存储在不同的磁盘上,这样可以提高读取性能,同时也提高了写入的并发能力。
每个数据条带都包含和其他磁盘上的数据条带进行异或运算得到的奇偶校验码。
2.奇偶校验:RAID5通过使用奇偶校验码来实现对数据的冗余和恢复。
奇偶校验码是通过对其他磁盘上的数据条带进行异或运算得到的。
当其中一个磁盘发生故障时,可以通过奇偶校验码来恢复数据。
例如,如果一个数据条带发生故障,可以通过对其他数据条带进行异或运算得到丢失的数据条带。
3.容错性:RAID5通过使用奇偶校验码提供了冗余的数据备份。
当其中一个磁盘发生故障时,系统仍然可以继续工作,并且可以通过奇偶校验码进行数据的恢复。
RAID5至少需要3个磁盘才能提供冗余和恢复功能。
4.性能:RAID5在读取方面相对于单个磁盘有较好的性能提升,因为数据可以同时从多个磁盘读取。
但在写入方面的性能相对较弱,因为写入操作需要进行奇偶校验码的重新计算。
应用RAID5广泛应用于许多存储系统,特别是需要同时提供高性能和数据冗余的场景。
以下是一些常见的RAID5应用领域:1.企业存储:许多企业使用RAID5来构建存储区域网络(SAN)或网络附加存储(NAS)系统。
RAID5在提供高性能读取能力的同时,通过奇偶校验提供数据的冗余,保护数据免受硬件故障的影响。
2.数据中心:大型数据中心通常使用RAID5来构建存储集群,以提供数据冗余和高可用性。
RAID校验方式是指数据在写入RAID系统时,将写入的数据按照某种方式进行组合和处理,形成一个校验数据,并将其同时写入RAID 系统的各个磁盘中。
通过这种方式,RAID系统可以在出现数据错误或磁盘故障时,通过校验数据进行检测和修复,从而保证数据的完整性和可靠性。
在常见的RAID校验方式中,最常用的是奇偶校验和循环冗余校验(CRC)。
奇偶校验通过在数据中增加一位校验码来进行校验。
对于每个写入的数据块,奇偶校验只需要增加一个字节的校验码即可,但这种校验方式对于错误的定位和修正能力较弱,只适用于数据量较小的情况。
循环冗余校验(CRC)则通过计算数据块中所有数据位的异或值,得到一个校验码。
在写入数据时,将校验码与数据块一起写入RAID 系统的各个磁盘中。
当需要校验数据是否正确时,只需要将每个磁盘中的数据块和校验码进行异或运算,如果得到的校验码与预期的校验码相同,则表示数据没有错误,反之则表示数据有错误。
除了奇偶校验和循环冗余校验,还存在一些其他的RAID校验方式,如B+校验、海明校验等。
其中,B+校验是通过将数据块按照一定的方式进行分割,然后将每个子数据块分别进行奇偶校验,再将所有子数据块的校验结果进行组合和处理,得到一个校验数据。
这种方式适用于数据量较大的情况,但其复杂度较高,需要较多的计算时间。
海明校验则是一种基于奇偶校验和CRC的混合校验方式,能够提供更好的错误定位和修正能力。
总之,RAID校验方式是保证RAID系统数据可靠性和容错能力的关键技术。
在实际应用中,需要根据实际需求选择合适的校验方式,以提高数据的可靠性和容错能力。
RAID6校验方式1. 介绍RAID(冗余磁盘阵列)是一种通过将多个硬盘组合起来来提供更高性能和更高容错能力的存储技术。
RAID6是RAID级别中的一种,它在提供数据冗余和容错能力方面比其他级别更强大。
RAID6采用了两个以上的校验盘,使得系统可以同时容忍两个磁盘故障而不会导致数据丢失。
它通过在数据块中添加额外的校验信息实现这一点。
本文将详细介绍RAID6的校验方式,并探讨其优缺点以及适用场景。
2. 校验方式RAID6使用了一种称为P+Q校验的方式来提供冗余和容错能力。
具体来说,它使用了与RAID5类似的奇偶校验方法,但添加了额外的Q盘用于纠正两个磁盘故障。
首先,RAID6将输入数据分成多个块,并将这些块分别存储在不同的硬盘上。
然后,对于每个块,它计算出一个奇偶校验值P,并将其存储到一个特定的P盘上。
此外,还计算出一个额外的校验值Q,并将其存储到一个特定的Q盘上。
P和Q的计算方式如下:•P值是对所有数据块的异或运算结果。
•Q值是对所有数据块以及P值的异或运算结果。
通过这种方式,RAID6可以在两个磁盘故障的情况下恢复数据。
当发生磁盘故障时,系统可以使用其余的数据块以及P和Q值来重建丢失的数据。
3. 冗余和容错能力RAID6具有比其他RAID级别更高的冗余和容错能力。
由于采用了两个校验盘,它可以同时容忍两个磁盘故障而不会导致数据丢失。
当发生单个磁盘故障时,系统可以使用剩余的数据块和校验信息来重建丢失的数据。
当发生多个磁盘故障时,系统仍然可以通过使用其余的数据块以及P和Q值来重建丢失的数据。
因此,RAID6提供了更高级别的可靠性和容错能力,使得用户在硬件故障发生时不会丢失重要数据。
4. 性能影响尽管RAID6提供了更高级别的冗余和容错能力,但它的写入性能相对较低。
这是因为在写入数据时,系统需要计算并更新P和Q值。
特别是在进行小数据块写入时,RAID6的性能影响更加显著。
由于需要进行多次校验计算,写入操作可能会变得较慢。
RAID中的校验技术何谓RAID?RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
过去RAID一直是高档服务器才有缘享用,一直作为高档SCSI硬盘配套技术作应用。
近来随着技术的发展和产品成本的不断下降,IDE硬盘性能有了很大提升,加之RAID芯片的普及,使得RAID也逐渐在个人电脑上得到应用。
那么为何叫做冗余磁盘阵列呢?冗余的汉语意思即多余,重复。
而磁盘阵列说明不仅仅是一个磁盘,而是一组磁盘。
这时你应该明白了,它是利用重复的磁盘来处理数据,使得数据的稳定性得到提高。
RAID的工作原理RAID如何实现数据存储的高稳定性呢?我们不妨来看一下它的工作原理。
RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的。
整个的RAID结构是一些磁盘结构,通过对磁盘进行组合达到提高效率,减少错误的目的,不要因为这么多名词而被吓坏了,它们的原理实际上十分简单。
为了便于说明,下面示意图中的每个方块代表一个磁盘,竖的叫块或磁盘阵列,横称之为带区。
RAID规范主要包含RAID 0~RAID 7等数个规范,它们的侧重点各不相同,常见的规范有如下几种:RAID 0:无差错控制的带区组要实现RAID0必须要有两个以上硬盘驱动器,RAID0实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。
因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。
如果刚好所需要的数据在不同的驱动器上效率最好。
它不需要计算校验码,实现容易。
RAID标准主要分为以下几个等级:
RAID 0:通过数据条带化技术,将数据均匀地分布到多个磁盘上,提高了数据传输速度和存储效率。
RAID 1:通过数据镜像技术,将数据完全一致地分别写到工作磁盘和镜像磁盘,提高了数据可靠性和容错能力。
RAID 2:通过数据校验技术,将数据和校验码一起存储在磁盘上,能够检测和纠正数据错误。
RAID 3:通过数据条带化技术和数据校验技术,将数据和校验码分别存储在多个磁盘上,提高了数据传输速度和容错能力。
RAID 4:通过数据块级共享和校验技术,将数据和校验码分别存储在多个磁盘上,能够检测和纠正数据错误。
RAID 5:通过数据条带化技术和数据校验技术,将数据和校验码分别存储在多个磁盘上,提高了数据传输速度和容错能力。
RAID 5相比RAID 4更具有优势,因为它不需要独立的校验磁盘。
RAID 6:通过数据条带化技术和双重校验技术,将数据和两个校验码分别存储在多个磁盘上,能够检测和纠正数据错误。
除了上述标准等级外,还有一些非标准的RAID等级,如RAID 7、RAID 8等。
这些等级都有各自的特点和优势,可以根据实际需求进行选择。
RAID中的校验技术何谓RAID?RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
过去RAID一直是高档服务器才有缘享用,一直作为高档SCSI硬盘配套技术作应用。
近来随着技术的发展和产品成本的不断下降,IDE硬盘性能有了很大提升,加之RAID芯片的普及,使得RAID也逐渐在个人电脑上得到应用。
那么为何叫做冗余磁盘阵列呢?冗余的汉语意思即多余,重复。
而磁盘阵列说明不仅仅是一个磁盘,而是一组磁盘。
这时你应该明白了,它是利用重复的磁盘来处理数据,使得数据的稳定性得到提高。
RAID的工作原理RAID如何实现数据存储的高稳定性呢?我们不妨来看一下它的工作原理。
RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的。
整个的RAID结构是一些磁盘结构,通过对磁盘进行组合达到提高效率,减少错误的目的,不要因为这么多名词而被吓坏了,它们的原理实际上十分简单。
为了便于说明,下面示意图中的每个方块代表一个磁盘,竖的叫块或磁盘阵列,横称之为带区。
RAID规范主要包含RAID 0~RAID 7等数个规范,它们的侧重点各不相同,常见的规范有如下几种:RAID 0:无差错控制的带区组要实现RAID0必须要有两个以上硬盘驱动器,RAID0实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。
因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。
如果刚好所需要的数据在不同的驱动器上效率最好。
它不需要计算校验码,实现容易。
它的缺点是它没有数据差错控制,如果一个驱动器中的数据发生错误,即使其它盘上的数据正确也无济于事了。
不应该将它用于对数据稳定性要求高的场合。
如果用户进行图象(包括动画)编辑和其它要求传输比较大的场合使用RAID0比较合适。
同时,RAID可以提高数据传输速率,比如所需读取的文件分布在两个硬盘上,这两个硬盘可以同时读取。
那么原来读取同样文件的时间被缩短为1/2。
在所有的级别中,RAID 0的速度是最快的。
但是RAID 0没有冗余功能的,如果一个磁盘(物理)损坏,则所有的数据都无法使用。
RAID 1:镜象结构对于使用这种RAID1结构的设备来说,RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。
通过下面的结构图您也可以看到必须有两个驱动器。
因为是镜象结构在一组盘出现问题时,可以使用镜象,提高系统的容错能力。
它比较容易设计和实现。
每读一次盘只能读出一块数据,也就是说数据块传送速率与单独的盘的读取速率相同。
因为RAID1的校验十分完备,因此对系统的处理能力有很大的影响,通常的RAID 功能由软件实现,而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。
当您的系统需要极高的可靠性时,如进行数据统计,那么使用RAID1比较合适。
而且RAID1技术支持“热替换”,即不断电的情况下对故障磁盘进行更换,更换完毕只要从镜像盘上恢复数据即可。
当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。
镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,RAID 1的数据安全性在所有的RAID级别上来说是最好的。
但是其磁盘的利用率却只有50%,是所有RAID级别中最低的。
RAID2:带海明码校验从概念上讲,RAID 2 同RAID 3类似,两者都是将数据条块化分布于不同的硬盘上,条块单位为位或字节。
然而RAID 2 使用一定的编码技术来提供错误检查及恢复。
这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂。
因此,在商业环境中很少使用。
下图左边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上,具体情况请见下图。
由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。
它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码ECC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。
没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。
输出数据的速率与驱动器组中速度最慢的相等。
RAID3:带奇偶校验码的并行传送这种校验码与RAID2不同,只能查错不能纠错。
它访问数据时一次处理一个带区,这样可以提高读取和写入速度,它像RAID 0一样以并行的方式来存放数据,但速度没有RAID 0快。
校验码在写入数据时产生并保存在另一个磁盘上。
需要实现时用户必须要有三个以上的驱动器,写入速率与读出速率都很高,因为校验位比较少,因此计算时间相对而言比较少。
用软件实现RAID控制将是十分困难的,控制器的实现也不是很容易。
它主要用于图形(包括动画)等要求吞吐率比较高的场合。
不同于RAID 2,RAID 3使用单块磁盘存放奇偶校验信息。
如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。
如果奇偶盘失效,则不影响数据使用。
RAID 3对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。
利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为n-1。
RAID4:带奇偶校验码的独立磁盘结构RAID4和RAID3很象,不同的是,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。
在图上可以这么看,RAID3是一次一横条,而RAID4一次一竖条。
它的特点的RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
RAID5:分布式奇偶校验的独立磁盘结构从它的示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的p0代表第0带区的奇偶校验值,其它的意思也相同。
RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
因为奇偶校验码在不同的磁盘上,所以提高了可靠性,允许单个磁盘出错。
RAID 5也是以数据的校验位来保证数据的安全,但它不是以单独硬盘来存放数据的校验位,而是将数据段的校验位交互存放于各个硬盘上。
这样,任何一个硬盘损坏,都可以根据其它硬盘上的校验位来重建损坏的数据。
硬盘的利用率为n-1。
但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID 3 与RAID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。
而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。
在RAID 5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID-5的话,优点是提供了冗余性(支持一块盘掉线后仍然正常运行),磁盘空间利用率较高(N-1/N),读写速度较快(N-1倍)。
但当掉盘之后,运行效率大幅下降。
RAID5校验位算法详解P=D1 xo r D2 xor D3 … xor Dn (D1,D2,D3 … Dn为数据块,P为校验,xor为异或运算)XOR(Exclusive OR)的校验原理如下表:A值B值Xor结果0 0 01 0 10 1 11 1 0这里的A与B值就代表了两个位,从中可以发现,A与B一样时,XOR结果为0,A与B 不一样时,XOR结果就是1,如果知道XOR结果,A和B中的任何两个数值,就可以反推出剩下的一个数值。
比如A为1,XOR结果为1,那么B肯定为0,如果XOR结果为0,那么B肯定为1。
这就是XOR编码与校验的基本原理。
RAID5性能和校验信息算法从RAID5示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的p0代表第0带区的奇偶校验值,其它的意思也相同。
RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
因为奇偶校验码在不同的磁盘上,所以提高了可靠性。
但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID 3 与RAID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。
而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。
在RAID 5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID5最大的好处是在一块盘掉线的情况下,RAID照常工作,相对于RAID0必须每一块盘都正常才可以正常工作的状况容错性能好多了。
因此RAID5是RAID级别中最常见的一个类型。
RAID5校验位即P位是通过其它条带数据做异或(xor)求得的。
计算公式为P=D0xorD1xorD2…xorDn,其中p代表校验块,Dn代表相应的数据块,xor是数学运算符号异或。
RAID6:带有两种分布存储的奇偶校验码的独立磁盘结构名字很长,但是如果看到图,大家立刻会明白是为什么,请注意p0代表第0带区的奇偶校验值,而pA代表数据块A的奇偶校验值。
它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合。
当然了,由于引入了第二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。
RAID7:优化的高速数据传送磁盘结构RAID7所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性,提高系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。
允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。
可以连接多台主机,因为加入高速缓冲存储器,当多用户访问系统时,访问时间几乎接近于0。
由于采用并行结构,因此数据访问效率大大提高。
需要注意的是它引入了一个高速缓冲存储器,这有利有弊,因为一旦系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作。
当然了,这么快的东西,价格也非常昂贵。
RAID10:高可靠性与高效磁盘结构这种结构无非是一个带区结构加一个镜象结构,因为两种结构各有优缺点,因此可以相互补充,达到既高效又高速还可以的目的。
大家可以结合两种结构的优点和缺点来理解这种新结构。
这种新结构的价格高,可扩充性不好。
主要用于容量不大,但要求速度和差错控制的数据库中。
RAID 50:被称为分布奇偶位阵列条带同RAID 30相仿的,它具有RAID 5和RAID 0的共同特性。