RAID
- 格式:doc
- 大小:78.50 KB
- 文档页数:5
RAID简介及分类讲解RAID(Redundant Array of Inexpensive Disk),有“廉价磁盘冗余阵列“之意。
RAID 的基本原理是把多个便宜的小磁盘组合到一起,成为一个容量巨大的磁盘组。
随着硬盘技术的快速发展,单块硬盘的容量在不断增加,但成本却在迅速下降,RAID最初“将多个容量较小的、相对廉价的硬盘进行组合替代昂贵的大硬盘使用”这一目的已经失去意义,所以后来将“Redundant Array of Inexpensive Disk”这一名称中的“Inexpensive (廉价)”换成了"independent(独立)”,简称依然是RAID意义却已经发生了改变,现在为“独立冗余磁盘阵列”之意。
RAID和单个硬盘相比除了性能上的提高之外,还可以提供良好的容错能力,RAID在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。
目前实现 RAID可以采用两种方法:一种是基于硬件的RAID技术和另一种是基于软件的RAID技术。
基于硬件的RAID需要RAID控制器才能实现,RAID控制器也称为RAID卡。
除了使用RAID卡或者主板所带的芯片实现磁盘阵列外,还可以在一些操作系统中直接利用软件方式实现RAID功能,如windows系统中就内置了RAID功能。
但是,为了使用软件RAID功能,首先必须将基本磁盘转换为动态磁盘。
一般常用的RAID阶层有NRAID,JBOD,RAID 0、RAID1、RAID 2、RAID 3、RAID 4、 RAID 5、 RAID 6以及RAID7,再加上二合一型 RAID 0+1(或称RAID 10)。
NRAID:即Non-RAID,所有磁盘的容量组合成一个逻辑盘,没有数据块分条。
NRAID不提供数据冗余。
要求至少一个磁盘。
JBOD:代表Just a Bunch of Drives,磁盘控制器把每个物理磁盘看作独立的磁盘,因此每个磁盘都是独立的逻辑盘。
一.什么是RAID:RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
RAID磁盘阵列(Redundant Array of Independent Disks)简单地解释,就是将N台硬盘通过RAID Controller(分Hardware,Software)结合成虚拟单台大容量的硬盘使用,其特色是N台硬盘同时读取速度加快及提供容错性Fault Tolerant,所以RAID是当成平时主要访问Data的Storage不是Backup Solution。
在RAID有一基本概念称为EDAP(Extended Data Availability and Protection),其强调扩充性及容错机制,也是各家厂商如:Mylex,IBM,HP,Compaq,Adaptec,Infortrend等诉求的重点,包括在不须停机情况下可处理以下动作:RAID 磁盘阵列支援自动检测故障硬盘;RAID 磁盘阵列支援重建硬盘坏轨的资料;RAID 磁盘阵列支援支持不须停机的硬盘备援 Hot Spare;RAID 磁盘阵列支援支持不须停机的硬盘替换 Hot Swap;RAID 磁盘阵列支援扩充硬盘容量等。
一旦RAID阵列出现故障,硬件服务商只能给客户重新初始化或者REBUILD,这样客户数据就会无法挽回。
因此对RAID0、RAID1、RAID5以及组合型的RAID系列磁盘阵列数据恢复,出现故障以后只要不对阵列作初始化操作,就有机会恢复出故障RAID磁盘阵列的数据。
二.关于RAID的技术规范介绍(1)RAID技术规范简介冗余磁盘阵列技术最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
RAID最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
早期的RAID方案主要针对SCSI硬盘系统,系统成本比较昂贵。
1993年,HighPoint公司推出了第一款IDE-RAID控制芯片,能够利用相对廉价的IDE硬盘来组建RAID系统,从而大大降低了RAID的“门槛”。
从此,个人用户也开始关注这项技术,因为硬盘是现代个人计算机中发展最为“缓慢”和最缺少安全性的设备,而用户存储在其中的数据却常常远超计算机的本身价格。
在花费相对较少的情况下,RAID技术可以使个人用户也享受到成倍的磁盘速度提升和更高的数据安全性。
目前,IDE/SATA接口标准的硬盘都可以支持RAID技术,不过一般主板芯片组支持的主板只能支持SATA硬盘组建RAID。
简单点说,RAID的功能就是把多个硬盘组合成为一个逻辑磁区,因此,操作系统只会把它当作一个硬盘。
RAID系统的类型有多种方式,如RAID-0,RAID-1,RAID-2,RAID-3,RAID-4,RAID-5,RAID-6,RAID-10,RAID-53等。
下面我们分别来看看这些RAID类型的区别以及用途:RAID 0将多个磁盘合并成一个大的磁盘,不具有冗余,并行I/O,速度最快。
RAID 0亦称为带区集。
它是将多个磁盘并列起来,成为一个大磁盘。
在存放数据时,其将数据按磁盘的个数来进行分段,然后同时将这些数据写进这些盘中。
所以,在所有的级别中,RAID 0的速度是最快的。
但是RAID 0没有冗余功能,如果一个磁盘(物理)损坏,则所有的数据都会丢失。
raid技术详解(raid大全)一、RAID 概述1988 年美国加州大学伯克利分校的 D. A. Patterson 教授等首次在论文“A Case of Redundant Array of Inexpensive Disks”中提出了 RAID 概念[1] ,即廉价冗余磁盘阵列( Redundant Array of Inexpensive Disks )。
由于当时大容量磁盘比较昂贵, RAID 的基本思想是将多个容量较小、相对廉价的磁盘进行有机组合,从而以较低的成本获得与昂贵大容量磁盘相当的容量、性能、可靠性。
随着磁盘成本和价格的不断降低, RAID 可以使用大部分的磁盘,“廉价”已经毫无意义。
因此, RAID 咨询委员会( RAID Advisory Board, RAB )决定用“独立”替代“廉价”,于时 RAID 变成了独立磁盘冗余阵列( Redundant Array of Independent Disks )。
但这仅仅是名称的变化,实质内容没有改变。
RAID 这种设计思想很快被业界接纳, RAID 技术作为高性能、高可靠的存储技术,已经得到了非常广泛的应用。
RAID 主要利用数据条带、镜像和数据校验技术来获取高性能、可靠性、容错能力和扩展性,根据运用或组合运用这三种技术的策略和架构,可以把 RAID 分为不同的等级,以满足不同数据应用的需求。
D. A. Patterson 等的论文中定义了 RAID1-RAID5 原始 RAID 等级, 1988 年以来又扩展了 RAID0 和 RAID6 。
近年来,存储厂商不断推出诸如 RAID7 、 RAID10/01 、 RAID50 、 RAID53 、 RAID100 等 RAID 等级,但这些并无统一的标准。
目前业界公认的标准是 RAID0-RAID5 ,除 RAID2外的四个等级被定为工业标准,而在实际应用领域中使用最多的 RAID 等级是RAID0 、 RAID1 、 RAID3 、 RAID5 、 RAID6 和 RAID10。
常用raid分类及优缺点总结RAID(redundant array of independent disks),独立磁盘冗余阵列。
单个硬盘无法满足大量数据存储和数据安全性的需求,RAID将多个独立的物理硬盘按照一定方式(RAID级别)组合在一起,形成一个大的逻辑盘,提高了数据读写速度、可靠性、存储能力及容错能力。
RAID分类软RAID无独立的RAID控制卡,由操作系统和CPU来实现所有的RAID功能。
占用CPU资源,如果操作系统出现故障,则RAID信息会丢失,RAID功能将不可用。
跟硬RAID比性能差,但成本低。
硬RAID拥有独立的RAID控制卡,通过RAID卡实现所有的RAID功能,不占用CPU资源。
性能好,但成本高。
常用RAID级别优缺点及适用场景RAID主要利用数据条带、镜像和数据校验技术来获取高读写、可靠性及容错能力,根据组合方式的不同,可以把RAID分为不同的级别。
JBODJBOD(Just a Bunch Of Disks),磁盘簇、简单磁盘捆绑或Span。
JBOD并非标准的RAID级别,不能提供RAID带来的高读写、可靠性及容错能力。
JBOD是在逻辑上把几个物理磁盘串联到一起,从而提供一个大的逻辑磁盘。
存储数据时从第一个磁盘开始存储,当第一个磁盘的存储空间用完后,再依次从后面的磁盘开始存储数据。
存取性能等同于对单一磁盘的存取操作,不提供数据安全保障,它只是简单的提供一种利用磁盘空间的方法。
JBOD的低成本是它的主要优势。
RAID 0数据条带化,无校验,不提供数据保护。
数据并发写入多个硬盘。
优点1.所有RAID中读写性能最高2.100%的磁盘空间利用率缺点不提供数据冗余保护,一旦数据损坏,将无法恢复。
适用场景RAID 0适用于迅速读写,但对数据安全性和可靠性要求不高的场景,如视频、打印等。
RAID 1数据镜像,无校验。
一半的空间存储冗余数据,所有RAID中数据安全性最高。
优点1.所有的RAID中安全性最高,即使有一半的磁盘发生故障,仍能正常运转。
RAID介绍(各种RAID详细讲解)RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
过去RAID一直是高档服务器才有缘享用,一直作为高档SCSI硬盘配套技术作应用。
近来随着技术的发展和产品成本的不断下降,IDE硬盘性能有了很大提升,加之RAID芯片的普及,使得RAID也逐渐在个人电脑上得到应用。
那么为何叫做冗余磁盘阵列呢?冗余的汉语意思即多余,重复。
而磁盘阵列说明不仅仅是一个磁盘,而是一组磁盘。
这时你应该明白了,它是利用重复的磁盘来处理数据,使得数据的稳定性得到提高。
RAID的工作原理RAID如何实现数据存储的高稳定性呢?我们不妨来看一下它的工作原理。
RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的。
整个的RAID结构是一些磁盘结构,通过对磁盘进行组合达到提高效率,减少错误的目的,不要因为这么多名词而被吓坏了,它们的原理实际上十分简单。
问了便于说明,下面示意图中的每个方块代表一个磁盘,竖的叫块或磁盘阵列,横称之为带区。
RAID 0:无差错控制的带区组要实现RAID0必须要有两个以上硬盘驱动器,RAID0实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。
因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。
如果刚好所需要的数据在不同的驱动器上效率最好。
它不需要计算校验码,实现容易。
它的缺点是它没有数据差错控制,如果一个驱动器中的数据发生错误,即使其它盘上的数据正确也无济于事了。
RAID 1:镜象结构
raid1
对于使用这种RAID1结构的设备来说,RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。
通过下面的结构图您也可以看到必须有两个驱动器。
因为是镜象结构在一组盘出现问题时,可以使用镜象,提高系统的容错能力。
它比较容易设计和实现。
每读一次盘只能读出一块数据,也就是说数据块传送速率与单独的盘的读取速率相同。
因为RAID1的校验十分完备,因此对系统的处理能力有很大的影响,通常的RAID功能由软件实现,而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。
当您的系统需要极高的可靠性时,如进行数据统计,那么使用RAID1比较合适。
而且RAID1技术支持“热替换”,即不断电的情况下对故障磁盘进行更换,更换完毕只要从镜像盘上恢复数据即可。
当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。
镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,RAID 1的数据安全性在所有的RAID级别上来说是最好的。
但是其磁盘的利用率却只有50%,是所有RAID级别中最低的。
RAID2:带海明码校验
从概念上讲,RAID 2同RAID 3类似,两者都是将数据条块化分布于不同的硬盘上,条块单位为位或字节。
然而RAID 2 使用一定的编码技术来提供错误检查及恢复。
这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂。
因此,在商业环境中很少使用。
下图左边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上,具体情况请见下图。
由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。
它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码E CC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。
没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。
输出数据的速率与驱动器组中速度最慢的相等。
RAID3:带奇偶校验码的并行传送
raid3
这种校验码与RAID2不同,只能查错不能纠错。
它访问数据时一次处理一个带区,这样可以提高读取和写入速度,它像RAID 0一样以并行的方式来存放数据,但速度没有RAID 0快。
校验码在写入数据时产生并保存在另一个磁盘上。
需要实现时用户必须要有三个以上的驱动器,写入速率与读出速率都很高,因为校验位比较少,因此计算时间相对而言比较少。
用软件实现RAID控制将是十分困难的,控制器的实现也不是很容易。
它主要用于图形(包括动画)等要求吞吐率比较高的场合。
不同于RAID 2,RAID 3使用单块磁盘存放奇偶校验信息。
如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。
如果奇偶盘失效,则不影响数据使用。
RAID 3对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。
利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为n-1。
RAID4:带奇偶校验码的独立磁盘结构
raid4
RAID4和RAID3很象,不同的是,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。
在图上可以这么看,RAID3是一次一横条,而RAID4一次一竖条。
它的特点的RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
RAID5:分布式奇偶校验的独立磁盘结构
RAID5清晰图片
从它的示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的p0代表第0带区的奇偶校验值,其它的意思也相同。
RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
因为奇偶校验码在不同的磁盘上,所以提高了可靠性,允许单个磁盘出错。
RAID 5也是以数据的校验位来保证数据的安全,但它不是以单独硬盘来存放数据的校验位,而是将数据段的校验位交互存放于各个硬盘上。
这样,任
何一个硬盘损坏,都可以根据其它硬盘上的校验位来重建损坏的数据。
硬盘的利用率为n-1。
但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID 3 与RAID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。
而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。
在RAID 5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID-5的话,优点是提供了冗余性(支持一块盘掉线后仍然正常运行),磁盘空间利用率较高(N-1/N),读写速度较快(N-1倍)。
RAID5最大的好处是在一块盘掉线的情况下,RAID照常工作,相对于RAID0必须每一块盘都正常才可以正常工作的状况容错性能好多了。
因此RAID5是RAID级别中最常见的一个类型。
RAID5校验位即P位是通过其它条带数据做异或(xor)求得的。
计算公式为P=D0xorD1xorD2…xorDn,其中p代表校验块,Dn代表相应的数据块,xor是数学运算符号异或。