磁盘阵列 常用RAID方案速度及数据对比
- 格式:doc
- 大小:98.50 KB
- 文档页数:4
磁盘阵列各种RAID原理磁盘使用率RAID(Redundant Array of Inexpensive Disks)是一种磁盘阵列,可以将多块普通的磁盘拼接在一起形成更高效、可靠的数据存储系统。
它可以通过将存储空间划分成若干块虚拟磁盘来提高磁盘访问性能。
存储空间划分的方式共分为9种,分别是RAID0,RAID1,RAID2,RAID3,RAID4,RAID5,RAID6,RAID7和RAID10,其中RAID 0、RAID 1、RAID 5和RAID 10是最常用的四种RAID级别。
RAID0是把多块磁盘组合成一个虚拟磁盘,通过分割、重组来提升数据的存取速度,这种RAID把多块磁盘拼接在一起形成一个虚拟磁盘,不提供数据冗余,磁盘使用率比较高,但是其可靠性较低。
RAID1是把多块相同容量的磁盘拼接在一起形成一个虚拟磁盘,不同的是,这种RAID方式采用镜像技术,每个磁盘上的数据都会与另一块磁盘上的数据完全相同,提供了更好的可靠性,磁盘使用率较低,只有一半的磁盘空间可以使用。
RAID5是一种磁盘阵列中比较常用的RAID级别,它将磁盘阵列中的磁盘分成两种,一般磁盘和校验磁盘,这样就可以在一个虚拟磁盘上存储大量数据,任一块磁盘出现问题时,系统可以通过校验磁盘上的冗余数据来恢复受损的数据,并且RAID5提供了比RAID1更高的数据存储空间,磁盘使用率也比RAID1更高。
RAID :性能增强的磁盘阵列配置方案RAID(Redundant Array of Independent Disks)是一种通过将多个硬盘组合在一起形成磁盘阵列来提高存储性能和数据冗余的技术。
RAID有不同的级别,每个级别都有不同的特点和适用场景。
在本文中,我们将重点讨论几种常见的RAID配置方案,以及它们如何增强性能。
1. RAID 0:大幅提升读写速度RAID 0是最简单的RAID级别之一,它将两个或更多的硬盘组合在一起,并将数据分割成块,然后分别写入每个硬盘。
由于数据的并行读写操作,RAID 0将大幅提升存储系统的读写速度。
然而,RAID 0没有冗余功能,一旦其中一个硬盘出现故障,所有数据都将丢失。
2. RAID 1:提供数据冗余和备份RAID 1使用镜像技术,将相同的数据同时写入两个或多个硬盘。
这样,当其中一个硬盘出现故障时,系统可以从其他硬盘中获取相同的数据。
RAID 1提供了数据的冗余和备份功能,使得系统更加可靠。
然而,RAID 1并不能提升系统的读写速度,因为所有数据都要同时写入多个硬盘。
3. RAID 5:提供读取性能和数据冗余RAID 5是一种将数据分布在多个硬盘上并提供容错能力的RAID级别。
RAID 5至少需要三个硬盘,其中一个硬盘用于存储奇偶校验信息。
奇偶校验信息允许在一个硬盘故障的情况下恢复数据。
RAID 5在读取方面具有良好的性能,但在写入方面可能会稍慢。
4. RAID 10:融合RAID 1和RAID 0的优势RAID 10是将RAID 1和RAID 0结合起来的一种配置方案,它同时提供数据冗余和读写性能的优势。
RAID 10需要至少四个硬盘,它将硬盘分成两组,每组都是一个独立的RAID 1阵列,然后将这两个RAID 1阵列组成一个RAID 0阵列。
这样做的好处是不仅可以提供数据的冗余和备份功能,还可以大幅提升系统的读写性能。
5. RAID 6:提供更高的容错能力RAID 6是在RAID 5基础上进一步增强的配置方案,它使用两个奇偶校验信息来提供更高的容错能力。
磁盘阵列RAID原理、种类及性能优缺点对比磁盘阵列(Redundant Arrays of Independent Disks,RAID)1. 存储的数据一定分片;2. 分基于软件的软RAID(如mdadm)和基于硬件的硬RAID(如RAID卡);3. RAID卡如同网卡一样有集成板载的也有独立的(PCI-e),一般独立RAID卡性能相对较好,淘宝一搜便可看到他们的原形;4. 现在基本上服务器都原生硬件支持几种常用的RAID;5. 当然还有更加高大上的专用于存储的磁盘阵列柜产品,有专用存储技术,规格有如12/24/48盘一柜等,盘可选机械/固态,3.5/2.5寸等。
近来想建立一个私有云系统,涉及到安装使用一台网络存储服务器。
对于服务器中硬盘的连接,选用哪种RAID模式能准确满足需求收集了资料,简单整理后记录如下:一、RAID模式优缺点的简要介绍目前被运用较多的RAID模式其优缺点大致是这样的:1、RAID0模式优点:在RAID 0状态下,存储数据被分割成两部分,分别存储在两块硬盘上,此时移动硬盘的理论存储速度是单块硬盘的2倍,实际容量等于两块硬盘中较小一块硬盘的容量的2倍。
缺点:任何一块硬盘发生故障,整个RAID上的数据将不可恢复。
备注:存储高清电影比较适合。
2、RAID1模式优点:此模式下,两块硬盘互为镜像。
当一个硬盘受损时,换上一块全新硬盘(大于或等于原硬盘容量)替代原硬盘即可自动恢复资料和继续使用,移动硬盘的实际容量等于较小一块硬盘的容量,存储速度与单块硬盘相同。
RAID 1的优势在于任何一块硬盘出现故障是,所存储的数据都不会丢失。
缺点:该模式可使用的硬盘实际容量比较小,仅仅为两颗硬盘中最小硬盘的容量。
备注:非常重要的资料,如数据库,个人资料,是万无一失的存储方案。
3、RAID 0+1模式RAID 0+1是磁盘分段及镜像的结合,采用2组RAID0的磁盘阵列互为镜像,它们之间又成为一个RAID1的阵列。
RAID5 和 RAID10 (性能比较和原理)20年来在存储方面,RAID 推出了一系列级别,包括RAID 0、RAID 1、RAID 2、RAID 3、RAID4、RAID 5,以及各种组合如 RAID 0+1 等。
其中最广泛的包括RAID5与RAID10。
但是一直以来,关于RAID5与RAID10的性能优劣的争端还是非常多的,甚至很多人、包括很多公司都那拿出了测试数据。
而这些测试数据复杂难懂、相互矛盾,更加让用户感到迷惑,不知道如何选择。
在这里,我将就这两种RAID的内部运行原理来分析一下,看看我们在什么情况下应当适合选哪一种RAID方式。
根据我的经验与分析:像小IO的数据库类型操作,如ERP等应用,建议采用RAID10;而大型文件存储,数据仓库,如医疗PACS系统、视频编辑系统则从空间利用的角度,建议采用RAID5。
下面请看详细的性能对比:本文分为上下两篇,上文侧重分析两种RAID的内部运行原理,下文将根据不同的影响磁盘性能的因素来分析RAID方案对磁盘系统的影响,参考“RAID5和RAID10,哪种RAID更适合你(下) ”。
为了方便对比,我这里拿同样多驱动器的磁盘来做对比,RAID5选择3D+1P的RAID方案,RAID10选择2D+2D的Raid方案,分别如图RAID5+RAID10那么,我们分析如下三个过程:读,连续写,随机写。
但是,在介绍这三个过程之前,我需要介绍另外一个磁盘阵列中的重要概念:cache.磁盘读写速度的关键之一:Cachecache技术最近几年,在磁盘存储技术上,发展的非常迅速,作为高端存储,cache已经是整个存储的核心所在,就是中低端存储,也有很大的cache存在,包括最简单的RAID 卡,一般都包含有几十,甚至几百兆的RAID cache。
cache的主要作用是什么呢?作为缓存,cache的作用具体体现在读与写两个不同的方面:作为写,一般存储阵列只要求数据写到cache就算完成了写操作,当写cache的数据积累到一定程度,阵列才把数据刷到磁盘,可以实现批量的写入。
磁盘阵列存储系统方案磁盘阵列存储系统(RAID)是一种将多个硬盘驱动器组合在一起形成一个逻辑存储单元的技术。
RAID系统通过将数据分布在多个磁盘上,提高了数据的容错性和性能。
在本文中,我们将讨论不同的RAID级别及其应用场景,以及一些常见的RAID实施方案。
一、RAID级别及应用场景1. RAID 0RAID 0将数据均衡地分布在多个磁盘上,提高了数据的读写速度。
RAID 0在需要高速数据传输但不需要数据冗余的情况下非常适用,比如视频编辑、数据备份等。
2. RAID 1RAID 1采用镜像数据的方式,将数据同时写入两个磁盘上,提高了数据的冗余性和可靠性。
RAID 1适用于对数据安全性要求较高的场景,比如数据库服务器、关键业务系统等。
3. RAID 5RAID 5将数据进行条带化分布,并在每个数据条带上计算校验信息,提高了数据的容错性。
RAID 5适用于需要高容错性和相对较高读写性能的环境,比如文件服务器、电子邮件服务器等。
4. RAID 6RAID 6在RAID 5的基础上增加了一个额外的校验盘,提供更高的容错性。
RAID 6适用于对数据安全性要求非常高的场景,比如金融交易系统、医疗信息系统等。
5. RAID 10RAID 10将RAID 1和RAID 0结合起来,通过将磁盘分为多组进行数据镜像和条带化分布,提供了高容错性和高性能。
RAID 10适用于对性能和数据安全性都有较高要求的应用,比如虚拟化服务器、数据库集群等。
二、常见的RAID实施方案1. 硬件RAID硬件RAID是通过专用的RAID控制器来实现的,具有自己的处理器和缓存,可以提供更高的性能和可靠性。
硬件RAID通常需要使用指定的RAID控制卡,并且成本较高。
2. 软件RAID软件RAID是利用操作系统提供的RAID功能来实现的,不需要额外的硬件设备,适用于小型企业或个人用户。
软件RAID的性能和可靠性相对较低,但成本较低。
3. 储存阵列网络(SAN)SAN是一种集中式的储存解决方案,将多个服务器连接到共享的存储设备上。
磁盘阵列的不同级别及其特点磁盘阵列(RAID,Redundant Array of Independent Disks)技术是一种将多个物理硬盘组合在一起,以提高数据存储和处理的性能、可靠性和容错性的技术。
磁盘阵列通过分割、复制和分布数据,以实现数据的并行读写和冗余备份。
不同的磁盘阵列级别提供了不同的数据保护和性能方案,适用于不同的应用场景。
本文将针对不同级别的磁盘阵列,分别介绍其特点和适用场景。
1. RAID 0RAID 0级别使用条带化的数据分布方式(striping),将数据分散存储在多个硬盘上,提供了更快的读写性能。
数据被拆分成固定大小的块,然后块按照顺序分布在不同的硬盘上。
由于数据同时存储在多个硬盘上,RAID 0可以实现并行读写,从而提高了整体的数据传输速度。
然而,RAID 0并不提供冗余备份和容错能力。
任一硬盘的故障都会导致整个阵列不可用,并且无法恢复数据。
因此,RAID 0通常用于对性能需求较高而对数据可靠性没有特别要求的场景,如视频编辑和游戏开发等。
2. RAID 1RAID 1级别通过镜像数据的方式提供冗余备份。
每个数据块都被复制到至少两个硬盘上,确保在其中一个硬盘故障时仍然可以通过另一个硬盘访问数据。
RAID 1具有很高的数据可靠性和容错性,但相比RAID 0,写入性能有所降低。
RAID 1适用于对数据保护较为重视的场景,如企业级存储和数据库服务器。
但需要注意的是,RAID 1并不能提供增加存储空间的功能,因为每个数据块都需要镜像存储。
3. RAID 5RAID 5级别结合了条带化和分布式奇偶校验(parity)的方式实现数据的分布存储和冗余备份。
RAID 5需要至少三个硬盘,并将奇偶校验信息按照轮换的方式存储在不同的硬盘上,以保证阵列中同时容忍一次硬盘故障。
当读取数据时,RAID 5可以通过奇偶校验信息恢复任何一个硬盘上的数据。
而在硬盘故障时,阵列可以通过奇偶校验信息实现数据的重建和恢复。
磁盘阵列方案1. 简介磁盘阵列是一种将多个磁盘组合在一起,形成一个逻辑上的单个存储单元的技术。
通过磁盘阵列,可以提高数据的可靠性和性能。
本文将介绍几种常见的磁盘阵列方案,包括RD 0、RD 1、RD 5和RD 10,并比较它们的优缺点。
2. RD 0RD 0,也称为条带化,是一种将数据分散存储在多个磁盘上的方案。
数据被分成多个块,并在不同的磁盘上同时写入。
由于数据分散在多个磁盘上,因此RD 0可以显著提高数据的读写速度。
然而,RD 0没有冗余,当一个磁盘故障时,所有数据都将丢失。
RD 0的配置方式如下:- 最少需要两个磁盘- 所有磁盘容量必须一致- 所有磁盘容量将相加,形成一个逻辑上的单个存储单元RD 0的优点包括:•提供高性能的读写速度•容量利用率高,不会浪费存储空间RD 0的缺点包括:•没有冗余,一个磁盘故障会导致数据丢失•可靠性低,系统的可用性不如其他RD级别3. RD 1RD 1,也称为镜像,是一种将数据在多个磁盘上完全复制的方案。
每个数据块都会被同时写入两个磁盘,因此当一个磁盘故障时,数据仍然可以从另一个磁盘恢复。
RD 1提供了最高的数据可靠性,但与RD 0相比,读写性能稍微降低。
RD 1的配置方式如下:- 最少需要两个磁盘- 所有磁盘容量相同- 所有磁盘上的数据完全相同RD 1的优点包括:•提供最高的数据可靠性•可以容忍一个磁盘故障,数据不会丢失•读取性能较高,因为可以从多个磁盘同时读取RD 1的缺点包括:•写入性能较低,因为数据需要同时写入多个磁盘•相对高的成本,因为需要多个磁盘提供冗余存储4. RD 5RD 5是一种在多个磁盘上分散存储数据和校验信息的方案。
数据被划分成多个块,并且校验信息也被分散存储在磁盘上。
当一个磁盘发生故障时,可以通过校验信息来恢复丢失的数据。
RD 5结合了RD 0和RD 1的优点,提供了较高的数据可靠性和良好的读写性能。
RD 5的配置方式如下:- 最少需要三个磁盘- 一个磁盘用于存储校验信息- 数据和校验信息的块交替分布在其他磁盘上RD 5的优点包括:•提供较高的数据可靠性,可以容忍一个磁盘故障•相对较低的成本,因为只需要一个磁盘提供校验信息RD 5的缺点包括:•写入性能较低,因为写入时需要计算和更新校验信息•在重建磁盘时,会对系统性能产生较大影响5. RD 10RD 10,也称为RD 1+0,是一种将RD 1和RD 0相结合的方案。
各个raid对比:性能和运行速度和读写方面综合性能方面(数据安全以及速度方面),肯定是RAID5比较好;数据读取方面,RAID1最快;数据安全方面,RAID1最好;数据写入方面,RAID0最快。
RAID5兼备这些优点。
磁盘阵列比较表RAID 等级最少硬盘最大容错可用容量读取性能写入性能安全性目的应用产业单一硬盘(参考)0 1 1 1 无JBOD 1 0 n 1 1 无(同RAID0)增加容量个人(暂时)存储备份0 2 0 n n n 一个硬盘异常,全部硬盘都会异常追求最大容量、速度3D产业实时渲染、视频剪接高速缓存用途12n-1n/2n1最高,一个正常即可追求最大安全性个人、企业备份5 3 1 n-1 n-1 n-1 高追求最大容量、最小预算个人、企业备份6 4 2 n-2 n-2 n-2 安全性较RAID 5高同RAID 5,但较安全个人、企业备份10 4 n/2 n/2 n n/2 安全性高综合RAID 0/1优点,理论速度较快大型数据库、服务器1. n代表硬盘总数2. JBOD可接到现有硬盘,直接增加容量认识磁盘阵列 RAID一、功能1 对磁盘高速存取(提速): RAID将普通硬盘组成一个磁盘阵列,在主机写入数据,RAID控制器把主机要写入的数据分解为多个数据块,然后并行写入磁盘阵列;主机读取数据时,RAID控制器并行读取分散在磁盘阵列中各个硬盘上的数据,把它们重新组合后提供给主机。
由于采用并行读写操作,从而提高了存储系统的存取系统的存取速度。
2 扩容3 数据冗余二、分类RAID可分为级别0到级别6,通常称为:RAID0,RAID1,RAID2,RAID3,RAID4,RAID5,RAID6。
RAID0:RAID0并不是真正的RAID结构,没有数据冗余,RAID0连续地分割数据并并行地读/写于多个磁盘上。
因此具有很高的数据传输率,但RAID0在提高性能的同时,并没有提供数据可靠性,如果一个磁盘失效,将影响整个数据。
1,RAID 1ERAID 1E是RAID 1的增强版本,它并不是我们通常所说的RAID 0+1的组合。
RAID 1E的工作原理与RAID1基本上是一样的,只是RAID 1E 至少需要3块硬盘才能实现。
RAID 1E和RAID 1的工作原理图如下:可以把RAID1理解成盘与盘之间的镜像,而RAID1E是条带与条带之间的镜像,明显的好处是3块盘也可以做array了,他们都只允许坏一块盘,而RAID1E性能要好点(实际情况还要取决卡的优劣)。
2,RAID 5EERAID 5EE是在每个磁盘中预留一部分空间作为分布的热备盘,当一个硬盘出现故障时,这个磁盘上的数据将被压缩到分布的热备盘中,达到数据的保护作用。
不过与RAID 5E不同的是RAID 5EE内增加了一些优化技术,使RAID 5EE的工作效率更高,压缩数据的速度也更快。
RAID 5EE允许两个磁盘出错,最少需要4个磁盘实现。
RAID 5EE,可以理解成原先的RAID5+SPARE盘模式,只是把SPARE盘的空间条带化并且分布在每块硬盘上,这样一来,SPARE盘也参与读写,性能比RAID5要提高一点,而且在坏了一块盘时恢复也比RAID5快。
RAID5有compact和expand模式,expand模式坏掉一块硬盘后,RAID5EE会自动转变为compact模式,在compact模式还可以允许一块盘故障。
RAID 5EE Disk Array需要注意的是,RAID5EE不能同时坏两块盘;坏一块盘以后,RAID5EE会自动修复到compact模式,相当于RAID5;自动修复完成后,才可以再坏一块,这样一共可以坏两块,但不能同时坏。
如RAID5EE坏了1块盘,自动修复到compact模式以后又坏了一块,修复方式如下:先手工添加一块spare盘进行修复到compact模式,再手工添加一块spare盘继续修复到expand模式。
3,RAID 6RAID 6是由一些大型企业提出来的私有RAID级别标准,它的全称叫“Independent Data disks with two independent distributed parity schemes(带有两个独立分布式校验方案的独立数据磁盘)”。
深入分析各种raid级别相对单盘速度变化入分析各种raid级别相对单盘速度变化RAID0用分片存储方式把数据分布在两个盘或更多盘上,读写持续传输速率会增加一倍,随机读写速度按理论是有可能增加的,这取决于数据分片大小和读写的大小,不过总的来说很值得怀疑;硬件RAID1的随机和持续写速率和单个硬盘是完全一样的,但读的话由于可以从两个硬盘随意选一个读,随机读性能会有明显的增加,可能至2倍,至于持续读取速率理论上有可能增加,不过我很怀疑有这方面的优化,估计还是一样的;RAID5由于写要N+1个盘一起写,所以随机读写速率和单个硬盘是一样的(或者更差),而持续读写速率按理论是单个硬盘的N倍,不过我也遇到过还不如RAID1的情况,这怎么说呢?没法说了。
raid1和raid0的持续传输率,我认为和控制器的算法和读取数据大小有关。
如果随机读取(非连续读取,寻道开销很大),而且数据又很小,那么不管单盘还是多盘raid,速率几乎一样,因为都浪费到寻道上了。
根据公式可以算出来,1/(寻道时间+传输时间)=iops。
如果寻道时间比传输时间大几个数量级,那么传输时间翻倍变化,也对iops没多少影响。
然后提一下并发IO的概念:并发IO,指多个IO 可以同时被处理,比如IO1可以访问a盘,IO2可以同时访问b盘。
并发IO的反义词是顺序IO。
基于以上结论有:1、raid0持续读写和单盘比较:寻道时间不便,raid0传输时间=单盘2倍,总体iops差别不大。
但是有二条:并发IO和raid0的分割块大小。
又可以分两个因素,第一:不并发IO(或者并发IO)+分割块很小。
这种情况下,寻道时间不变,传输速度相对单盘减半,iops差不多。
第二:不并发IO+分割块很大。
这样的话,一次IO寻道时间相对单盘不变,传输速度可能不变(如果一次IO恰好只读取一个分割块),或者传输速度减半(一次IO可能定向到两块盘)。
不管怎么样,对iops影响不大。
第三:并发IO+分割块很大。
RAID0、RAID1及RAID5的区别详解⽬前已有的RAID(Redundant Array of Independent Disks,独⽴冗余磁盘阵列)技术有很多种,但是RAID0、RAID1、RAID5是最常见的⼏种⽅案。
1 RAID0RAID0技术把多块(⾄少两块)物理硬盘设备通过软件或硬件的⽅式串联在⼀起,组成⼀个⼤的卷组,并将数据依次写⼊到各个物理硬盘中。
这样,在最理想的情况下,硬盘设备的读写性能会提升数倍,但是若任意⼀块硬盘发⽣故障将导致整个系统的数据都受到破坏。
虽然,RAID0技术能够有效的提升硬盘数据的吞吐速度,但是不具备数据备份和错误修复能⼒。
如下图,数据被分别写⼊到不同的硬盘设备中,即disk1和disk2硬盘设备会被分别保存数据资料,最终实现提升读取、写⼊速度的效果。
2 RAID1尽管RAID0技术提升了硬盘设备的读写速度,但是它将数据⼀次写⼊各个物理硬盘中,也就是说,它的数据是分开存放的,其中任何⼀块硬盘发⽣故障都会损坏整个系统的数据。
因此,如果⽣产环境对硬盘设备的读写速度没有要求,⽽是希望增加数据的安全性时,就需要⽤到RAID1技术了。
RAID1技术⽰意图如下图,它是把两块以上的硬盘设备进⾏绑定,在写⼊数据时,是将数据同时写⼊到多块硬盘设备上(可以将其视为数据的镜像或备份)。
当其中某⼀块硬盘发⽣故障后,⼀般会⽴即⾃动以热交换的⽅式来恢复数据的正常使⽤。
RAID1技术虽然⼗分注重数据的安全性,但是因为是在多块硬盘设备中写⼊了相同的数据,因此硬盘设备的利⽤率下降了⼀半。
从理论上说,如下图所⽰空间的真实可⽤率只有50%,由三块硬盘设备组成的RAID1磁盘阵列的可⽤率只有33%左右,以此类推。
由于需要把数据同时写⼊两块以上的硬盘设备,这⽆疑也在⼀定程度上增⼤了系统计算功能的负载。
3 RAID5RAID5技术是把硬盘设备的数据奇偶校验信息保存到其他硬盘设备中。
RAID5磁盘阵列组中数据的奇偶校验信息并不是单独保存到某⼀块磁盘设备中,⽽是存储到除⾃⾝以外的其他每⼀块设备上,这样的好处是其中任何⼀个设备损坏后不⾄于出现致命缺陷。
raid1raid2raid5raid6raid10如何选择使⽤?我们在做监控项⽬存储时,经常会⽤到磁盘阵列,什么是磁盘阵列呢?那为什么要做磁盘阵列呢?raid1 raid2 raid5 raid6 raid10各有什么优势?本期我们来看下。
⼀、什么是Raid?它有什么作⽤?1、什么是Raidraid就是冗余磁盘阵列,把多个硬磁盘驱动器按照⼀定的要求使整个磁盘阵列由阵列控制器管理组成⼀个储存系统。
最开始研制⽬的是为了利⽤多个廉价的⼩磁盘来替代昂贵的⼤磁盘,以此来降低成本。
⽽随着硬盘技术的发展,如今的磁盘阵列采⽤了冗余信息的⽅式,使得其具有数据保护的功能。
2、那么服务器为啥要做磁盘阵列呢?主要有两个作⽤:提供容错功能普通的磁盘驱动器是⽆法提供容错功能的,⽽磁盘阵列可以通过数据校验提供容错功能,服务器会将数据写⼊多个磁盘,如果某个磁盘发⽣故障时,此时仍能保证信息的可⽤性,重要数据不会丢失,也不会耽误服务器的正常运转。
提⾼传输速率磁盘阵列将多个磁盘组成⼀个阵列,当做⼀个单⼀的磁盘使⽤,把数据已分段的形式存储到不同的硬盘之中,发⽣数据存取变动时,阵列中的相关磁盘⼀起⼯作,这就可以⼤幅的降低数据存储的时间,同时还能拥有更佳的空间和使⽤率。
⼆、常⽤Raid的优缺点Raid 0:⼀块硬盘或者以上就可做raid0优势:数据读取写⼊最快,最⼤优势提⾼硬盘容量,⽐如3块80G的硬盘做raid0,可⽤总容量为240G,也就是利⽤率是100%,速度也⽐较快。
缺点:⽆冗余能⼒,⼀块硬盘损坏,数据全⽆。
建议:做raid0 可以提供更好的容量以及性能,推荐对数据安全性要求不⾼的项⽬使⽤。
Raid 1:⾄少2块硬盘可做raid1优势:镜像,数据安全强,⼀块正常运⾏,另外⼀块镜像备份数据,保障数据的安全。
⼀块坏了,另外⼀块硬盘也有完整的数据,保障运⾏。
所以这种安全性⽐较性最⾼。
缺点:性能提⽰不明显,做raid1之后硬盘使⽤率为50%,有些费硬盘。
Raid 0:由多个硬盘组成系统中的单一硬盘,并且在存取的时候采用分段的方式进行,比如有4个硬盘组成一个系统的单一硬盘,在进行写操作的时候,系统会在第一个硬盘写一段数据,接着再在第二块盘上写,其后是3、4号盘,完成一个循环后,再从第一个盘开始写起。
这样,进行存取操作的时候,能够充分利用多个硬盘的读写能力,一个读写操作能够将任务分摊到多个硬盘上执行,大大提高读写操作的执行效率,并行处理的能力得到有效发挥。
读写的块的大小,一般情况下称为strip size。
Raid 1:是使用磁盘镜像(disk mirroring)的技术。
磁盘镜像应用在RAID1之前就在很多系统中使用,它的方式是在工作磁盘(working disk)之外再加一额外的备份磁盘(backup disk),两个磁盘所储存的数据完全一样,数据写入工作磁盘的同时亦写入备份磁盘。
磁盘镜像不见得就是RAID 1,如Novell Netware亦有提供磁盘镜像的功能,但并不表示Netware有了RAID 1的功能。
一般磁盘镜像和RAID 1有二点最大的不同:RAID 1无工作磁盘和备份磁盘之分,多个磁盘可同时动作而有重叠(overlaping)读取的功能,甚至不同的镜像磁盘可同时作写入的动作,这是一种最佳化的方式,称为负载平衡(load-balance)。
例如有多个用户在同一时间要读取数据,系统能同时驱动互相镜像的磁盘,同时读取数据,以减轻系统的负载,增加I/O的性能。
RAID 1的磁盘是以磁盘延伸的方式形成阵列,而数据是以数据分段的方式作储存,因而在读取时,它几乎和RAID 0有同样的性能。
从RAID的结构就可以很清楚的看出RAID 1和一般磁盘镜像的不同。
读取数据时可用到所有的磁盘,充分发挥数据分段的优点;写入数据时,因为有备份,所以要写入两个磁盘,其效率是N/2,磁盘空间的使用率也只有全部磁盘的一半。
很多人以为RAID 1要加一个额外的磁盘,形成浪费而不看好RAID1,事实上磁盘越来越便宜,并不见得造成负担,况且RAID1有最好的容错(fault tolerence)能力,其效率也是除RAID 0之外最好的。
各种RAID比较Edit by Shuyun目录前言 (1)RAID介绍 (2)RAID的选择 (6)RAID对比图 (7)前言很多时候我们都会用到磁盘RAID,但每次使用都要为了使用哪种RAID,各种的考虑,磁盘空间大小、安全性、稳定性、读写速度等等,还是挺麻烦的。
为了便于以后快速选择RAID方案,编写了此篇文档,如有不对之处,忘指正。
RAID介绍RAID-磁盘阵列(Redundant Arrays of Independent Disks,RAID),其原理是利用数组方式来作磁盘组,任一颗硬盘故障时仍可读出数据。
RAID技术主要有RAID0到RAID10等数个规范,RAID的产生是在计算机发展需要更大空间、更稳定的磁盘读写的环境下研发出来的。
当下,无论是在主机本地存储还是共享存储中,我们都会用到RAID技术,接下来我就RAID0、RAID1、RAID5、RAID6、RAID10这几种常见的RAID技术做分析。
RAID 0:RAID 0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,因此具有很高的数据传输率,但它没有数据冗余,因此并不能算是真正的RAID结构。
RAID 0只是单纯地提高性能,并没有为数据的可靠性提供保证,而且其中的一个磁盘失效将影响到所有数据。
因此,RAID 0不能应用于数据安全性要求高的场合。
RAID 1:它是通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。
当原始数据繁忙时,可直接从镜像拷贝中读取数据,因此RAID 1可以提高读取性能。
RAID 1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。
当一个磁盘失效时,系统可以自动切换到镜像磁盘上读写,而不需要重组失效的数据。
RAID2-RAID4均是将数据条块化并分布于不同的磁盘上,但从磁盘利用率、技术复杂度、传输效率、读写速度等方面都不是非常良好,所以在商业环境用都很少用,这里就不做过多介绍。
1 磁盘阵列原理最为常用的RAID形式是:●RAID 0;●RAID 1;●RAID 0+1;●RAID 3;●RAID 5。
RAID级别RAID-0 RAID-1 RAID-3 RAID-5 RAID-10别名条带镜像专用奇偶位条带分布奇偶位条带镜像阵列条带容错性没有有有有有冗余类型没有复制奇偶校验奇偶校验复制热备盘选项没有有有有有读性能高低高高中间随机写性能高低最低低中间连续写性能高低低低中间所需磁盘数1个或更多2个或2*N个3个或更多3个或更多4个或4*N个可用容量总磁盘容量总磁盘容量的50%总磁盘容量的(n-1)/n。
n为磁盘数总磁盘容量的(n-1)/n。
n为磁盘数总磁盘容量的50%典型应用无故障的迅速读写,安全性要求不高随机数据写入,安全性要求高连续数据传输,安全性要求随机数据传输,安全性要求高数据量大,安全性要求高RAID 0能获得最佳性能;RAID 1安全性最高,但性能低;RAID 5的安全性和RAID 3相同,但性能要好一点;2. RAID 0RAID 0又称Stripe(条带化),它代表了所有RAID级别中最高的存储性能。
RAID 0提高存储性能的原理是把连续的数据分散到多个磁盘上进行存取。
这样,系统有数据请求时,多个磁盘并行执行,每个磁盘执行属于自身部分的数据请求。
如上图所示,系统向由三个磁盘组成的逻辑硬盘(RAID 0 磁盘组)发出的I/O数据请求被转化为3项操作,每一项操作对应于一块物理硬盘。
通过建立RAID 0,原先顺序的数据请求被分散到所有的三块硬盘中同时执行。
从理论而言,三块硬盘的并行操作使同一时间内的磁盘读写速度提升了3倍。
但由于会受到总线带宽等多种因素的影响,实际上的提升速率必定低于理论值。
RAID 0的缺点是不提供数据冗余,一旦用户数据损坏,损坏的数据将无法得到恢复。
3.RAID 1RAID 1又称Mirror(镜像),它能最大限度地保证数据的可用性和可修复性。
Raid0、Raid1、Raid0+1、Raid3和Raid5几种磁盘阵列区别Raid0 :最少需要两块盘,没用冗余数据,不做备份,任何一块磁盘损坏都无法运行。
n块磁盘(同类型)的阵列理论上读写速度是单块磁盘的n倍(实际达不到),风险性也是单一n倍(实际更高),是磁盘阵列中存储性能最好的。
适用于安全性不高,要求比较高性能的图形工作站或者个人站。
Raid1:至少需要两块盘,磁盘数量是2的n倍,每一块磁盘要有对应的备份盘,利用率是50%,只要有一对磁盘没有损坏就可以正常使用。
n组磁盘(2n块同类型磁盘)的阵列理论上读取速度是单块磁盘的n倍(实际达不到),风险性是单一磁盘的n分之一(实际更低)。
换盘后需要长时间的镜像同步,不影响外界访问,但整个系统性能下降。
磁盘控制器负载比较大。
适用于安全性较高,且能较快恢复数据的场合。
Raid0+1:至少需要四块盘,磁盘数量也是2的n倍。
既有数据镜像备份,也能保证较高的读写速度。
成本比较大。
Raid3:至少需要3块盘(2块盘没有校验的意义)。
将数据存放在n+1块盘上,有效空间是n块盘的总和,最后一块存储校验信息。
数据被分割存储在n块盘上,任一数据盘出现问题,可由其他数据盘通过校正监测恢复数据(可以带伤工作),换数据盘需要重新恢复完整的校验容错信息。
对阵列写入时会重写校验盘的内容,对校验盘的负载较大,读写速度相较于Raid0较慢,适用于读取多而写入少的应用环境,比如数据库和web服务器。
使用容错算法和分块的大小决定了Raid3在通常情况下用于大文件且安全性要求较高的应用,比如视频编辑、硬盘播出机、大型数据库等。
Raid5:至少需要3块盘,读取速度接近Raid0,但是安全性更高。
安全性上接近Raid1,但是磁盘的利用率更高。
可以认为是Raid0和Raid1的一个折中方案。
只允许有一块盘出错,可以通过另外多块盘来计算出故障盘的数据,故障之后必须尽快更换。
比Raid0+1的磁盘利用率高,是目前比较常用的一种方案。
磁盘阵列常用RAID方案速度及数据对比
RAID也称为“磁盘阵列”,它将多个硬盘用某种逻辑方式联系起来,作为逻辑上的一个硬盘来使用,是逻辑上,不是物理上,请分清楚。
简而言之,多个硬盘当一个硬盘使用,提升N倍于单个硬盘的速度。
只列举常用RAID方案
RAID 模式下磁盘空间的使用,举例如下:
RAID的优点
1. 传输速率高。
在部分RAID模式中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍的速率。
因为CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。
2. 更高的安全性。
相较于普通磁盘驱动器很多RAID模式都提供了多种数据修复功能,当RAID中的某一磁盘驱动器出现严重故障无法使用时,可以通过RAID中的其他磁盘驱动器来恢复此驱动器中的数据,而普通磁盘驱动器无法实现,这是使用RAID的第二个原因。
RAID 0的优缺点
RAID 0的缺点是不提供数据冗余,因此一旦用户数据损坏,损坏的数据将无法得到恢复。
RAID0运行时只要其中任一块硬盘出现问题就会导致整个数据的故障。
一般不建议企业用户单独使用
RAID 0具有的特点,使其特别适用于对性能要求较高,而对数据安全不太在乎的领域,如图形工作站等。
对于个人用户,RAID 0也是提高硬盘存储性能的绝佳选择。
RAID 1简介
RAID 1磁盘阵列级,是一种镜像磁盘阵列,其原理就是将一块硬盘的数据以相同位置指向另一块硬盘的位置。
RAID 1磁盘阵列又称为Mirror或Mirroring(镜像),因为它就是将一块硬盘的内容完全复制到另一块硬盘上。
当读取数据时,系统先从源盘读取数据,如果读取数据成功,则系统不去管备份盘上的数据;如果读取源盘数据失败,则系统自动转而读取备份盘上的数据,不会造成用户工作任务的中断。
当然,我们应当及时地更换损坏的硬盘并利用备份数据重新建立Mirror,避免备份盘在发生损坏时,造成不可挽回的数据损失。
由于对存储的数据进行百分之百的备份,在所有RAID级别中,RAID 1提供最高的数据安全保障。
同样,由于数据的百分之百备份,备份数据占了总存储空间的一半,因而,Mirror的磁盘空间利用率低,存储成本高。
Mirror虽不能提高存储性能,但由于其具有的高数据安全性,使其尤其适用于存放重要数据,如服务器和数据库存储等领域。
RAID 1优缺点
RAID1是将一个两块硬盘所构成RAID磁盘阵列阵列,其容量仅等于一块硬盘的容量,因为另一块只是当作数据“镜像”。
RAID 1磁盘阵列显然是最可靠的一种阵列,因为它总是保持一份完整的数据备份。
它的性能自然没有RAID 0磁盘阵列那样好,但其数据读取确实较单一硬盘来的快,因为数据会从两块硬盘中较快的一块中读出。
RAID 1磁盘阵列的写入速度通常
较慢,因为数据得分别写入两块硬盘中并做比较。
RAID 1磁盘阵列一般支持“热交换”,就是说阵列中硬盘的移除或替换可以在系统运行时进行,无须中断退出系统。
RAID 1磁盘阵列是十分安全的,不过也是较贵一种RAID磁盘阵列解决方案,因为两块硬盘仅能提供一块硬盘的容量。
RAID 1磁盘阵列主要用在数据安全性很高,而且要求能够快速恢复被破坏的数据的场合。
RAID 5
RAID 5是目前应用最广泛的RAID技术。
各块独立硬盘进行条带化分割,相同的条带区进行奇偶校验(异或运算),校验数据平均分布在每块硬盘上。
以n块硬盘构建的RAID 5阵列可以有n-1块硬盘的容量,存储空间利用率非常高。
任何一块硬盘上的数据丢失,均可以通过校验数据推算出来。
它和RAID 3最大的区别在于校验数据是否平均分布到各块硬盘上。
RAID 5具有数据安全、读写速度快,空间利用率高等优点,应用非常广泛,但不足之处是如果1块硬盘出现故障以后,整个系统的性能将大大降低。
RAID 5与RAID 5E及RAID 5EE的比较
RAID 5E: RAID 5E是在 RAID 5级别基础上的改进,与RAID 5类似,数据的校验信息均匀分布在各
硬盘上,但是,在每个硬盘上都保留了一部分未使用的空间,这部分空间没有进行条带化,最多允许两块物理硬盘出现故障。
看起来,RAID 5E和RAID 5加一块热备盘好象差不多,其实由于RAID 5E是把数据分布在所有的硬盘上,性能会与RAID5 加一块热备盘要好。
当一块硬盘出现故障时,有故障硬盘上的数据会被压缩到其它硬盘上未使用的空间,逻辑盘保持RAID 5级别。
RAID 5EE:与RAID 5E相比,RAID 5EE的数据分布更有效率,每个硬盘的一部分空间被用作分布的热备盘,它们是阵列的一部分,当阵列中一个物理硬盘出现故障时,数据重建的速度会更快。
RAID0+1和RAID1+0的比较
RAID 0+ 1
优点:
正常使用中,考虑性能上讲,RAID0+1 好,就是先做RAID 0 条带,再做RAID 1 MIRROR,这样写入速度快,读的速度和RAID1+0一样。
缺点,一旦一个硬盘坏了,一半的硬盘无法工作,如果1个条带上各坏1个硬盘(RAID0+1只有2个条带),GAME OVER....即使是只有一个硬盘坏了,做数据恢复也很慢,因为一半的硬盘要rebuild(大家该知道为什么吧)。
RAID 1+0
优点数据安全性好,只要不是1个条带上的2个硬盘同时坏,没有问题,还可以继续跑数据。
数据恢复快。
缺点写性能稍微比RAID 0+1 差(读性能一样)
举例
这里举个例子,20个硬盘
做RAID 0+1,共2个条带做MIRROR,每个条带10个硬盘,如果坏了1个硬盘,只能是另外一个完好的条带(10个硬盘)同时工作,这边条带9个好的硬盘也要休息。
做RAID 1+0,共10个条带,每个条带2个硬盘做MIRROR,如果坏了1个硬盘,没关系,其它19个硬盘还要同时工作,只要不是坏在一个MIRROR里面的,没事。
建议,硬盘很多时,同时坏的几率就比较大,建议使用安全系数高的RAID 1+0,宁愿损失点性能(其实差不多)。
如果仅仅是4块硬盘或者不考虑安全,不是关键业务,只是为了追求速度快感,你可以选择RAID 0+1
RAID 50
RAID50是RAID5与RAID0的结合。
此配置在RAID5的子磁盘组的每个磁盘上进行包括奇偶信息在内的数据的剥离。
每个RAID5子磁盘组要求三个硬盘。
RAID50具备更高的容错能力,因为它允许某个组内有一个磁盘出现故障,而不会造成数据丢失。
而且因为奇偶位分部于RAID5子磁盘组上,故重建速度有很大提高。
优势:更高的容错能力,具备更快数据读取速率的潜力。
需要注意的是:磁盘故障会影响吞吐量。
故障后重建信息的时间比镜像配置情况下要长。