存储阵列的瓶颈分析

格式：doc
大小：85.00 KB
文档页数：7

下载文档原格式

/ 7

磁盘阵列40万IOPS理论算法

IOPS算法定义：IOPS (Input/Output Operations Per Second)，即每秒进行读写（I/O）操作的次数，多用于数据库等场合，衡量随机访问的性能。

存储端的IOPS性能和主机端的IO是不同的，IOPS是指存储每秒可接受多少次主机发出的访问，主机的一次IO需要多次访问存储才可以完成。

例如，主机写入一个最小的数据块，也要经过“发送写入请求、写入数据、收到写入确认”等三个步骤，也就是3个存储端访问。

影响因素：cache命中率；磁盘因素等。

Cache：在计算机存储系统的层次结构中，介于中央处理器和主存储器之间的高速小容量存储器。

它和主存储器一起构成一级的存储器。

高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。

Cache命中率：cache储存一些常用的或者被掉用可能性大的数据，在cpu读数据时，首先在cache中寻找目标，如果命中，则直接调用，未命中则需要在磁盘中寻找目标数据。

故命中率是影响存储IOPS 的重要指标。

Cache命中率：1）cache的算法，是决定cache命中率的主要因素之一，cache算法越高效，则cache的命中率越高，加速效果越明显。

2）cache的大小，影响cache命中率的另外一个因素，cache越大，可以存储的信息量越大，相对的cache的命中率越高。

如图5.34所示。

在Cache容量比较小的时候，命中率的提高得非常快，随着Cache容量的增加，命中率提高的速度逐渐降低。

当Cache容量增加到无穷大时，命中率可望达到100％，但是，这在实际上是做不到的。

理论上在cache与主存容量比例为4:1000时，cache命中率即可达到90%以上。

3）读数据的块大小，在采用组相联映象方式的Cache中，当Cache的容量一定时，块的大小对命中率的影响非常敏感。

图5.35表示随着Cache块的由小到大的变化，命中率上升和下降的情况。

开始时，块大小很小，例如只有一个存储单元，这时的命中率H很低。

分布式存储vs传统SAN、NAS的优缺点分析

分布式存储vs传统SAN、NAS的优缺点分析传统存储架构的局限性和分布式存储的优点传统SAN存储设备一般采用双控制器架构，两者互为备份，配置两台交换机与前端的服务器进行连接，这种双控制器架构方式会有以下两个方面的缺点：1．网络带宽容易变成整个存储性能的瓶颈；2．如果一个控制器损坏，系统的性能将大幅下降，影响存储的正常使用。

传统存储架构的局限性主要体现在以下几个方面：1、横向扩展性较差受限于前端控制器的对外服务能力，纵向扩展磁盘数量无法有效提升存储设备对外提供服务的能力。

同时，前端控制器横向扩展能力非常有限，业界最多仅能实现几个控制器的横向。

因此，前端控制器成为整个存储性能的瓶颈。

2、不同厂家传统存储之间的差异性带来的管理问题不同厂商设备的管理和使用方式各有不同，由于软硬件紧耦合、管理接口不统一等限制因素无法做到资源的统一管理和弹性调度，也会带来存储利用率较低的现象。

因此，不同存储的存在影响了存储使用的便利性和利用率。

分布式存储往往采用分布式的系统结构，利用多台存储服务器分担存储负荷，利用位置服务器定位存储信息。

它不但提高了系统的可靠性、可用性和存取效率，还易于扩展，将通用硬件引入的不稳定因素降到最低。

优点如下：1．高性能一个具有高性能的分布式存户通常能够高效地管理读缓存和写缓存，并且支持自动的分级存储。

分布式存储通过将热点区域内数据映射到高速存储中，来提高系统响应速度；一旦这些区域不再是热点，那么存储系统会将它们移出高速存储。

而写缓存技术则可使配合高速存储来明显改变整体存储的性能，按照一定的策略，先将数据写入高速存储，再在适当的时间进行同步落盘。

2．弹性扩展得益于合理的分布式架构，分布式存储可预估并且弹性扩展计算、存储容量和性能。

分布式存储的水平扩展有以下几个特性：1) 节点扩展后，旧数据会自动迁移到新节点，实现负载均衡，避免单点过热的情况出现；2) 水平扩展只需要将新节点和原有集群连接到同一网络，整个过程不会对业务造成影响；3) 当节点被添加到集群，集群系统的整体容量和性能也随之线性扩展，此后新节点的资源就会被管理平台接管，被用于分配或者回收。

磁盘阵列吞吐量与IOPS两大瓶颈分析

磁盘阵列吞吐量与IOPS两大瓶颈分析本文是由NSIDC总结的，分析了磁盘阵列的瓶颈，主要体现在2个方面：吞吐量与IOPS。

1、吞吐量吞吐量主要取决于阵列的构架，光纤通道的大小(现在阵列一般都是光纤阵列，至于SCSI这样的SSA阵列，我们不讨论)以及硬盘的个数。

阵列的构架与每个阵列不同而不同，他们也都存在内部带宽(类似于pc的系统总线)，不过一般情况下，内部带宽都设计的很充足，不是瓶颈的所在。

光纤通道的影响还是比较大的，如数据仓库环境中，对数据的流量要求很大，而一块2Gb的光纤卡，所能支撑的最大流量应当是2Gb/8(小B)=250MB/s(大B)的实际流量，当4块光纤卡才能达到1GB/s的实际流量，所以数据仓库环境可以考虑换4Gb的光纤卡。

最后说一下硬盘的限制，这里是最重要的，当前面的瓶颈不再存在的时候，就要看硬盘的个数了，我下面列一下不同的硬盘所能支撑的流量大小：10 K rpm 15 K rpm ATA—————————10M/s 13M/s 8M/s那么，假定一个阵列有120块15K rpm的光纤硬盘，那么硬盘上最大的可以支撑的流量为120*13=1560MB/s，如果是2Gb的光纤卡，可能需要6块才能够，而4Gb的光纤卡，3-4块就够了。

2、IOPS决定IOPS的主要取决与阵列的算法，cache命中率，以及磁盘个数。

阵列的算法因为不同的阵列不同而不同，如我们最近遇到在hds usp上面，可能因为ldev(lun)存在队列或者资源限制，而单个ldev的iops就上不去，所以，在使用这个存储之前，有必要了解这个存储的一些算法规则与限制。

cache的命中率取决于数据的分布，cache size的大小，数据访问的规则，以及cache的算法，如果完整的讨论下来，这里将变得很复杂，可以有一天好讨论了。

我这里只强调一个cache的命中率，如果一个阵列，读cache的命中率越高越好，一般表示它可以支持更多的IOPS，为什么这么说呢?这个就与我们下面要讨论的硬盘IOPS有关系了。

数据存储技术面临的趋势、挑战和问题

数据存储技术面临的趋势、挑战和问题数据存储技术面临的趋势、挑战和问题/2010-12-08 15：05：31/个人分类：数据中心多数环境下，在PCFE的影响因素中，所有IT设备的冷却设施能耗和服务器能耗的影响力居于首位，而外部数据存储器则紧随其后。

这些存储器除了消耗大量电能、占用大范围面积外，它们在环境方面也产生了一定的影响，其数据存储量和数据足迹的规模也在不断扩大。

尽管与过去相比，如今同样大小或更小的物理空间能存储更多的数据，不过，人们现在既要求降低存储器能耗和相应的冷却，又需要必要的数据增长速率来维持业务增长、加强IT服务交付和新的应用程序等，以上种种要求都继续对现有的PCFE资源施加了更多的压力。

现今产生的数据越来越多，数据的存储时间也越来越长，同时还要在多个位置进行数据备份，而这些都是人们对数据存储空间提出增长要求的主要推动因素。

无论何种规模的组织。

其在短期内都会继续朝着扩大数据存储空间的趋势发展。

人们需要利用新型及更具扩展性的存储解决方案来处理非结构化数据，然而富媒体和基于互联网的应用的普遍流行，已经引起了该类数据的爆炸性增长。

另外，诸如视频前后期制作加工、动画渭染、视频和音频点播、社交网站以及手机、PDA和其他资源的数据数字化等具体应用，同样使存储器的性能和容量开始不堪重负。

其中，非结构化数据包括电子数据表、幻灯片、移动平台、AdobePDF文件、微软宇处理文档、网页，也包括几EG、帆仍和MP4格式的视频、音频文件等多种格式的文件数据。

富媒体和互联网应用十分多样化，其范围从具有不同存取模式的小文件到更传统的大型视频流访问一一不等。

因此，为了更加稳定地支持互联网和Web2.0上的应用程序，存储系统需要具备各种各样的性能特点，包括支持元数据或个人文件的小型随机访问以及较大的视频流序列等。

另外，随着产生的数据和数据备份越来越多，数据存储空间越来越大，存储时间越来越长，数据的增长速率也从较低的百分之十几，发展到高一些的百分之几十，甚至超过了百分之百。

监控存储应用&MS1000产品介绍V1.3

MS1000针对监控应用的优化设计
6
读写模式：监控存储&传统存储
项目数据块大小传统存储
数据库是8-64KB，单应用的块大小不固定
监控存储
64KB-1MB，单数据流的块大小固定
说明
稳定的压力
数据访问频度
数据更新方式数据突发读写比例读写热点数据容错度
区分峰值、谷值
数据库是随机性更新有数据突发读居多，数据库读比例 70%，写比例30% 2/8原则，20%的数据承载80%的访问数据块不允许丢失
码流(Kbps) 256 512 1024 2048 JOBD 60 60 40 20 RAID5 32 32 24 12
传统DVR/DVS：配置较低，采用RAID方式会大幅降低性能；硬盘
数目不超过8块，可用容量损耗较大，一般不做RAID。
专业存储阵列：配置较高，专用的RAID处理模块，RAID后性能无明
监控应用中的实际情况
在低码流情况下，存在存储控制器性能和容量都过剩的状态：
方案：采用低性能、小容量的存储，降低档次和成本（非我司目标市场）
在保存15天以下的情况下，存在存储容量过剩，性能不足的状态：
方案：需Байду номын сангаас性能更高的存储阵列，特别是高码流应用
在保存30天以上的情况下，存在存储容量不足，性能过剩的状态：
图像、音频
非结构化（无序、无法用统一结构表示）结构化（有序、规则性很强）
传统存储：无论是结构化数据（数据库），还是非结构化数据（文本、图像），
其组织方式都是非结构化的，无明显的规则而言。
监控存储：数据表现形式是非结构化的，但其组织方式却体现结构化特性，规
则性很强。

存储升级方案

存储升级方案在当今数字化时代，存储需求不断增长，许多企业和组织面临存储容量不足和性能瓶颈的挑战。

为了满足这些需求，存储升级成为一项必要的任务。

本文将介绍一些存储升级方案，旨在提高存储性能和容量，以满足现代企业的需求。

存储容量升级随着业务数据的增加，存储容量成为许多组织的主要挑战之一。

在存储容量升级方面，以下是几种常见的方案：1. 增加硬盘容量最简单直接的方法是增加硬盘的容量。

这可以通过更换现有硬盘为更大容量的硬盘，或者增加额外的硬盘来实现。

然而，这种方法可能会导致停机时间增加，因为现有硬盘可能需要重新格式化或重新配置。

2. 添加存储阵列添加存储阵列是一种常见的存储容量升级方案。

存储阵列是一组硬盘的集合，通过RD（冗余独立磁盘阵列）技术将数据分布到多个硬盘上，提供更高的容量和可靠性。

通过添加额外的存储阵列，可以扩展存储容量，并提高冗余性和性能。

3. 引入网络存储网络存储是一种将存储资源连接到网络上的技术。

这种技术允许多个服务器或计算机通过网络访问存储资源，提供灵活的存储管理和共享功能。

引入网络存储可以扩展存储容量，并提供更大的灵活性和可伸缩性。

存储性能升级除了存储容量，存储性能也是重要考虑因素之一。

以下是一些常见的存储性能升级方案：1. 使用固态硬盘（SSD）固态硬盘（SSD）相比传统的硬盘驱动器（HDD）具有更高的性能和读写速度。

通过替换现有的硬盘驱动器，或者将SSD作为缓存层添加到现有存储系统中，可以显著提高存储系统的性能。

2. 使用存储加速器存储加速器是一种专门设计用于提高存储系统性能的硬件设备。

它可以加速数据的读写操作，并提供更低的访问延迟。

通过添加存储加速器，可以在不更换现有存储设备的情况下获得更快的存储性能。

3. 采用分层存储分层存储是一种将数据按照其访问频率和重要性分配到不同层次的存储介质的方法。

通过将频繁访问的数据存储在更快速的媒体（如SSD）上，而将不经常访问的数据存储在较慢的媒体上，可以提高存储性能并降低存储成本。

性能测试--瓶颈分析方法

性能测试－－瓶颈分析方法1、内存分析方法内存分析用于判断系统有无内存瓶颈，是否需要通过增加内存等手段提高系统性能表现。

内存分析需要使用的计数器：Memory类别和Physical Disk类别的计数器。

内存分析的主要方法和步骤：〔1〕首先查看Memory\Available Mbytes指标如果该指标的数据比较小，系统可能出现了内存方面的问题，需要继续下面步骤进一步分析。

注：在UNIX/LINUX中，对应指标是FREE(KB)〔2〕注意Pages/sec、Pages Read/sec和Page Faults/sec的值操作系统回利用磁盘较好的方式提高系统可用内存量或者提高内存的使用效率。

这三个指标直接反应了操作系统进行磁盘交换的频度。

如果Pages/sec的技术持续高于几百，可能有内存问题。

Pages/sec值不一定大九说明有内存问题，可能是运行使用内存映射文件的程序所致。

Page Faults/sec说明每秒发生页面失效次数，页面失效次数越多，说明操作系统向内存读取的次数越多。

此事需要查看Pages Read/sec的计数值，该计数器的阀值为5，如果计数值超过5，则可以判断存在内存方面的问题。

注：在UNIX/LINUX系统中，对于指标是(page)si和(page)so.(3)根据Physical Disk计数器的值分析性能瓶颈对Physical Disk计数器的分析包括对Page Reads/sec和%Disk Time及Aerage Disk Queue Length的分析。

如果Pages Read/sec很低，同时%Disk Time 和Average Disk Queue Length的值很高，则可能有磁盘瓶颈。

但是，如果队列长度增加的同时Pages Read/sec并未降低，则是内存不足。

注：在UNIX/LINUX系统中，对应的指标是Reads(Writes)per sec、Percent of time the disk is busy和Average number of transactions waiting for service.2、处理器分析法〔1〕首先看System\%Total Processor Time 性能计数器的计数值该计数器的值表达服务器整体处理器利用率，对多处理器的系统而言，该计数器提醒所有CPU的平均利用率。

RAID5_和_RAID10_(性能比较和原理)

RAID5 和 RAID10 (性能比较和原理)20年来在存储方面，RAID 推出了一系列级别，包括RAID 0、RAID 1、RAID 2、RAID 3、RAID4、RAID 5，以及各种组合如 RAID 0+1 等。

其中最广泛的包括RAID5与RAID10。

但是一直以来，关于RAID5与RAID10的性能优劣的争端还是非常多的，甚至很多人、包括很多公司都那拿出了测试数据。

而这些测试数据复杂难懂、相互矛盾，更加让用户感到迷惑，不知道如何选择。

在这里，我将就这两种RAID的内部运行原理来分析一下，看看我们在什么情况下应当适合选哪一种RAID方式。

根据我的经验与分析：像小IO的数据库类型操作，如ERP等应用，建议采用RAID10；而大型文件存储，数据仓库，如医疗PACS系统、视频编辑系统则从空间利用的角度，建议采用RAID5。

下面请看详细的性能对比：本文分为上下两篇，上文侧重分析两种RAID的内部运行原理，下文将根据不同的影响磁盘性能的因素来分析RAID方案对磁盘系统的影响，参考“RAID5和RAID10，哪种RAID更适合你(下) ”。

为了方便对比，我这里拿同样多驱动器的磁盘来做对比，RAID5选择3D+1P的RAID方案，RAID10选择2D+2D的Raid方案，分别如图RAID5+RAID10那么，我们分析如下三个过程：读，连续写，随机写。

但是，在介绍这三个过程之前，我需要介绍另外一个磁盘阵列中的重要概念：cache.磁盘读写速度的关键之一：Cachecache技术最近几年，在磁盘存储技术上，发展的非常迅速，作为高端存储，cache已经是整个存储的核心所在，就是中低端存储，也有很大的cache存在，包括最简单的RAID 卡，一般都包含有几十，甚至几百兆的RAID cache。

cache的主要作用是什么呢？作为缓存，cache的作用具体体现在读与写两个不同的方面：作为写，一般存储阵列只要求数据写到cache就算完成了写操作，当写cache的数据积累到一定程度，阵列才把数据刷到磁盘，可以实现批量的写入。

存储性能测试方案

存储性能测试方案引言存储性能测试是评估存储系统的性能和可靠性的关键步骤。

在设计存储系统时，了解其性能是至关重要的，因为它直接影响到系统的可用性和响应速度。

本文将介绍存储性能测试的基本原理和方法，并提供一套完整的测试方案。

测试目标存储性能测试的主要目标是评估存储系统的吞吐量、响应时间、并发性和可靠性等性能指标。

通过测试，可以识别系统中的瓶颈，并针对性地进行优化。

本文将重点关注以下几个方面的性能测试：1.吞吐量：测试存储系统能够处理的数据量和交易量。

2.响应时间：测试存储系统对请求的响应速度，包括读取和写入操作的响应时间。

3.并发性：测试存储系统在同时处理多个请求时的性能表现。

4.可靠性：测试存储系统在面对负载压力时的稳定性和容错能力。

测试环境为了保证测试结果的准确性和可比性，需要准备一个合适的测试环境。

下面是一些需要考虑的基本要素：1.硬件设备：选择符合系统要求的存储设备，例如硬盘、固态硬盘或者存储阵列。

2.网络带宽：确保网络的传输带宽满足测试需求，以避免网络成为性能瓶颈。

3.软件环境：选择适当的操作系统和存储软件，并进行必要的配置和优化。

4.测试工具：选择可靠的性能测试工具，例如FIO、Iometer或者自定义的存储负载脚本。

测试步骤以下是典型的存储性能测试步骤，但具体步骤可能会因系统和测试需求而异。

1.系统准备阶段：–安装和配置所需的硬件设备和操作系统。

–安装和配置存储软件及相应的驱动程序。

–确保网络连接正常，并满足所设定的网络带宽需求。

2.测试参数设置阶段：–根据测试目标和需求，选择合适的测试参数，如并发数、负载类型、数据量等。

–配置测试工具，并设置相应的性能指标和测试时间。

3.性能测试执行阶段：–启动性能测试工具，并监控测试过程中的各项指标，如吞吐量、响应时间、并发数等。

–记录测试结果和性能数据，包括平均响应时间、最大吞吐量、错误率等。

4.结果分析和优化阶段：–分析测试结果，找出系统的瓶颈和优化空间。

硬盘阵列存储技术简析

高性能和数据的一致性并详述了
ｌｅ．ＡＤ是Ｒｄｎａｔｒａｆｎｘｅｓｅｉｓｅ１ＲＩｖｅｕｄｎＡｒｙｏＩｅｐｎｉＤｓ的缩写ｖｋ
取控制（ｉａｈｎｏｌ】它将从磁盘读取的数据存在ｄｓｃｃｅｏｔｌｒｋｃｒｅ快取内存中以减少磁盘存取的次数．数据的读写都在快取内存中进行大幅增加存取的速度．如要读取的数据不在快取内存中．或要写数据到磁盘时，才做磁盘的存取动作这种方式在单工期环境ｃｉ — ｓｉｇｅｖｏｍｅｔ如ＤＳ之下ｓｎｔｋｎｉｎｎ）ｅａｎＯ
之前就在很多系统中使用，的方式是在工作磁盘之外再加它
一
额外的备份磁盘两个磁盘所储存的数据安全一致数据在写入工作磁盘同时也写入备份磁盘。
有最佳的安全性，１００％不停机，即使有一个磁盘损坏也能照常作业而不影响其效能（对能并行存取的系统稍有影响），因为数据是作重复储存。ＲＤ１ＡＩ的并行读取几乎有ＲＤＡＩ０的性能因为可同时读取相互镜像的磁盘；写入也只￣ＲＤ略ＬＡＩ０
对大量数据的存取有很好的性能ｌ小且频繁的存取则不量然】．但在多工（ｌ— ｓｉｇｍｕｉａｋｎ１环境之下【ｔｔ因为要不停地馓
而每一ｌｅ代表一种技术目前业界公认的标准是ＲＩ－ｅｌｖＡＤ０
ＲＤ５这个ｌｅ并不代表技术的高低ＡＩｅｌｖｌｖｌｅｅ５并不高于
ＡＤ２Ｒ１是把数据分散为位元／位元组或块，加入海明码
ＨａｍｉｇＣｏｍｎｄｅ

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

存储阵列的瓶颈分析
author：skate
time： 2008/10/07
参考：
今天闲暇时间拜读了piner的boke，发现一篇关于关于存储阵列瓶颈分析文章
很不错，在此记录下来，以备查询。

一直以来，看到关于raid5与raid10的性能之争还是非常多的，甚至很多人那拿出了测试数据，但是，到底谁是谁非。

这里，我就这两种raid的内部运行原理来分析一下，我们在什么情况下应当适合选哪一种raid方式。

为了方便对比，我这里拿同样多驱动器的磁盘来做对比，raid5选择3D+1P的raid 方案，raid10选择2D+2D的Raid方案，分别如图：
那么，我们分析如下三个过程：读，连续写，随机写，但是，在介绍这三个过程之前，我需要介绍一个特别重要的概念：cache。

cache技术最近几年，在磁盘存储技术上，发展的非常迅速，作为高端存储，cache 已经是整个存储的核心所在，就是中低端存储，也有很大的cache存在，包括最简单的raid卡，一般都包含有几十，甚至几百兆的raid cache。

cache的主要作用是什么呢？体现在读与写两个不同的方面，如果作为写，一般存储阵列只要求写到cache就算完成了写操作，所以，阵列的写是非常快速的，在写cache的数据积累到一定程度，阵列才把数据刷到磁盘，可以实现批量的写入，至于cache数据的保护，一般都依赖于镜相与电池（或者是UPS）。

cache的读一样不可忽视，因为如果读能在cache中命中的话，将减少磁盘的寻道，因为磁盘从寻道开始到找到数据，一般都在6ms以上，而这个时间，对于那些密集型io的应用可能不是太理想。

但是，如果cache能命中，一般响
应时间则可以在1ms以内。

不要迷信存储厂商的iops（每秒的io数）数据，他们可能全部在cache 命中的基础上做到的，但是实际上，你的cache命中率可能只有10%。

介绍完cache，我们就可以解释raid5与raid10在不同的模式下，工作效率问题了，那么我们来分别分析以上三个问题。

1、读操作
因为raid5与raid10的磁盘都可以提供服务，所以，在读上面他们基本是没有差别的，除非是读的数据能影响cache命中率，导致命中率不一样。

2、连续写
连续写的过程，一般表示写入连续的大批量的数据，如媒体数据流，很大的文件等等，这个写操作过程，如果有写cache存在，并且算法没有问题的话，raid5比raid10甚至会更好一些（这里要假定存储有一定大小足够的写cache，而且计算校验的cpu不会出现瓶颈）。

因为这个时候的校验是在cache中完成，如4块盘的raid5，可以先在内存中计算好校验，同时写入3个数据+1个校验。

而
raid10只能同时写入2个数据+2个镜相。

如，4块盘的raid5可以在同时间写入1、2、3到cache，并且在cache计算好校验之后，我这里假定是6（实际的校验计算并不是这样的，我这里仅仅是假设），同时把三个数据写到磁盘。

而4块盘的raid10不管cache是否存在，写的时候，
都是同时写2个数据与2个镜相。

但是，我前面也说过了，写cache是可以缓存写操作的，等到一定时期再写到磁盘，但是，写操作不比读操作，这个写是迟早也要发生的，也就是说，最后落到磁盘上的写还是避免不了的，不过，如果不是连续性的强连续写，只要不达到磁
盘的写极限，差别都不是太大。

3、离散写
这里可能是最难理解，但是，也是最重要的部分，数据库，如oracle 数据库大部分操作就是离散写，如每次写一个数据块的数据，如8K；联机日志虽然看起来是连续写，但是因为每次写的量不多，不保证能添满raid5的一个条带（保证每张盘都能写入），所以很多时候也是离散写入。

我们再接上图，假定要把一个数字2变成数字4，那么对于raid5，实际发生了
4次io，
先读出2与校验6，可能发生读命中
然后在cache中计算新的校验
写入新的数字4与新的校验8
对于raid10，我们可以看到，同样的单个操作，最终raid10只需要2个io，
而raid5需要4个io。

但是，这里我忽略了raid5在那两个读操作的时候，还可能会发生读命中操作，也就是说，如果需要读取的数据已经在cache中，可能是不需要4个io的，也证明了cache对raid5 的重要性，不仅仅是计算校验需要，而且对性能的提升由为重要。

曾经测试过，在raid5的阵列中，如果关闭写cache，raid5的性能
将差很多倍。

这里，并不是说cache对raid10就不重要了，因为写缓冲，读命中等，都是提高速度的关键所在，不过的是，raid10对cache的依赖性没有raid5那么明显
而已。

到这里，大家应当也大致明白了raid5与raid10的原理与差别了，一般来说，象小io的数据库类型操作，建议采用raid10，而大型文件存储，数据仓库，则
从空间利用的角度，可以采用raid5。

上面我们分析了raid5与raid10的内部运行细节，这里我们主要分析一下存储阵列的瓶颈，因为瓶颈的出现，与raid方式是有很大差别的，所以我们需要先分析raid5与raid10的具体差别。

阵列的瓶颈主要体现在2个方面，吞吐量与IOPS。

1、吞吐量
吞吐量主要取决于阵列的构架，光纤通道的大小（现在阵列一般都是光纤阵列，至于SCSI这样的SSA阵列，我们不讨论）以及硬盘的个数。

阵列的构架与每个阵列不同而不同，他们也都存在内部带宽（类似于pc的系统总线），不过一般情况下，内部带宽都设计的很充足，不是瓶颈的所在。

最后说一下硬盘的限制，这里是最重要的，当前面的瓶颈不再存在的时候，就要看硬盘的个数了，我下面列一下不同的硬盘所能支撑的流量大小：
10 K rpm 15 K rpm ATA
—————————
10M/s 13M/s 8M/s
那么，假定一个阵列有120块15K rpm的光纤硬盘，那么硬盘上最大的可以支撑的流量为120*13=1560MB/s，如果是2Gb的光纤卡，可能需要6块才能够，而4Gb的光纤卡，3-4块就够了。

2、IOPS
决定IOPS的主要取决与阵列的算法，cache命中率，以及磁盘个数。

cache的命中率取决于数据的分布，cache size的大小，数据访问的规则，以及cache的算法，如果完整的讨论下来，这里将变得很复杂，可以有一天好讨论了。

我这里只强调一个cache的命中率，如果一个阵列，读cache的命中率越高越好，一般表示它可以支持更多的IOPS，为什么这么说呢？这个就与我们下面要讨论的硬盘IOPS有关系了。

硬盘的限制，每个物理硬盘能处理的IOPS是有限制的，如
10 K rpm 15 K rpm ATA
—————————
100 150 50
同样，如果一个阵列有120块15K rpm的光纤硬盘，那么，它能撑的最大IOPS为120*150=18000，这个为硬件限制的理论值，如果超过这个值，硬盘的响应可能会变的非常缓慢而不能正常提供业务。

另外，我们上一篇也讨论了，在raid5与raid10上，读iops没有差别，但是，相同的业务写iops，最终落在磁盘上的iops是有差别的，而我们评估的却正是磁盘的IOPS，如果达到了磁盘的限制，性能肯定是上不去了。

那我们假定一个case，业务的iops是10000，读cache命中率是30%，读iops为60%，写iops为40%，磁盘个数为120，那么分别计算在raid5与raid10的情况下，每个磁盘的iops为多少。

raid5:
这里的10000*(1-0.3)*0.6表示是读的iops，比例是0.6，除掉cache命中，实际只有4200个iops
而4 * (10000*0.4) 表示写的iops，因为每一个写，在raid5中，实际发生了4个io，所以写的iops为16000个
为了考虑raid5在写操作的时候，那2个读操作也可能发生命中，所以更精确的计算为：
计算出来单个盘的iops为148个，基本达到磁盘极限
raid10
可以看到，因为raid10对于一个写操作，只发生2次io，所以，同样的压力，同样的磁盘，每个盘的iops只有102个，还远远低于磁盘的极限iops。

在一个实际的case中，一个恢复压力很大的standby（这里主要是写，而且是小io的写），采用了raid5的方案，发现性能很差，通过分析，每个磁盘的iops 在高峰时期，快达到200了，导致响应速度巨慢无比。

后来改造成raid10，就避免了这个性能问题，每个磁盘的iops降到100左右。