存储体系结构
- 格式:pdf
- 大小:102.26 KB
- 文档页数:4
计算机四大基础知识点总结计算机是现代社会不可或缺的一部分,它已经深入到我们的生活中的方方面面。
无论是工作、学习还是娱乐,我们都需要计算机来帮助我们处理数据、提高效率。
而要深入理解计算机,首先需要掌握计算机的四大基础知识点,包括计算机组织与体系结构、操作系统、数据结构与算法,以及编程语言。
一、计算机组织与体系结构1. 计算机的基本组成计算机主要由中央处理器(CPU)、随机存储器(RAM)、输入设备、输出设备和存储设备组成。
CPU是计算机的“大脑”,它负责执行指令、控制数据流通。
RAM是计算机的临时存储区域,用来存储数据和程序。
输入设备是用来输入数据和指令的设备,比如键盘、鼠标等。
输出设备是用来展示计算结果的设备,比如显示器、打印机等。
存储设备是用来长期存储数据和程序的设备,比如硬盘、光盘等。
2. 计算机的体系结构计算机的体系结构包括指令系统、总线结构、存储系统和输入/输出系统。
指令系统是CPU执行指令的集合,包括指令格式、寻址方式和指令执行的时序规定。
总线结构用于连接 CPU、内存和输入/输出设备,传输数据和指令。
存储系统包括RAM和存储设备,用来存储数据和程序。
输入/输出系统负责将数据从输入设备传输到存储设备或输出设备,以及从存储设备传输到输出设备。
3. 计算机的工作原理计算机工作的基本原理可以概括为:输入、处理、输出和存储。
首先,计算机通过输入设备接收数据和指令。
然后,CPU根据指令执行相应的运算和逻辑操作,得到结果。
最后,计算机将结果通过输出设备展示给用户,同时也会将数据和程序存储在存储设备里。
4. 计算机的性能指标计算机的性能指标包括速度、存储容量和可靠性。
速度是指计算机执行任务的快慢,通常用处理器的主频来表示。
存储容量是指计算机能够存储数据和程序的大小,通常用RAM和硬盘容量来表示。
可靠性是指计算机运行稳定性和故障率,通常用故障率和平均时间故障间隔来表示。
二、操作系统1. 操作系统的功能操作系统是计算机系统的核心软件,负责管理计算机的硬件资源和提供用户与计算机的接口。
冯·诺依曼体系结构(Von Neumann Architecture)是计算机系统的一种经典结构,以数学家、计算机科学家冯·诺依曼(John von Neumann)的名字命名。
它是一种基于存储程序的计算机设计原则,也是现代计算机体系结构的基础。
冯·诺依曼体系结构的基本内容包括:
存储程序:计算机内存中存储程序指令和数据的能力,使得计算机能够根据存储在内存中的程序顺序执行指令,而不需要对硬件进行重构。
指令集:指令集是计算机能够执行的基本指令的集合。
冯·诺依曼体系结构采用固定的指令集,其中包括算术运算、逻辑运算、数据传输等基本操作。
存储器:计算机内存用于存储指令和数据。
冯·诺依曼体系结构使用单一的存储器来存储指令和数据,这使得指令和数据具有相同的存储结构和访问方式。
运算器:运算器是执行算术和逻辑运算的部件。
它包括算术逻辑单元(ALU),用于执行加减乘除等算术运算和逻辑运算,并包含寄存器,用于存储中间结果和操作数。
控制器:控制器负责解析和执行存储在内存中的指令序列。
它从内存中获取指令,解码指令并控制其他部件的操作,以完成指令的执行。
输入输出设备:输入输出设备用于与计算机系统交互,例如键盘、鼠标、显示器、打印机等。
冯·诺依曼体系结构将输入输出设备视为与内存和处理器相分离的外部设备。
冯·诺依曼体系结构的设计思想为计算机的发展和进步奠定了基础,它具有指令的存储和执行的灵活性,使得计算机能够以顺序的方式执行复杂的程序。
现代计算机系统基本上都采用了冯·诺依曼体系结构,并在此基础上进行了各种改进和扩展。
一、冯·诺依曼体系结构的概念及发展1.1 冯·诺依曼体系结构的定义冯·诺依曼体系结构是计算机系统的基本结构,也称为存储程序式计算机结构。
它的特点是采用存储程序的方式来指挥计算机操作,将程序和数据存储在同一存储器中,并且采用顺序执行的方式来完成计算任务。
1.2 冯·诺依曼体系结构的发展历程冯·诺依曼体系结构最早由匈牙利裔美国数学家冯·诺依曼在上世纪40年代提出,随后逐渐被应用于计算机系统中。
冯·诺依曼体系结构的提出和应用,极大地推动了计算机科学和技术的发展,成为现代计算机系统的基本架构。
1.3 冯·诺依曼体系结构在计算机中的应用冯·诺依曼体系结构在现代计算机系统中得到了广泛的应用,包括个人电脑、工作站、服务器等各种类型的计算机系统,它为计算机的设计和应用提供了基本框架,成为计算机科学的基石。
二、冯·诺依曼体系结构的工作原理及要素冯·诺依曼体系结构的工作原理主要包括指令执行、数据存储和传输等基本操作,具体表现为程序和数据在存储器中的位置、指令执行的顺序和方式、数据的读写操作等内容。
2.2 冯·诺依曼体系结构的要素冯·诺依曼体系结构的要素主要包括中央处理器(CPU)、存储器、输入输出设备和系统总线等部分,它们协同工作,完成计算机的各种功能。
三、冯·诺依曼体系结构的价值和意义3.1 冯·诺依曼体系结构的价值冯·诺依曼体系结构为计算机系统的设计和应用提供了基本范式,使得计算机能够完成复杂的运算和数据处理任务,具有高效、可靠和灵活的特点。
3.2 冯·诺依曼体系结构的意义冯·诺依曼体系结构的意义在于它为计算机科学的发展提供了基本框架,推动了计算机系统的进步和发展,成为计算机科学的基础理论。
四、个人观点及理解从理论上来说,冯·诺依曼体系结构的提出和应用,极大地推动了计算机科学和技术的发展,成为现代计算机系统的基本架构,提高了计算机的工作效率和数据处理能力。
冯诺依曼体系结构的五大组成部分及功能冯诺依曼体系结构是计算机体系结构中最为经典和重要的设计理念之一,它是由数学家冯诺依曼在20世纪40年代提出的。
冯诺依曼体系结构主要包括五大组成部分,分别是运算器、控制器、存储器、输入设备和输出设备。
每个部分都有着独特的功能,在整个计算机系统中扮演着不可或缺的角色。
首先,运算器是冯诺依曼体系结构中的一个重要组成部分,它主要负责进行算术和逻辑运算。
运算器包括算术逻辑单元(ALU)和寄存器。
ALU用来执行各种算术运算(如加减乘除)和逻辑运算(如与或非),而寄存器则用来暂时存储运算结果或中间数据。
运算器通过接收指令和数据,进行计算,并将结果存储到寄存器中,为后续计算和处理提供数据支持。
其次,控制器是冯诺依曼体系结构中另一个重要的组成部分,它主要负责控制计算机系统的运行状态。
控制器包括指令寄存器、程序计数器和指令译码器等部件。
指令寄存器用来存储当前执行的指令,程序计数器用来记录下一条将要执行的指令的地址,而指令译码器则用来解析指令,确定执行的操作。
控制器根据指令的要求,协调运算器和存储器的工作,使整个计算机系统按照程序顺序执行。
第三,存储器是冯诺依曼体系结构中至关重要的组成部分,它主要负责存储计算机系统中的数据和程序。
存储器分为内存和外存两部分。
内存主要用来存储正在执行的程序和数据,是计算机系统中速度最快的存储器,通常被称为随机存取存储器(RAM)。
外存主要用来存储大量数据和程序,通常被称为磁盘或固态硬盘。
存储器通过读写操作,实现对数据和程序的存储和访问,为计算机系统提供数据支持。
第四,输入设备是冯诺依曼体系结构中重要的组成部分,它主要负责将外部数据和指令输入到计算机系统中。
输入设备包括键盘、鼠标、扫描仪等各种设备。
输入设备通过将外部数据转换为计算机可识别的格式,传输给存储器或控制器,为计算机系统提供输入数据和操作指令。
最后,输出设备是冯诺依曼体系结构中不可或缺的组成部分,它主要负责将计算机系统处理后的数据和结果输出给外部设备或用户。
一、选择题1.世界上首次提出存储程序计算机体系结构的是()A、莫奇莱B、艾仑·图灵C、乔治·布尔D、冯·诺依曼2.世界上第一台电子计算机是在()年诞生的。
A、1927B、1946C、l 943D、19523.以下关于“计算机的特点”的论述中错误的是()。
A.运算速度快、精度高B.具有记忆功能C.能按事先编制好的程序连续自动运行,不需要人工干预D.不能进行逻辑判断4.在计算机运算中使用的数制是()。
A.二进制B.八进制C.十进制D.十六进制5.在计算机中采用二进制的主要原因是()。
A。
两状态系统容易表示,成本低B.运算法则简单C.十进制在计算机中无法实现D.能够进行逻辑运算6。
以下关于“ASCII码”的论述中正确的是()。
A、ASCII码是美国信息交换标准代码的简称B、ASCII码是一种7位编码C、ASCII码基本字符集包括128个字符D、所以有ASCII码字符都可以打印显示7。
ASCII码是对进行编码的一种方案。
A、字符B、汉字C、图形符号D、声音8.通常所说的“病毒”是指()。
A、细菌感染B、生物病毒感染C、被损坏的程序D、特制的具有破坏性的程序9.计算机辅助设计的英文缩写是()。
A、CAIB、CAMC、CADD、CAT10.“存储程序”的工作原理的基本思想是()A、事先编制程序B、将程序存储在内存中C、在人工控制下执行每条指令D、自动从内存取指令并逐条执行11.断电后可以保存信息的设备有()。
A、RAMB、ROMC、EPROMD、磁盘12。
软盘封上写保护口可以确保防止()。
A、数据写入B、读数据出错C、数据丢失D、病毒侵入13.存储器分为内存储器和外存储器两类,()。
A、它们中的数据均可被CPU直接调用。
B、只有外存储器中的数据可被CPU调用。
C、它们中的数据均不能被CPU直接调用。
D、其中只有内存储器中的数据可被CPU直接调用。
14.微型计算机中,运算器、控制器和内存储器的总称是:()。
计算机体系结构-存储器的组成、C a c h e的映试题分析(总22页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除本章真题解析在本章的内容中,需要考生重点掌握的有存储器的组成、Cache的映像等。
本节按照研究生入学考试的试题样式,参考历年的真题和全国40所高校的研究生入学试题,组织了相关的真题及解析,供读者参考。
单项选择题例题1某计算机的Cache共有16块,采用2路组相联映射方式(即每组2块)。
每个主存块大小为32字节,按字节编址。
主存129号单元所在主存块应装入到的Cache组号是(1)。
[2009年试题14](1)A.0 B.2 C.4 D.6例题1分析组相联映射方式是将某一主存块j按模Q(Q是Cache的组数)映射到Cache的第i 组中的任一块,即i = j mod Q。
根据题目条件可知,Q=16/2=8组。
因为每个主存块大小为32字节,按字节编址,所以主存129号单元所在的主存块号为4(注意:从0开始计数),所以i=4 mod 8=4。
例题1答案(1)C例题2某计算机主存容量为64KB,其中ROM区为4KB,其余为RAM区,按字节编址。
现要用2K×8位的ROM芯片和4K×4位的RAM芯片来设计该存储器,则需要上述规格的ROM芯片数和RAM芯片数分别是(2)。
[2009年试题15](2)A.1、15 B.2、l5 C.1、30 D.2、30例题2分析因为1B=8位,ROM区的总大小为4KB,即为4K×8位,那么需要的ROM芯片数为:(4K×8位)/(2K×8位)=2片。
RAM区的总大小为64KB4KB=60KB,即60K×8位,那么需要的RAM芯片数为:(60K×8位)/(4K×4位)=30片。
例题2答案(2)D例题3假设某计算机的存储系统由Cache和主存组成。
Oracle 体系结构概述完整的Oracle 数据库系统通常由两个部分组成:实例(INSTANCE )和数据库(DATABASE )。
数据库是由一系列物理文件的集合(数据文件,控制文件,联机日志,参数文件等);实例则是由一组Oracle 后台进程/线程以及在服务器分配的共享内存区。
实例和数据库有时可以互换使用,不过二者的概念完全不同。
实例和数据库之间的关系是:数据库可以由多个实例装载和打开,而实例可以在任何时间点装载和打开一个数据库。
准确地讲,一个实例在其生存期中最多只能装载和打开一个数据库。
如果要想再打开其他数据库,必须先丢弃这个实例,并创建一个新的实例。
数据库的主要功能是保存数据,实际上可以将数据库看作是存储数据的容器。
数据库的存储结构也就是数据库存储数据的方式,Oracle 数据库的存储结构分为逻辑存储结构和物理存储结构,这两部分是相互独立但又密切相关的。
逻辑存储结构主要用于描述在Oracle 内部的组织和管理数据的方式,而物理存储结构则用于描述在Oracle 外部,即操作系统中组织和管理数据的方式。
Oracle 对逻辑存储结构和物理存储结构的管理是分别进行的,两者之间不直接影响。
因此Oracle 的逻辑存储结构能够适用于不同的操作系统平台和硬件平台,而不需要考虑物理实现方式。
在启动Oracle 数据库服务器时,实际上是在服务器的内存中创建一个Oracle 实例(即在服务器内存中分配共享内存并创建相关的后台进程),然后由这个实例来访问和控制磁盘中的数据文件。
图2-1以最简单的形式展示了Oracle 实例和数据库。
Oracle 有一个很大的内存块,称为系统全局区(SGA )。
文件文件文件文件文件数据库SGA后台进程后台进程后台进程后台进程后台进程后台进程后台进程实例图2-1 Oracle 实例和数据库当用户连接数据库时,实际上是连接到实例中,由实例负责与数据库通信息,然后再将处理结构返回给用户。
冯诺依曼体系结构1.冯·诺依曼体系结构概述数学家冯·诺依曼提出了计算机制造的三个基本原则(采⽤⼆进制、程序存储、顺序执⾏),以及计算机的五个组成部分(运算器、控制器、存储器、输⼊设备、输出设备),这套理论被称为冯·诺依曼体系结构,根据这⼀原理制造的计算机被称为冯·诺依曼结构计算机。
冯·诺依曼最先提出程序存储的思想,并成功将其运⽤在计算机的设计之中。
冯·诺伊曼体系结构是现代计算机的基础,现在⼤多计算机仍是冯·诺伊曼计算机的组织结构,因此冯·诺依曼⼜被称为“现代计算机之⽗”。
2.冯·诺依曼体系结构特点:(1)计算机处理的数据和指令⼀律⽤⼆进制数表⽰。
(2)指令和数据不加区别混合存储在同⼀个存储器中(硬盘)(3)顺序执⾏程序的每⼀条指令。
(重点是“顺序”)3.冯·诺依曼体系结构的计算机必须具备功能:(1)把需要的程序和数据送⾄计算机中(复制)(2)必须具有长期记忆程序、数据、中间结果及最终运算结果的能⼒(硬盘)(3)能够完成各种算术、逻辑运算和数据传送等数据加⼯处理的能⼒(ALU)(4)能够根据需要控制程序的⾛向,并能根据指令控制机器的各部件协调操作。
(5)能够按照要求将处理的结果输出给⽤户。
4.冯·诺依曼体系⼯作原理(CPU⼯作原理)程序的执⾏过程实际上是不断地取出指令、分析指令、执⾏指令的过程。
冯·诺依曼型计算机从本质上讲是采⽤串⾏顺序处理的⼯作机制,即使有关数据已经准备好了,也必须逐条执⾏指令序列,如下图所⽰:具体过程:(1)预先把指挥计算机如何进⾏操作的指令序列(就是程序)和原始数据输⼊到计算机内存中(拷贝),每条指令中明确规定了计算机从哪个地址取数,进⾏什么操作,然后送到什么地⽅去等步骤。
(2)计算机在执⾏时,先从内存中取出第⼀条指令,通过控制器的译码器接收指令的要求,再从存储器中取出数据进⾏指定的运算和逻辑操作等,然后再按地址把结果送到内存中,如果需要向硬盘等存储设备存储数据,还需要将内存中的该数据存储到硬盘中。
第5章存储层次1. 单级存储器的主要矛盾是什么?通常采取什么方法来解决?主要矛盾:(1) 速度越快,每位价格就越高。
(2) 容量越大,每位价格就越低。
(3) 容量越大,速度越慢。
采取多级存储层次方法来解决。
2. 评价存储层次的主要参数有哪些?存储层次的平均每位价格、命中率或失效率、平均访问时间。
3. “Cache-主存”和“主存-辅存”层次的主要区别是什么?4. 在存储层次中应解决哪四个问题?(1)映像规则:当把一个块调入高一层存储器时,可以放到哪些位置上。
(2)查找算法:当所要访问的块在高一层存储器中时,如何找到该块。
(3)替换算法:当发生失效时,应替换哪一块。
(4)写策略:当进行写访问时,应进行哪些操作。
5. 地址映像方法有哪几种?它们各有什么优缺点?(1)全相联映像。
实现查找的机制复杂,代价高,速度慢。
Cache空间的利用率较高,块冲突概率较低,因而Cache的失效率也低。
(2)直接映像。
实现查找的机制简单,速度快。
Cache空间的利用率较低,块冲突概率较高,因而Cache的失效率也高。
(3)组相联映像。
组相联是直接映像和全相联的一种折中。
6. 组相联Cache比相同容量的直接映像Cache的失效率低。
由此是否可以得出结论:采用组相联Cache一定能带来性能上的提高?为什么?不一定。
因为组相联命中率的提高是以增加命中时间为代价的,组相联需要增加多路选择开关。
7. Cache中,有哪两种实现并行查找的方法?(1)用相联存储器实现。
(2)用单体多字存储器和比较器来实现。
8. 替换算法有哪几种?它们各有什么优缺点?(1)随机法:简单、易于用硬件实现,但这种方法没有考虑Cache块过去被使用的情况,反映不了程序的局部性,所以其失效率比LRU的高。
(2)先进先出法:容易实现。
它虽然利用了同一组中各块进入Cache的顺序这一“历史”信息,但还是不能正确地反映程序的局部性。
(3)最近最少使用法LRU:失效率最低。
多媒体数据库系统的体系结构多媒体数据库系统是一种使用计算机来存储、管理和分发音频、视频、图片、文本以及其他媒体信息的系统。
它不仅能够将多媒体数据存储在同一个地方,还能够使用技术提供相关的媒体处理功能,如对媒体文件进行编辑、转换和打印等。
多媒体数据库系统的体系结构是由5个部分组成的:1. 存储层:存储层是多媒体数据库系统的核心组成部分,它负责存储和管理多媒体数据,并提供必要的安全性和可靠性。
一般情况下,存储层包括存储设备、磁盘驱动器、存储系统软件和多媒体数据库管理系统。
2. 网络层:网络层是多媒体数据库系统中最重要的一层,它负责多媒体数据的传输和分发。
网络层的主要组件包括路由器、交换机、网络接口卡和网络服务器等。
3. 数据处理层:数据处理层的作用是对多媒体数据进行操作和处理,使其适合用户的需求和要求。
数据处理层的主要组件包括多媒体处理器、多媒体编辑器、多媒体转换器和多媒体服务器等。
4. 用户界面层:用户界面层是多媒体数据库系统的最上层,它提供多媒体数据库系统的图形用户界面,以便用户可以轻松地浏览、搜索和管理多媒体数据。
用户界面层的主要组件包括多媒体浏览器、多媒体播放器和图形用户界面等。
5. 管理层:管理层是多媒体数据库系统的管理者,它负责对多媒体数据库系统的所有组件进行监控和管理,以确保多媒体数据库系统的正常运行。
管理层的主要组件包括安全管理器、资源管理器和数据库管理系统等。
以上就是多媒体数据库系统的体系结构,它具有高度的灵活性,可以根据用户的需求对多媒体数据库系统进行灵活的配置和安装,从而满足用户的不同需求。
多媒体数据库系统的体系结构具有高可用性和可扩展性,能够满足不同用户的多媒体数据的存储、管理和处理要求,为用户提供更好的服务。
DAS、NAS、SAN、P2P等存储系统的体系结构 在以数据为中心的信息时代,存储已成为IT基础设施的核心之一。数据存储已经成为继互联网热潮之后的又一次技术浪潮,它将网络带入了以数据为中心的时代。
由于近年来C/S计算模型的广泛采用,服务器都带有自己的存储系统,信息分散到各个服务器上,形成了所谓的“信息孤岛”,不利于信息整合与数据共享。而网络存储就是一种利于信息整合与数据共享,且易于管理的、安全的新型存储结构和技术。目前,网络存储已经成为一种新的存储技术,本文将从体系结构的角度简述目前的存储系统。
直接连接存储DAS 直接连接存储DAS(Direct Attached Storage)是对SCSI总线的进一步发展。它对外利用SCSI总线通道和多个主机连接,解决了SCSI卡只能连接到一个主机上的缺陷。对内利用SCSI总线通道或FC通道、IDE接口连接多个磁盘,并实现RAID技术,形成一个磁盘阵列,从而解决了数据容错、大存储空间的问题。
DAS是以服务器为中心的存储体系结构,难以满足现代存储应用大容量、高可靠、高可用、高性能、动态可扩展、易维护和开放性等多方面的需求。解决这一问题的关键是将访问模式从以服务器为中心转化为以数据和网络为中心,实现扩展容量、增加性能和延伸距离,尤其是实现多个主机数据的共享,这推动了存储与计算的分离,即网络存储的发展。
网络附属存储NAS NAS(附网存储系统)系统是用一个装有优化的文件系统和瘦操作系统的专用数据存储服务器,提供跨平台的文件共享功能。NAS产品与客户之间的通讯采用NFS(Network File System)协议、CIFS(Common Internet File System)协议,这些协议运行在IP之上。NAS的体系结构如图1所示。
尽管NAS集成了系统、存储和网络技术,具有扩展性强、使用与管理简单、跨平台文件共享、性能优化等特点。然而,NAS系统也有其潜在的局限性。首先是它受限的数据库支持,NAS文件服务器不支持需大量依赖于数据库处理结果的应用(块级应用)。其次是缺乏灵活性,它是一种专用设备。最后,NAS备份与恢复的实现相当困难。
存储区域网SAN SAN(存储区域网)是通过专用高速网将一个或多个网络存储设备(如磁盘阵列RAID)和服务器连接起来的专用存储系统。
SAN以数据存储为中心,采用可伸缩的网络拓扑结构,提供SAN内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储区域网内,实现最大限度的数据共享和数据优化管理,以及系统的无缝扩充。正是由于光纤通道技术的发展,使得SAN得以支持远距离通信、易于扩展、能够解决网络数据的存储备份、高可用性、灾难恢复等有关问题,它可以提供高性能数据管道和共享的集中管理的存储设备。因此采用网络和通道技术相互融合的光纤通道接口的SAN将LAN上的存储转换到主要由存储设备组成的专用网络上,使得数据的访问、备份和恢复不影响LAN的性能,在大量数据访问时,不会大幅度降低网络性能。
SAN主要用于存储量大的工作环境,并且SAN的适用性和通用性较差,在系统的安装和升级方面效率不高,且由于SAN使用专用网络(一般为光纤网络),相应的设备价格昂贵,总体实现费用较高,局限于大中型应用。
NAS和SAN技术都体现了数据存储从传统的服务器中独立出来的思想,它们是网络存储领域中的两个发展方向。随着NAS和SAN之间的界限越来越模糊,其中更重要的区别可能就是在NAS/SAN混合系统中所采用的协议了:IP、光纤通道,或者iSCSI等。
IP存储 传统的SAN一般采用光纤通道技术,其成本高,距离受限制,因此基于IP的存储正成为一个新的热点,主要有FCIP(Fibre Channel over IP)、iFCP(Internet Fibre Channel Protocol)、mFCP(Metro Fibre Channel Protocol)、iSCSI(Internet SCSI)等技术。
上述协议有一个非常重要的共同点:都能充当SCSI命令集的传输机制。通过IP存储介质与存储设备通信的主机仍能表达SCSI的含意。而iSCSI则是从主机到存储设备的整个传输链路就是一条IP链路,没有采用光纤通道,基于主机的应用通过IP与网络存储设备通信。iSCSI保持了SCSI命令集的原状,同时用IP取代了传输协议。但由于iSCSI通过映射至IP来保留SCSI命令集,存在延时问题,已有专门的iSCSI芯片组把转换代码部署在硬件当中。IP-SAN的优势在于:容易扩展成超大规模的存储网络;不必受光纤通道SAN的距离限制,连接在IP网络上的服务器都能享用网络存储服务;连接灵活多样,廉价成熟的网络架构成本,使得高端也能达到Gbps速率,有较高的性能价格比。
集群存储 由于目前一些存储应用受容量可扩展性、性能可扩展性、可用性、可管理性的挑战,“催生”了许多存储集群系统的产生。集群存储是将每个存储设备作为一个存储节点,通过高速互联网络连接起来,将数据分散开存储在多台独立的设备上,这些设备可以独立运作,相互之间又可以合作。每个I/O节点不仅可以访问本节点的存储空间,还可以访问其他节点的存储空间。所有存储节点的空间以一个虚拟磁盘的方式提供给客户端用户。组成集群存储可以是块级别的SAN集群、文件级别的NAS集群和并行文件系统的集群,它们的访问、特征与适用环境参见表1。 集群存储有效地提升了存储设备的容量可扩展性、性能稳定性及系统可管理性。集群存储非常适合那些持续增长的所有规模的不同环境,实现即时供应(Just-in-time)存储,避免破坏性升级和增加管理的复杂性。在大型数据中心或高性能计算中心的集群存储解决方案,具有高性价比,简单、易于维护,高可靠性/可用性,具有非常高的整合带宽等优点。集群存储最典型系统是Google体系结构,它是大量机器内硬盘的组合,含899个机架(每架80台PC,每台PC有2个硬盘),共79,112台PC机,有158,224个硬盘, 总容量为6180 TB。
对等(P2P)存储 对等结构(P2P)从用户的使用方式来看,系统中每个用户既向其他用户提供资源,也从其他用户那里获取资源。从体系结构来看,无中心结构,结点之间对等,通过互相合作来完成用户任务。P2P结构的优点表现在:没有中心结点,不易形成系统瓶颈、不易受攻击,可扩展性好,自组织性好。
用P2P的方式在广域网中构建大规模分布式存储系统,将很多机器用对等的方式组织起来共同为用户提供超大容量的数据存储服务,存储结点来自于存储服务方,用户使用存储空间并付费,用户还通过该平台自主寻找其他结点进行数据备份和存储空间交换。
P2P存储与SAN的应用特点不同。前者主要强调可用性,而SAN主要面向的是高性能;P2P存储易于维护、可扩展好、自配置功能强,特别是P2P存储可以大量加盟的PC机和服务器中的存储器来组合成存储系统,提供高带宽的视频服务和其他共享服务。
集群存储与P2P存储都是分布式存储。前者多在大型数据中心或高性能计算中心使用,后者是构建更大规模的分布式存储系统,可以跨多个大型数据中心或高性能计算中心使用。
网格存储 所有的存储、服务器和网络资源都被虚拟为一个资源池,并将其视作共享资源,这个资源池就是存储网格。存储网格的关键是虚拟化与统一性管理问题。
存储网格既可应用于SAN环境,又可应用于NAS环境,它提供快速简单的对于容量、性能、服务质量和/或连接协议的可升级性,可对公司所有数据进行统一查看和管理,远远超出当前有限的虚拟化实现途径,还可优化分布式企业远程数据访问的性能。存储网格架构可实现数据库和企业之间更紧密的应用整合,提供更高的数据保护,并可基于有关规定更简单地管理数据资源。这些优势极大降低了用户在购买、扩容和管理时的费用。
面向对象的存储 对象存储模型综合了NAS和SAN结构的特点,存储对象具有文件和块二者的优点:像数据块一样在存储设备上被直接访问,通过一个对象接口,像文件一样,在不同操作系统平台上实现数据共享。在SAN中,定位逻辑和文件系统都位于主机中。而在面向对象的存储中,存储空间不再需要运行在主机上的文件系统管理,而由存储系统自己管理和分配。
一个存储对象是关于一个存储设备的逻辑字节集合,它有存储方法、数据属性和存储安全策略等。因此,对象存储系统在基于文件级的数据布局、服务质量的灵活性和可管理等方面有很大改善。另外,基于对象存储的最直接效果是将空间管理从存储应用中剥离,如图2所示,存储设备具有自管理特性,包括重新组织数据来提高性能、调用规则的备份和失败恢复等。
未来存储设备的特性可能包括自配置、自保护、自优化、自恢复和自管理。将块接口用对象来代替是一个发展方向。目前,面向对象的存储仍然处在标准制定之中,还没有得到广泛的接受。
内容寻址存储CAS 内容寻址存储(Content Addressed Storage,CAS)是针对固定内容存储需求的网络存储技术。CAS具有面向对象存储特征,基于磁记录技术,它按照所存储数据内容的数字指纹寻址,具有良好的可搜索性、安全性、可靠性和扩展性。CAS、SAN和NAS的区别参见表2。CAS存储技术的代表性产品是EMC公司的Centera 系统,目前还具有非常多的局限性。
数据库只针对的是结构化数据,而大量非结构化的数据管理有更大的存储需求,而内容管理的对象是以各类非结构化数据为主的数字内容。CAS技术的出现使非结构化数据管理(包括企业的各种文档、报表、账单、网页、图片、传真、扫描影像,以及大量的多媒体音频、视频信息等等的归档和查询)成为存储业新的热点。未来需要一种新的基于内容管理的存储系统平台,它扩展了最新的对象存储体系结构,支持对象仓储和联邦数据库技术,支持关系和 XML作为主要数据模型,并紧密地集成了内容管理服务、工作流、消息传递、分析和其他企业应用程序服务。
基于IB的存储 InfiniBand(IB)是针对处理器和智能I/O设备之间数据流而提出的一种新体系结构,用于在服务器中取代PCI总线。采用IB技术支持多处理器集群,将允许服务器提供更高的带宽和可扩展能力,并增强了存储设备扩充的灵活性,并用于支持远程I/O和远程存储器,如图3所示。IB作为一种能够为系统与存储之间提供低延迟和高带宽的连接解决方案,已经为一些用户所接受,预期基于IB的存储将在存储领域会占有一席之地。
上述是从系统的角度简述了一些存储系统的特点。目前存储技术日新月异,我们将分别一一加以论述。上述许多内容引用了同行的相关工作,在此不一一列出,一并表示感谢。