当前位置:文档之家› 高性能计算、分布式计算、网格计算、云计算概念与区别

高性能计算、分布式计算、网格计算、云计算概念与区别

高性能计算、分布式计算、网格计算、云计算概念与区别
高性能计算、分布式计算、网格计算、云计算概念与区别

高性能计算、分布式计算、网格计算、云计算--概念和区别

《程序员》2009-02 P34

“见证高性能计算21年”

高性能计算(High Performance Computing)HPC是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。

分布式计算是利用互联网上的计算机的中央处理器的闲置处理能力来解决大型计算问题的一种计算科学。

网格计算也是一种分布式计算。网格计算的思路是聚合分布资源,支持虚拟组织,提供高层次的服务,例如分布协同科学研究等。网格计算更多地面向科研应用,商业模型不清晰。网格计算则是聚合分散的资源,支持大型集中式应用(一个大的应用分到多处执行)。

云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算的资源相对集中,主要以数据中心的形式提供底层资源的使用,并不强调虚拟组织(VO)的概念。云计算从诞生开始就是针对企业商业应用,商业模型比较清晰。云计算是以相对集中的资源,运行分散的应用(大量分散的应用在若干大的中心执行);

目录

高性能计算、分布式计算、网格计算、云计算--概念和区别 (1)

高性能计算 (3)

百科名片 (3)

概念 (3)

服务领域 (3)

网格 (5)

百科名片 (5)

网格的产生 (5)

网格技术的特征及其体系结构 (5)

高性能计算机的发展与应用 (17)

我国高性能计算机应用前景及发展中的问题 (17)

高性能计算机与大众生活息息相关 (17)

高性能计算机发展任重道远 (18)

分布式计算、网格计算和云计算 (21)

分布式计算 (21)

网格计算 (21)

云计算 (22)

网格计算和云计算的概念和区别 (24)

目标不同 (24)

分配资源方式的不同 (25)

殊途同归 (26)

钱德沛教授:云计算和网格计算差别何在? (27)

云计算与网格计算的概念 (27)

网格计算的特点是什么呢? (27)

云计算与网格计算区别何在 (28)

高性能计算

百科名片

随着科技的发展,人们要求处理事情的速度也在不断的提高,正所谓“高效率办事,快节奏生活”,因此高性能计算(High Performance Computing)也就应运而生,高性能计算机在高性能运算中扮演了重要的角色,高性能计算机的出现,云计算(Cloud Computing)的概念也随之而生,作为一种全新的商业和应用模式“云计算”成为互联网和IT巨头追逐的热点。

概念

简单的说,高性能计算(High Performance Computing)是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。

高性能计算(HPC) 指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)的计算系统和环境。有许多类型的HPC系统,其范围从标准计算机的大型集群,到高度专用的硬件。

大多数基于集群的HPC 系统使用高性能网络互连,比如那些来自InfiniBand 或Myrinet 的网络互连。基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的环境中,网状网络系统在主机之间提供较短的潜伏期,所以可改善总体网络性能和传输速率。

服务领域

随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高,不仅石油勘探、气象预报、航天国防、科学研究等需求高性能计算机,而且金融、政府信息化、教育、企业、网络游戏等更广泛的领域对高性能计算的需求迅猛增长。

随着科技的发展,人们要求处理事情的速度也在不断的提高,正所谓“高效率办事,快节奏生活”,因此高性能计算(High Performance Computing)也就

应运而生,高性能计算机在高性能运算中扮演了重要的角色,高性能计算机的出现,云计算(Cloud Computing)的概念也随之而生,作为一种全新的商业和应用模式“云计算”成为互联网和IT巨头追逐的热点。

高性能计算机是人类探索未知世界的最有力的武器,高性能技术计算解决方案的本质是支持全面分析、快速决策,即通过收集、分析和处理全面的材料、大量原始资料以及模拟自然现象或产品,以最快的速度得到最终分析结果,揭示客观规律、支持科学决策。对科研工作者来说,这意味着减少科学突破的时间、增加突破的深度;对工程师来说,这意味着缩短新产品上市的时间、增加复杂设计的可信度;对国家来说,这意味着提高综合国力和参与全球竞争的实力。

网格

百科名片

在生物学中,网格是由支柱和细层组成的网格状骨骼结构。在通信学中,网格是一种用于集成或共享地理上分布的各种资源(包括计算机系统、存储系统、通信系统、文件、数据库、程序等),使之成为有机的整体,共同完成各种所需任务的机制。

网格的产生

网格(Grid)这个词来自于电力网格(PowerGrid)。“网格”与“电力网格”形神相似。一方面,计算机网纵横交错,很像电力网;另一方面,电力网格用高压线路把分散在各地的发电站连接在一起,向用户提供源源不断的电力。用户只需插上插头、打开开关就能用电,一点都不需要关心电能是从哪个电站送来的,也不需要知道是水力电、火力电还是核能电。建设网格的目的也是一样,其最终目的是希望它能够把分布在因特网上数以亿计的计算机、存储器、贵重设备、数据库等结合起来,形成一个虚拟的、空前强大的超级计算机,满足不断增长的计算、存储需求,并使信息世界成为一个有机的整体。

网格技术的特征及其体系结构

网络技术的特征

网格技术的特征

在介绍网格的特征之前,我们首先要解决一个重要的问题:网格是不是分布式系统?这个问题之所以必须回答,因为人们常常会问另一个相关的问题:"为什么我们需要网格?现在已经有很多系统(比如海关报关系统、飞机订票系统)实现了资源共享与协同工作。这些系统与网格有什么区别?"

对这个问题的简要回答是:网格是一种分布式系统,但网格不同于传统的分布式系统。IBM Global Service与EDS是在这个分布式领域最著名的公司。构建分布式系统有三种方法:即传统方法(我们称之为EDS方法)、分布自律系统(Autonomous Decentralized Systems, ADS)方法,网格(grid)方法。ADS通常用于工业控制系统中。网格方法与传统方法的区别见下表:

特征传统分布式系统网格

开放性需求和技术有一定确定性、封闭性开放技术、开放系统

通用性专门领域、专有技术通用技术

集中性很可能是统一规划、集中控制一般而言是自然进化、非集中控制

使用模式常常是终端模式或C/S模式服务模式为主

标准化领域标准或行业标准通用标准(+行业标准)

平台性应用解决方案平台或基础设施

通过以上对比,网格具有以下四点优势:

(1)资源共享,消除资源孤岛:网格能够提供资源共享,它能消除信息孤岛、实现应用程序的互连互通。网格与计算机网络不同,计算机网络实现的是一种硬件的连通,而网格能实现应用层面的连通。

(2)协同工作:网格第二个特点是协同工作,很多网格结点可以共同处理一个项目。

(3)通用开放标准,非集中控制,非平凡服务质量:这是Ian Foster最近提出的网格检验标准。网格是基于国际的开放技术标准,这跟以前很多行业、部门或者公司推出的软件产品不一样。

(4)动态功能,高度可扩展性:网格可以提供动态的服务,能够适应变化。同时网格并非限制性的,它实现了高度的可扩展性。

网格的体系特征

网格之所以能有以上所说的种种优势特征,是由网格的体系结构赋予它的。网格体系结构的主要功能是划分系统基本组件,指定组件的目的与功能,刻画组件之间的相互作用,整合各部分组件。科研工作者已经提出并实现了若干种合理的网格体系结构。下面介绍目前影响比较广泛的两个网格体系结构:网格计算协议体系结构(Grid Protocol Architecture,GPA)和计算经济网格体系结构(GRACE)模型。

OGSA(Open Grid Services Architecture)被称为是下一代的网格体系结构,它是在原来“五层沙漏结构”的基础上,结合最新的Web Service 技术提出来的。OGSA包括两大关键技术即网格技术和Web Service 技术。

随着网格计算研究的深入,人们越来越发现网格体系结构的重要。网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分和各部分功能的定义和描述,网格各部分相互关系与集成方法的规定,网格有效运行机制的刻画。显然,网格体系结构是网格的骨架和灵魂,是网格最核心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格,才能够使网格有效地发挥作用。

OGSA最突出的思想就是以“服务”为中心。在OGSA框架中,将一切都抽象为服务,包括计算机、程序、数据、仪器设备等。这种观念,有利于通过统一的标准接口来管理和使用网格。Web Service提供了一种基于服务的框架结构,但是,Web Service 面对的一般都是永久服务,而在网格应用环境中,大量的是临时性的短暂服务,比如一个计算任务的执行等。考虑到网格环境的具体特点,OGSA 在原来Web Service 服务概念的基础上,提出了“网格服务(Grid Service)”的概念,用于解决服务发现、动态服务创建、服务生命周

期管理等与临时服务有关的问题。

基于网格服务的概念,OGSA 将整个网格看作是“网格服务”的集合,但是这个集合不是一成不变的,是可以扩展的,这反映了网格的动态特性。网格服务通过定义接口来完成不同的功能,服务数据是关于网格服务实例的信息,因此网格服务可以简单地表示为“网格服务=接口/行为+服务数据”。

在目前,网格服务提供的接口还比较有限,OGSA 还在不断的完善过程之中,下一步将考虑扩充管理、安全等等方面的内容。

网络协议体系结构

Ian Foster于2001年提出了网格计算协议体系结构,认为网格建设的核心是标准化的协议与服务,并与Internet网络协议进行类比(如图1)。该结构主要包括以下五个层次:构造层(Fabric):控制局部的资源。由物理或逻辑实体组成,目的是为上层提供共享的资源。常用的物理资源包括计算资源、存储系统、目录、网络资源等;逻辑资源包括分布式文件系统、分布计算池、计算机群等。构造层组件的功能受高层需求影响,基本功能包括资源查询和资源管理的QoS保证。

连接层(Connectivity):支持便利安全的通信。该层定义了网格中安全通信与认证授权控制的核心协议。资源间的数据交换和授权认证、安全控制都在这一层控制实现。该层组件提供单点登录、代理委托、同本地安全策略的整合和基于用户的信任策略等功能。

资源层(Resource):共享单一资源。该层建立在连接层的通信和认证协议之上,满足安全会话、资源初始化、资源运行状况监测、资源使用状况统计等需求,通过调用构造层函数来访问和控制局部资源。

汇集层(Collective):协调各种资源。该层将资源层提交的受控资源汇集在一起,供虚拟组织的应用程序共享和调用。该层组件可以实现各种共享行为,包括目录服务、资源协同、资源监测诊断、数据复制、负荷控制、账户管理等功能。

应用层(Application):为网格上用户的应用程序层。应用层是在虚拟组织环境中存在的。应用程序通过各层的应用程序编程接口(API)调用相应的服务,再通过服务调动网格上的资源来完成任务。为便于网格应用程序的开发,需要构建支持网格计算的大型函数库。

当今网格的运用

现在国内国外运用得最多的可能是在一些大型院校的计算网格(实现计算资源的共享。什么是计算资源:简单来说就是计算能力,CPU。计算资源共享就是CPU计算的共享)。人们把一个集群(cluster, 也就是常说的机房,通常有几十台操作系统为Linux的计算机)的计算机连成一个局域型网格。这样就好像把这几十台电脑连成了一台超级计算机,计算能力当然大大提高了。这种局域计算网格主要运用于一些科研的研究。比如说生物科学。当生物科学的研究员需要高性能的计算资源来帮助他们分析试验的结果时,他们就把这些分析试验的程序提交(submit)给网格,网格通过计算再把结果返回给这些研究员。计算结果

可能是一些图像(rendering)也可能是一些数据。这些计算如果在单一PC(Personal computer, 个人计算机)上运行的话,往往会花费几个月的时间,然而在网格中运行一,两天也就完成了。这就是网格技术最直观的优点之一。当然现在有一些大型主机(super-mainframe)也有很强的计算能力(比如常说的IBM deepblue,打败人类国际象棋大师Kasparov那位),但是这种主机太昂贵,而且配置(deploy)往往不方便,是名副其实的重量级(heavyweight)计算。SETI@Home(SETI@Home's,一个分布式计算的项目,通过互联网络上的计算机搜索地球外智慧讯息,网格在分布式计算的成功运用。)的网站指出,世界上最强大的计算机IBM 的ASCI White,可以实现每秒12万亿次的浮点运算,但是花费了1亿千万美元;然而SETI@HOME 只用了50万美元却实现了每秒15万亿次浮点运算。

网格另外一个显著的运用可能就是虚拟组织(Virtual Organisations)。这种虚拟组织往往是针对与某一个特定的项目,或者是某一类特定研究人员。在这里面可以实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。比如说中国2008年奥运会开幕式研究组就可以运用网格组成一个虚拟组织。在这个虚拟组织里,任何成员不管在哪个地方都可以有权访问组织的共享资源(如开幕式场地图纸,开幕式资金,开幕式节目单);而且可以和另一地方的虚拟组织成员进行交流。这个虚拟组织就像把所有奥运会开幕式的资源,信息,以及人员集中到了一个虚拟的空间,让人们集中精力研讨开幕式项目的问题,而不必考虑其他的问题。据个实例,由英国利兹大学,牛津大学,约克大学和谢菲尔德大学合作的DAME项目就是致力于研究和运用虚拟组织。DAME架构在这四个大学合建的白玫瑰网格White Rose Computational Grid (WRCG)上,运用于对飞机故障的快速检测和维修。

网格基础设施组件

首先,我们来看看有哪些典型的网格基础设施组件,每一种组件如何对应用程序的架构、设计和部署产生影响。下面是网格基础设施中的一些主要组件:

安全性。安全性是网格计算中的重要问题。每一种网格资源都可能需要遵从多种不同的安全策略。单点登录认证是一种必不可少的方法。得到普遍遵守的协商授权机制也是很必要的。

资源管理。当提交一项任务的时候,网格资源管理器需要考虑如何为该任务指派资源、如何监视其状态以及如何返回它的执行结果。

信息服务。由于网格资源管理器在指派资源之前要经过综合全面的考虑,因此它需要知道哪些网格资源是可用的,以及这些资源的容量与当前使用的情况。这些有关网格资源的知识是通过网格信息服务(Grid Information Service,GIS)维护和提供的,又称为监视与发现服务(Monitoring and Discovery Service,MDS)。

数据管理。数据管理主要解决任务如何传输数据以及如何访问共享存储的问题。

下面让我们以Globus Toolkit为例分别详细讨论一下每一种组件。

安全性

如果您是一名用户,要在远程系统上运行一项任务,您会关心远程系统是否安全,是否能保证其他人不能访问到您的数据。如果您是提供资源的一方,用户可以在您的系统中执行任务,那么您必须确信所有的任务都不会遭到破坏和干扰,也不能访问您系统中的其他私有数据。除了这两方面的内容之外,网格环境也面临着一般分布式计算环境中存在的其他所有安全问题。

网格安全基础设施(Grid Security Infrastructure,GSI)是Globus Toolkit 的基础,它提供了很多工具,可以帮助我们对网格环境中的安全问题进行管理。在您开发面向网格环境的应用程序时,您的脑子里必须时刻考虑到安全问题,并用GSI 提供的工具来解决这些问题。网格架构中与安全性有关的功能主要负责完成认证、授权以及实现网格资源之间的安全通信。

在应用程序中启用网格时的考虑:安全性。当我们设计一个能够使用网格的应用程序时,安全性问题必须考虑在内。下面的列表总结了需要考虑的一些问题:

单点登录。跨系统的ID 映射。如上所述,GSI 提供了认证、授权以及安全的通信。然而,您需要对安全性管理及其含义有深刻完整的理解。比如说:您是否可以将多个用户映射到目标系统中的同一个用户ID 上?是否需要特定的审计机制来确定实际发起应用程序的是哪一个用户?应用程序不应该要求在使用网格上的不同资源时使用不同的用户ID 映射机制。

多种平台。尽管GSI 基于开放的标准化软件,可以在多种平台上运行,然而各种不同的平台其底层的安全机制并不总是一致。比如说,在传统的UNIX 或基于Linux 的系统上,读、写、执行等操作的安全机制就与微软的Windows 环境不同。您应该考虑应用程序可能运行的平台。

使用GSI。对于任何应用程序特有的、且可能需要进行认证或特殊授权的功能而言,应用程序的设计应该使用GSI,这样能够简化开发,并通过维护单一的登录机制,使用户的体验也得到简化。

数据加密。尽管GSI 与后文将要讨论到的数据管理工具一起,提供了跨网络的安全通信与数据加密,但是您也应该考虑到,当数据到达目的地的时候会发生什么事情。比如说,如果一些敏感的数据传递到某项资源上供任务使用,随后又以非加密的格式保存到本地磁盘上,那么其他的用户或应用程序也就能访问这些数据了。

资源管理

网格资源管理器致力于在任务提交时进行资源指派。它的角色就像是异质网格资源的抽象接口。资源管理组件提供的工具可以将任务分配给特定的资源,可以提供一种手段,在任务运行过程中获取任务状态信息,并获取任务完成的信息,还可以提供终止任务或对其进行管理的能力。在Globus 中,远程任务提交是由Globus Resource Allocation Manager (GRAM)负责处理的。

在应用程序中启用网格时的考虑:资源管理。在与资源管理相关的应用程序架构、设计和部署方面,有一些问题需要考虑。GRAM 最简单的形式是用于发出globusrun 命令,在特定系统上发起一项任务。然而,应用程序必须与MDS 一起(通常是通过一个代理函数)保证使用了适当的目标资源。下面列出一些需要考虑的内容:

选择适当的资源。通过与代理联合工作,来保证选择适当的目标资源。这就要求应用程序能够正确地指定所需的环境(操作系统、处理器、速度、内存,等等)。您为排除特定的依赖关系付出的努力越多,找到可用资源完成任务的机率也就越高。

多子任务。如果应用程序中包含多个任务,您必须理解(并降低)它们之间的相互依赖关系。否则,您就不得不构建一段逻辑来处理下面这些问题:

进程间通信

数据共享

并行任务提交

访问任务的执行结果。

如果一项任务返回的是一个简单的状态值,或是输出数据量很少,那么应用程序可以仅仅通过stdout 和stderr 来获取这些数据。要是必须获取相当复杂的结果,这时就可能需要将结果写入一个文件,并通过适当的工具,供目标机获取/传输这个文件。

任务管理。GRAM 提供了查询任务状态的机制,还可以执行诸如终止任务之类的操作。应用程序可能会在必要的时候使用这些功能为用户提供反馈、清除或释放资源的操作。比如说,如果应用程序内有一项任务失败了,其他依赖于这项任务的结果的任务可能就需要终止,以免无端消耗过多资源。

信息服务

信息服务是网格基础设施中至关重要的组件。它们维护了关于资源可用性、处理能力、当前使用情况的知识。不论在哪个网格中,CPU 和数据资源的情况都是不断变动的,这种变动与其处理任务与共享数据的能力有关。随着网格中的资源不断被释放,资源的状态可以在网格信息服务中得到更新。客户机、代理、网格资源管理器等等综合这部分信息来进行资源的指派。信息服务提供方是指那些为目录提供资源状态信息的程序。下面列出一些如何收集信息的实例:

静态主机信息

操作系统名称、版本号、处理器提供商/类型/版本/速率/缓存大小、处理器数量、物理内存总量、虚存总量、设备、服务类型/协议/端口号等。

动态主机信息

负载水平、队列入口等。

存储系统信息

磁盘空间总量、可用磁盘容量等。网络信息。

网络带宽、延迟、是否可测量与可预报。

高度动态的信息

空闲物理内存,空闲虚拟内存、空闲处理器数量等。

网络信息服务

网格信息服务,又称为监视与发现服务,在Globus 中负责提供信息服务。MDS 使用轻量级目录访问协议(Lightweight Directory Access Protocol,LDAP)作为访问资源信息的接口。

在应用程序中启用网格时的考虑:信息服务。对信息服务来说,需要考虑下面这些问题:

必须完全理解特定任务的需求,这样才能对查询进行正确地格式化,以返回适当的资源。这一点非常重要。必须保证MDS 中保存有适当的信息。在MDS 中,缺省情况下包含大量关于网格中所含资源的数据。不过,如果您的应用程序要求使用特定的资源或信息,而缺省情况下没有提供,您就需要编写您自己的信息提供方,并把适当的资源加入模式中。这样,您的应用程序或代理就可以进行查询,看特定的资源或请求是否已经存在。

MDS 可以用匿名帐号访问,或是经由一台已经通过GSI 认证的代理来访问。应用程序开发人员需要保证,能够在必要的时候通过一台经过认证的代理。您的网格环境可能具有多级别的目录结构。根据环境及其拓扑的复杂程度不同,您应该保证能够访问适当的目录,在其中搜索您所要求的资源。

数据管理

当您在构建网格的时候,网格中最重要的资产就是您的数据。在您的设计当中,您将必须确定您对数据的需求,以及如何在整个基础设施中移动数据,要么就是如何用一种安全有效的方式访问所需的数据。您可以通过一组标准化的网格协议与您设计的任何数据资源进行通信。您也可以选择构建一个联邦数据库,创建一个虚拟的数据存储。还有其他一些选择,如存储区域网(Srorage Area Network)、网络文件系统,以及专用的存储服务器等。

Globus 为网格环境提供了GridFTP 和Global Access to Secondary Storage (GASS)两种数据传输机制。此外,它还提供了一种复制管理机制,可以帮助您管理和访问数据集的副本。在应用程序中启用网格时的考虑:数据管理。数据管理问题源自如何最大化地使用有限的存储空间、网络带宽、计算资源等。下面列出一些在应用程序设计和实现中需要考虑的数据管理问题:

数据集的大小。对于大的数据集来说,要想将它移动到实际运行任务的系统上是不现实,甚至是不可能的。可能的解决方案是使用数据复制、或将完整数据集的一个子集拷贝到目标系统中。地理上分散的用户、数据、计算以及存储资源。如果您的目标网格在地理上是分散的,网络连接的速度也有限,那么您在设计的时候就必须考虑到如何进行慢速和受限的数据访问。

在广域网上进行数据传输。当您要在Internet 或者其他的WAN 上移动数据时,必须考虑安全性、可靠性以及性能等问题。您必须构建一些必要的逻辑来处理数据访问速度慢,甚至被阻断的情况。数据传输的调度。下面两种情况至少要考虑一种:第一个是数据传输的调度,这样当需要某项数据的时候数据就在它适当的位置上了。比如说,如果数据传输需要进行一个小时,而使用这项数据的任务必须在凌晨两点钟开始运行,那么您就应该提前对数据传输进行调度,这样,当需要它的任务运行的时候,数据就是可用的了。第二个是了解进出任何一项资源的任何并发文件传输的数量与规模。

选择数据副本。如果您使用Globus Data Replication 服务,也许想向应用程序中增加一段选择适当副本的逻辑,也就是说,您想要选择一个包含所需数据的副本,同时还要满足您对性能的要求。

调度器

Globus Toolkit 没有提供任务调度器,也没有提供元任务调度器(meta-scheduler)。不过,有一些任务调度器已经和Globus 集成起来了,还有一些也可以集成进来。

在网格中,任务调度与负载平衡是十分重要的功能。大多数网格系统中都包括某种任务调度软件。这种软件可以查找到某台机器的位置,并在上面执行用户提交的网格任务。有些调度器实现了按照任务优先级进行调度的系统。优先级的实现方式有时是使用多个任务队列,其中每一个队列都代表不同的优先级。当网格计算机可以执行任务的时候,就从优先级最高的队列中取出第一个任务。通过调度器还可以实现各种不同类型的策略。策略中可以包含多种对任务、用户、以及资源的约束。比如说,可能有一种策略限制在一天的某些特定时间执行网格任务。

调度器通常会对实时网格负载做出反应。它们在提交任务之前,会用反映当前机器使用情况的量测信息来确定哪些机器不忙。调度器可以组织成层次结构。比如说,元调度器将任务提交给群集调度器,或其他低层调度器,而不直接提交给独立的计算机。更高级些的调度器可以对所调度的任务的执行过程进行监视,从而对整体工作流实施管理。如果由于系统或网络的原因而导致一些任务丢失,好的调度器会自动在别的地方重新提交任务。然而,如果某个任务进入死循环,运行的时间超过了某个最大时间,那么这样的任务就不应该再重

新调度了。典型情况下,各种任务具有不同类型的结束代码,其中一些结束代码适合于用于重新提交任务,而另一些则不适合。

我们通过一个预约系统可以实现在网格中提前保留资源。这种机制不仅仅是调度器。它首先是一种基于日历的系统,可以在特定的时间段内保留资源,防止其他任务在同一时间内使用该资源。它还必须能在预约的时间到达的时候将任意机器或资源上正在执行的任务删除或挂起。

在应用程序中启用网格时的考虑:调度器。当您为网格环境启用应用程序的时候,需要考虑一些与调度有关的问题。下面列出其中一些:

数据管理。意思是保证当所调度的任务运行时具备可用的数据。如果需要将数据移动到待执行的节点上,那么我们还需要对数据的移动操作也进行调度。

通信。任何相关任务的进程间通信都要求对任务进行并行调度。

调度器的作用域。在具有多个调度器(如具备元调度器)的环境中,要协调并发任务,或保证特定的任务在指定的时间执行,这些工作的复杂程度很高,当不同的调度器具有不同的作用域时,情况就更加复杂。

调度策略。调度可以有不同的实现目标。

面向应用程序——调度的优化目标是实现最佳运行时间。

面向系统——调度的优化目标是实现最大吞吐量。任务可能不会立即开始。在执行的过程中也可能被终端或抢占。也可以将任务调度为通宵执行。

网格信息服务。调度器和信息服务之间的交互可能十分复杂。比如说,如果在任务实际运行之前通过MDS 找到了某项资源,然后,我们可以假设在任务实际运行之前该资源的状态不会发生变化。或者我们可以建立一种预测能力更强的机制,提前预测资源状态可能发生的变化,从而提前做出调度决定。

资源代理。通常情况下,资源代理必须与调度器接口。

负载平衡。负载平衡问题是由于工作负载在网格系统资源中的分散特性所引起的。尽管Globus Toolkit 没有提供负载平衡的功能,而在某些特定环境中,负载平衡服务却是必需的特性。当作业被提交到网格任务管理器中时,工作负载可以通过推模式(push model)、拉模式(pull model)或组合模式(combined model)进行分布。推模式的简单实现是通过循环的方式将任务发送到网格资源上。然而,这个模型没有考虑到任务队列的长度。如果每一个网格资源上都发送到相同数目的任务,那么在速度较慢的机器上会形成较长的任务队列,而一个长时间运行的任务在不受到细心监视的情况下可能阻塞其他的任务,使之根本无法启动。对于这个问题,一种解决方案是使用加权循环的方案。

在拉模式中,网格资源从任务队列中获取任务。在这样的模式下,任务队列的同步化与串行化就成为协调多个网格资源的任务获取的必要手段。本地及全局任务队列的策略也是可行的。在本地拉模式策略中,每一组网格资源都指派为从一个本地任务队列获取任务。在全局拉模式策略中,所有的网格资源都被指派使用同一个任务队列。本地拉模式的优势在于能够对网格资源进行分片。比如说,离数据比较接近的,或相互有关的,或要求使用相似资源的某些任务,都可以用这种方法进行控制。

推模式和拉模式的组合模式可以解决前面提到的一些问题。每一个网格资源可以决

定何时能接收更多的工作,并向网格任务服务器发送工作请求。然后,任务服务器就向其发送新的工作。

在这两种负载平衡模式下,都需要考虑故障恢复的条件。我们需要检测出哪些网格资源已经无法继续操作了,在推模式中,不能把新的工作发送给已经失效的资源。此外,无论是在推模式还是在拉模式中,我们必须细心控制所有已经提交的但尚未完成的任务。失效主机上的所有未完成任务都需要进行重新分配,或者由同一组中的其他可运行主机接管过来。

在应用程序中启用网格时的考虑:负载平衡。当您为网格环境启用应用程序的时候,还需要考虑与负载平衡有关的设计问题。应用程序设计和开发人员需要理解目前的负载平衡机制是什么样子(手工、推、拉、或是某种混合模式),这会对应用程序,特别是它的性能和运行时间产生影响。如果应用程序中具有大量独立的任务,每一个都可能受到负载平衡系统的影响或控制,那么这样的应用程序就可以从网格整体性能和吞吐量的提高当中获益,不过这个应用程序也可能需要建立更加复杂的机制,以便处理将任务延迟、或在整个网格内移动任务所带来的复杂性问题。

代理。在网格环境中,代理的职责非常重要。在很多网格环境中都可能需要实现这个组件,而实现它的方法可以相对简单,也可能十分复杂。代理的基本职责是在服务请求者和服务提供者之间提供匹配服务。在网格环境中,服务请求者可能是应用程序,也可能是被提交执行的任务。服务提供者就是网格资源。

Globus 工具箱并没有提供代理的功能。不过它通过监视与发现服务(MDS)提供了网格信息服务。您可以对MDS 进行查询,从而发现主机、计算机和网络的属性,如当前可用处理器个数、所提供的带宽以及可用的存储类型等等。

在应用程序中启用网格时的考虑:代理。当您设计在网格环境中运行的应用程序时,很重要的一点是理解资源是如何被发现和分配的。可能需要应用程序告诉代理它的资源要求是什么,这样代理就可以保证给这个应用程序分配适当的资源。

进程间通信(IPC)网格系统中可能包含帮助任务之间相互通信的软件。比如说,应用程序可能会将自身划分为大量的子任务。这些子任务当中的每一个都是网格中的一个独立的任务。不过,应用程序的算法可能要求子任务之间相互通信,传递一些信息。这些子任务要能够定位其他特定的子任务,与之建立通信连接,并发送适当的数据。消息传递接口(Message Passing Interface,MPI)是一项开放标准,它及其若干变种经常作为网格系统的一部分来解决诸如此类的问题。

在应用程序中启用网格时的考虑:IPC。在任务之间进行进程间通信的需求总是会增加应用程序的复杂程度,因此只要有可能,您就应该将这种通信减到最少。然而,在大规模的复杂应用程序中,进程间通信通常是不可避免的。在这种情况下,您应该充分理解可用的IPC 机制,并将失败或通信速度变慢带来的影响降到最低,这样有助于保证整个应用程序的成功。

非功能性需求

下面我们将讨论一些与基础设施有关的其他问题。这些问题被称为非功能性需求,是因为它们与网格中某项特定的功能单元没有关系,如任务管理、代理等。

性能

当您考虑在网格环境中启用应用程序时,网格的性能以及应用程序对性能的要求必须被考虑在内。服务请求者对服务的质量比较感兴趣,如可接受的运行时间等。当然了,如果您要构建一个网格及一个或多个应用程序,用来在网格中提供服务,那么服务提供者也希望能最大程度地利用网格中的功能和吞吐量。

可靠性

可靠性是计算领域内永恒的话题,网格环境也不例外。实现这一难题最好的方法是预见所有可能出现的失败情况,并提供解决这些情况的手段。最可靠的方法能够“容纳异常情况的出现”(surprise tolerant)。网格计算的基础设施必须处理主机中断和网络中断等情况。下面列出一些需要考虑的方法:

使用检查点-重启机制。

用持久性存储保存中间结果。

用心跳监视机制跟踪系统状态。

用健壮的系统管理解决方案最大程度地提高网格及其组件的可用性。

拓扑问题

网格计算的分布式本质使地理上和组织机构上的大跨度变得不可避免。随着内部网格的拓扑扩展为外部网格拓扑,复杂程度也逐渐提高。比如说,非功能性操作需求,安全性、目录服务、可靠性、性能等都变得更加复杂。让我们来研究一下拓扑的问题。

网络拓扑。网格架构内的网络拓扑可能在很多不同方面上呈现出来。网络组件可以表示LAN 或校园网的连通性,甚至还能表示网格网络之间WAN 的通信情况。网络的职责是为所有的网格系统提供充足的带宽。像基础设施中其他的组件一样,我们可以通过定制网络来提供更高级别的可用性、性能以及安全性。

出于安全性以及其他一些架构性的限制,网格系统从很大程度上来说是网络密集型的。尤其是数据网格,它可能在整个企业的网络内散布着一些存储资源,因此在基础设施的设计中,为了保证足够的性能,关键因素就在于处理数量巨大的网络负载。

启用应用程序时应该考虑的问题包括如何使网络通信量最小,如何使网络延迟最短。假设应用程序的设计已经能够保证最小的网络通信量,那么就有几种方法可以使网络延迟最短。比如说,千兆以太局域网可以用来支持高速群集,或实现远程网络之间的高速Internet 骨干网。

数据拓扑。我们最希望把任务指派到距离它所使用的数据最近的机器上执行。这样可以降低网络的通信量,还可能降低可测量性方面的限制。

数据需要存储空间。在一个网格的设计中,存储的可能性问题是没有止境的。存储要求一定的安全性、要可以进行备份、要可管理,还/或要进行复制。在网格的设计中,您需要确定您的数据对于需要它的资源来说一直是可用的。除了可用性之外,您还需要保证数据得到适当的保护,因为您不能让未经授权的人访问到敏感的数据。最后,您需要最佳的数据访问性能。显然,带宽和访问数据的距离两者是相互有关的,但是您不会希望让I/O 问题阻碍网格应用程序的运行速度。对于那些磁盘密集型的应用程序,或是数据网格而言,您

可以将工作重点更多地放在存储资源上,比如您可以使用那些能够提供更高容量、冗余程度或容错机制的存储。

混合平台环境

网格环境是一组异质的主机,它们具有不同的操作系统和软件栈。为了执行应用程序,网格基础架构需要知道应用程序能够找到所匹配的网格主机环境的先决条件。您必须考虑多种不同的因素,然后才能使应用程序在类型与数量都尽可能多的环境中执行,这一点十分重要。

运行时需要考虑的问题。应用程序的运行时需求及网格主机的运行时环境必须相匹配。例如,下面列出Java 应用程序在这方面的一些要求。用其他编程语言开发的应用程序也可能存在类似的要求。

Java 虚拟机(JVM)。用Java 编程语言编写的应用程序要求具备Java 虚拟机(JVM)。Java 应用程序可能对JVM 的版本变化很敏感。为了解决这种敏感性,应用程序需要对JVM 版本号进行识别,这是匹配的先决条件。这项先决条件的内容可能是要求某种JVM 版本号,或是某个最小JVM 版本号。Java 应用程序也可能对Java 堆的大小敏感。Java 应用程序需要把最小堆容量作为先决条件。Java 包的类型,如J2SE、或J2EE 等,也可能是先决条件的一部分。

应用程序的跨平台可用性(可移植性)。应用程序的可执行性是与特定的平台有关的。比如说,用C 或C++ 语言编写的应用程序需要在目标平台上进行重新编译,然后才能运行。您可以为每一种平台重新编译一次应用程序,得到的可执行程序就标记为目标平台上的。这种做法能够增加应用程序能够运行的网格主机数目。它的局限性在于将应用程序移植到其他平台上时所花费的成本。

了解OS 环境。网格是一组异质计算资源。如果应用程序依赖于某种特定的操作系统。那么该应用程序就需要验证网格中是否具有正确的环境,并处理环境不同所带来的问题。

输出文件格式。当一台网格主机上运行的应用程序的输出信息被另一台网格主机上运行的应用程序所访问的时候,了解输出文件的格式就显得十分必要了。这两台网格主机可能具有不同的平台环境。您可以考虑用XML 作为数据交换的格式。XML 现在已经十分流行,它不仅仅是一种用于数据交换的标记语言,还是一种用于存储半结构化的数据格式。

当您要在网格环境中启用某个应用程序时,必须充分理解网格环境中的功能性组件和非功能性因素,如性能要求或操作系统要求等。

高性能计算机的发展与应用

我国高性能计算机应用前景及发展中的问题

高性能计算机是衡量一个国家综合国力的重要标志,是国家信息化建设的根本保证。发展高性能计算机,可以带动科学技术的进步,解决国民经济建设、社会发展进步、国防建设与国家安全等方面一系列的挑战性问题,促进我国相关产业的快速发展。

衡量高性能计算机的水准主要是看其计算能力。60年前,当每秒能完成数千次运算的第一台数字计算机诞生时,它就是当时最高计算能力的体现。近30年来,计算机的运算速度平均每10年就要翻1000倍,这比我们通常说的每18个月翻一番的摩尔定律速度还要快。在进入新世纪的今天,恐怕每秒5万亿次到10万亿次的运算速度只能算是高性能计算机入门的门槛。当今世界上最快的计算机,美国的蓝色基因计算机,每秒钟已经可以执行180多万亿次浮点运算,而每秒千万亿次浮点运算能力的计算机的问世也指日可待。

高性能计算机与大众生活息息相关

高性能计算机一般都和科学研究联系在一起,小到原子结构的分析,大到宇宙起源模拟,到处都需要高性能计算机。但是,高性能计算机的应用决不仅限于此。在和人民大众生活息息相关的各个领域,我们都可以看到高性能计算机的身影——工农业生产和人民生活需要精确的天气预报。今年夏天台风“麦莎”与北京的擦肩而过以及飓风“卡特丽娜”对美国新奥尔良的正面重创说明我们多么需要精确的天气预报。以高性能计算为基础的气象和气候数值预报是精确天气预报的基础。我们知道,地球连同它的大气层是一个大系统,它的内部以及它与宇宙空间,特别是与太阳之间的能量交换与转换决定了地球上的气候状况。如果我们能够在观察数据的基础上,精确地计算和模拟出这个系统内能量转换的过程,我们就可以精确地预测天气的变化。现在的高性能计算机的速度还不足以让我们在全球

范围以精确的尺度达到这个目的。

——对新药研制的促进。在与疾病作斗争的过程中,我们需要新的药品。研制一种新药从化合物筛选到临床试验,一般需要10到15年的时间。在化合物筛选阶段,对于数十万种化合物,用传统的实验手段,筛选出有效的化合物需要花费大量资金购买化合物,需要几年的实验时间,而且筛选—的范围受到金钱和时间限制,难以得到最佳的结果。现在使用高性能计算机这个工具,以计算机模拟的手段,科学家可以在较短的时间内从几十万甚至几百万种化合物中筛选出有效的药物化合物,这不仅节省了购买真实化合物的大量资金,而且大大缩短了药物研发的周期。

——对网络信息服务的影响。在网络日益普及的今天,我们已经渐渐习惯于从网上获得信息和服务,但是同时也经常为服务响应速度的迟缓而烦恼。网络信息服务绝不是我们通常想象的找一台微机服务器,建个网站就能成的事。要面对数千万、数亿用户的访问请求,服务器必须有强大的数据吞吐和处理能力。这又是高性能计算机发挥作用的舞台。高性能服务器每秒种可以处理数千万乃至数亿次服务请求,及时提供用户所需要的信息和服务,保证服务质量。

——对制造业的推动。我国是一个制造业大国,被人们称为“世界工厂”。高性能计算在制造业的广泛使用,不仅可以帮助工程师在设计阶段更科学地计算材料强度,更合理地选择和使用材料,设计出更符合空气和流体动力学原理和人体工程的产品结构和外形,而且可以在仿真基础上全面规划整个制造过程,有效提高产品制造的质量和产量。基于高性能计算的全数字化设计制造环境在缩短产品设计周期、节能降耗、降低污染、提高产品质量方面的作用不可限量。用高性能计算能力武装起来的制造业必然能更快速地应对市场的动态需求,提高自身的竞争能力。

高性能计算机发展任重道远

高性能计算机的制造是一项非常复杂的系统工程,提高计算机的性能有许多关键问题有待解决。比如,高性能计算机中的并行、互联和体系结构问题,还有数据吞吐能力以及高效率工作的问题等等。

尽管我国已经能够制造十万亿次级的高性能计算机,但是高性能计算的整体

水平比起美国、日本和欧洲发达国家仍有较大的差距。当前制约我国高性能计算发展的主要因素有

1.核心技术不足

我国制造的高性能计算机在核心技术上虽有不少突破,但仍然在很大程度上依赖于国外。在高性能计算机体系结构和关键技术上投入的研究经费和研究力量不足,阻碍我国在该领域的创新。

2.人才不足

高性能计算机的应用目标往往是解决综合性、系统性的复杂问题,涉及多个领域。开发一个好的高性能计算应用涉及应用问题抽象、模型建立、并行算法研究、并行程序实现、应用系统测试验证等多个阶段,需要熟悉应用和计算的“多面手”型人才,需要不同学科、不同技术背景的人员的密切合作。而我国高校目前的专业划分难以培养既熟悉先进计算机技术,又熟悉应用领域问题的人才,以至于这类人才奇缺。不同学科的科技人员之间的交流和合作机制又不健全,造成懂高性能计算机的人不懂应用,而了解应用的人又不知道如何用高性能计算的方法来解决问题的局面。

3.应用软件

匮乏我国长期以来存在的重硬件、轻软件的现象在高性能计算领域格外突出,影响更大。对于高性能计算机而言,缺乏合适的应用软件就根本无法开展相应的应用,也无法吸引用户来使用高性能计算机。高性能计算机上运行的应用软件专业性强,价格昂贵,国内应用部门每年都花费大量经费,采购应用软件,但是这种采购一般是分散进行的,缺少相互协调,因此国家整体布局还不尽合理,有些软件多个部门重复采购,而另一些急需的软件又没人购买。另外,单个部门购买软件的规模往往有限,不能与并行硬件的规模相适应。这些软件的所有权和使用权属于采购的部门,不同部门拥有的软件难以交流和共享。此外,很多国外的应用软件都和国外的高性能计算机系统绑定,这就迫使我国的用户在采购软件的同时必须选用

国外的硬件系统,严重影响国产高性能计算机的推广应用和我国高性能计算机产业的成长壮大。

4.资源分布不均匀

国内高性能计算机主要分布在科研院所、大学以及石油勘探、气象预报等应用部门,地域分布也不均匀。资源分布的不均匀和资源访问的困难,使得不少高性能计算的潜在用户放弃了应用的打算。在经济效益不够好的传统产业尤其如此。这种资源分布的不均匀性一方面使需要资源的用户难以获得资源,另一方面也造成宝贵资源的闲置和浪费。

我国的高性能计算事业必须走可持续均衡发展的道路。从应用需求出发应该是基本的原则。高性能计算是昂贵的,不仅有设备的初始投入,而且有场地条件、电力消耗、运行维护和人员队伍建设等多种费用。因此,一定要切实从应用需求出发,大力促进应用的进步,以此推动高性能计算的发展。

强调应用需求牵引并不是忽视技术的推动作用。技术的进步可以创造新的应用,调动新的应用需求。要通过技术进步改善高性能计算机使用的方式,降低高性能计算应用开发的难度,降低其技术门槛。网格技术是一种有利于高性能计算应用普及的新技术。网格以其资源共享、协同工作的固有能力和网格服务的形式,支持用户共享使用Internet中的各类资源,网格允许用户克服地理的障碍,更便捷地获得高性能计算的能力,网格简化高性能计算机的使用方式,使更多的普通用户能够利用高性能计算机的能力去解决过去难以解决的问题,扩大了高性能计算机的应用范围。需要强调的是,高性能计算的技术创新有赖于国家持续的支持,以保证足够的研究经费和一支高水平精干的研究队伍。

高性能计算人才的培养是一项长期的艰巨任务,不仅要通过改革高校的学科划分和专业设置来加强高性能计算复合型人才的培养,还要通过应用系统的开发,培养和锻炼各个行业与领域熟悉高性能计算的人才,只有这样才能真正保证高性能计算及应用的可持续发展。

(作者单位:北京航空航天大学北京100083)

云计算的发展热点与未来趋势

班级:仪器11402 姓名:李学智学号:201406277 当前云计算的发展热点与未来趋势 目前,云计算被认为是未来的IT发展趋势。云计算的应用形式各种各样,但是,有关于云计算的应用却并不是很容易被用户接受的,虽然很多企业组织正在积极的探寻关于云计算的发展战略,可预测未来云计算的发展趋势,将其作为是未来云计算的突破口参考。 一、目前云计算的发展现状 云计算的发展趋势在行业中已经取得共识。它的影响已经逐渐渗透到整个产业以及用户的应用中。云计算将赋予互联网更大的内涵,在某种程度上,它改变互联网企业的运营模式,通过云计算,更多的应用能够以互联网服务的方式交付与运行。云计算将扩大IT软,硬件产品应用的外延,并且改变了软硬件产品的应用模式。IT产品的开发方向也会发生改变来适应上述云计算带来的变化。很多业界领先代表,微软,谷歌,亚马逊等等业界领先代表都推出了自己的云计算产品和方案。如:谷歌推出GDrive服务;AOL的Xdrive服务;亚马逊云计算;HDS,EMC,NetApp先后将云计算和云存储的落地作为今后整体渠道策略调整的关键点;EMC宣布发展目标直指虚拟化和私有云建设;NetApp致力于拓展系统集成商和云存储业务。除此之外,HDS、EMC、NetApp在云存储等方面也取得较好效果。 二、未来云计算的发展趋势 云计算作为一种应用模式,它的出现和应用范围的日益扩大,必将对产业链的上下游产生重要影响,它在不断的适应着企业的需求。未来根据需求进行着不断增多,云计算将要如何发展?经过调查分析有以下几个方向: (一)混合云的发展方向 虽然现在很多企业都已经采用了云服务,但是对于大部分的企业来说,基本上采用的都是多个云服务供应商,包括公共云与私有云,以满足不同的需求。公有云与私有云的组合被大家称之混合云,混合云的优势是能够适应不同的平台需求,它既能提供私有云的安全性,也可以提供公有云的开放性。所以在未来混合云的发展是云服务的主流模式。 (二)大数据分析 大数据如是高科技的热门话题,大数据分析使云计算和大数据能够很好结合。云计算是可以扩展,可以覆盖到大数据领域的,这些云服务能够为云计算提供平台,开源的云平台为大数据提供更好的开发与分析。 (三)SMB应用程序保护 现在,大多数的中小企业还是无法承受整个应用程序的测试层序与昂贵的工具进行内部检查安全和数据保护等应用的,期待新的云计算技能够帮助企业利用Web应用程序来进行源代码的扫描,协助企业及时发现潜在的一些网络攻击,从而来按需求提供帮助,降低企业的费用。 (四)强调性能

云计算与信息安全

云计算与信息安全 信息安全是当前计算机科学的一个研究热点;云计算是一个新的技术,给信息安全提供了挑战和机遇。介绍了云计算的基本概念、云计算的安全问题,通过云计算用户以及云计算服务提供商两方面分析了云计算中确保信息安全的方法。 论文关键词:云计算,网格计算,信息安全,云安全 0 引言 信息作为一种资源,它的普遍性、共享性、增值性、可处理性和多效用性,使其对于人类具有特别重要的意义。信息安全的实质就是要保护信息系统或信息网络中的信息资源免受各种类型的威胁、干扰和破坏,即保证信息的安全性。信息安全服务至少应该包括支持信息网络安全服务的基本理论,以及基于新一代信息网络体系结构的网络安全服务体系结构。 1 云计算简介 何为云(cloud)?云实际上就是互联网(Internet)的别称,其实是指分布在Internet 中的形形色色的计算中心,包含成千上万甚至几十万、几百万台计算机或服务器。用户不再购买高性能的硬件,也不再购买或开发各种功能的软件,而是使用任何可上网的设备,连接'云' ,利用'云'提供的软件或服务,直接在'云'上处理并存储数据。云计算的概念最早可以追溯到图灵奖得主Jone McCarthy 在60年代发表的观点:“计算有可能在未来成为一种公共设施。”进入21世纪后,SaaS (Software as a Service),软件服务的概念越来越广泛的应用于业界。随后,从2007年开始,云计算开始出现,包括Google、Amazon、IBM、Microsoft 等业界的领袖企业都宣布了各自的与技术项目。 简言之网格计算,云计算( cloud computing)是一种基于Internet的计算。在云计算中,存储和运算将不再运行在本地计算机或服务器中,而是运行在分布于Internet上的大量计算机上,也就是说,云计算通过把原来由个人计算机和私有数据中心执行的任务转移给分布在Internet上由全体用户共享的大型计算中心来完成,实现了计算机硬件、软件等计算资源及对这些计算资源进行安装、配置与维护等服务资源的充分共享论文服务。 但是云计算远远不止这些。云计算目前的主要架构是基于一个新一代的数据中心,提供虚拟的计算和存储资源。而这些资源的消费和使用,可以按照事先规定的可以计量的标准进行收费。 2 云计算的安全问题 尽管很多研究机构认为云计算提供了最可靠、最安全的数据存储中心,但安全问题是云计算存在的主要问题之一。

高性能计算、分布式计算、网格计算、云计算概念与区别

高性能计算、分布式计算、网格计算、云计算--概念和区别 《程序员》2009-02 P34 “见证高性能计算21年” 高性能计算(High Performance Computing)HPC是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。 分布式计算是利用互联网上的计算机的中央处理器的闲置处理能力来解决大型计算问题的一种计算科学。 网格计算也是一种分布式计算。网格计算的思路是聚合分布资源,支持虚拟组织,提供高层次的服务,例如分布协同科学研究等。网格计算更多地面向科研应用,商业模型不清晰。网格计算则是聚合分散的资源,支持大型集中式应用(一个大的应用分到多处执行)。 云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算的资源相对集中,主要以数据中心的形式提供底层资源的使用,并不强调虚拟组织(VO)的概念。云计算从诞生开始就是针对企业商业应用,商业模型比较清晰。云计算是以相对集中的资源,运行分散的应用(大量分散的应用在若干大的中心执行);

目录 高性能计算、分布式计算、网格计算、云计算--概念和区别 (1) 高性能计算 (3) 百科名片 (3) 概念 (3) 服务领域 (3) 网格 (5) 百科名片 (5) 网格的产生 (5) 网格技术的特征及其体系结构 (5) 高性能计算机的发展与应用 (17) 我国高性能计算机应用前景及发展中的问题 (17) 高性能计算机与大众生活息息相关 (17) 高性能计算机发展任重道远 (18) 分布式计算、网格计算和云计算 (21) 分布式计算 (21) 网格计算 (21) 云计算 (22) 网格计算和云计算的概念和区别 (24) 目标不同 (24) 分配资源方式的不同 (25) 殊途同归 (26) 钱德沛教授:云计算和网格计算差别何在? (27) 云计算与网格计算的概念 (27) 网格计算的特点是什么呢? (27) 云计算与网格计算区别何在 (28)

云计算的概念及特点

云计算概念 云计算是近5年兴起的一种网络应用模式。该应用的独特性在于它是完全建立在可自我维护和管理的虚拟资源层上的。使用者可以按不同需求动态改变需要访问的资源和服务的种类和数量。对于云计算的理解,分为狭义和广义的两类。 狭义云计算是指狭义云计算是指IT基础设施的交付和使用模式;广义云计算是指服务的交付和使用模式。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务,它具有超大规模、虚拟化、可靠安全等独特功效。 云计算特点 (1)计算资源集成提高设备计算能力 云计算把大量计算资源集中到一个公共资源池中,通过多主租用的方式共享计算资源。虽然单个用户在云计算平台获得服务水平受到网络带宽等各因素影响,未必获得优于本地主机所提供的服务,但是从整个社会资源的角度而言整体的资源调控降低了部分地区峰值荷载提高了部分荒废的主机的运行率,从而提高资源利用率。 (2)分布式数据中心保证系统容灾能力 分布式数据中心可将云端的用户信息备份到地理上相互隔离的数据库主机中,甚至用户自己也无法判断信息的确切备份地点。该特点不仅仅提供了数据恢复的依据,也使得网络病毒和网络黑客的攻击失去目的性而变成徒劳,大大提高系统的安全性和容灾能力。 (3)软硬件相互隔离减少设备依赖性 虚拟化层将云平台上方的应用软件和下方的基础设备隔离开来。技术设备的维护者无法看到设备中运行的具体应用。同时对软件层的用户而言基础设备层透明的,用户只能看到虚拟化层中虚拟出来的各类设备。这种架构减少了设备依赖性,也为动态的资源配置提供可能。 (4)平台模块化设计体现高可扩展性 目前主流的云计算平台均根据SPI架构在各层集成功能各异的软硬件设备和中间件软件。大量中间件软件和设备提供针对该平台的通用接口,允许用户添加本层的扩展设备。部分云与云之间提供对应接口,允许用户在不同云之间进行数据迁移。类似功能更大程度上满足了用户需求,集成了计算资源,是未来云计算的发展方向之一。(5)虚拟资源池为用户提供弹性服务 云平台管理软件将整合的计算资源根据应用访问的具体情况进行动态调整,包括增大或减少资源的要求。因此云计算对于在非恒定需求的应用,如对需求波动很大、阶段性需求等,具有非常好的应用效果。在云计算环境中,既可以对规律性需求通过事先预测事先分配,也可根据事先设定的规则进行实时公台调整。弹性的云服务可帮助用户在任意时间得到满足需求的计算资源。 (6)按需付费降低使用成本 作为云计算的代表按需提供服务按需付费是目前各类云计算服务中不可或缺的一部分。对用户而言,云计算不但省去了基础设备的购置运维费用,而且能根据企业成长的需要不断扩展订购的服务,不断更换更加适合的服务,提高了资金的利用率。 1

云计算系统概述及前景分析

职业素质教育课程报告—云计算系统概述及前景分析

引言 云,这个平淡无奇的词到了互联网领域就是另一片天空,云计算、云存储、云阅读等等。近日与所有人息息相关的快递业发生的菜鸟快递与顺丰之争背后隐藏着阿里云与腾讯云对数据的你争我夺。事实上,云是指你作为接受服务的对象,是云端,不管你在何时何地,都能享受云计算提供的服务。云是网络、互联网的一种比喻说法。本文将要讨论的云计算也是云的应用之一。本文将要简要的探讨云计算的定义,并对云计算的系统架构及相关技术做一个简要的归纳梳理,最后就云计算在当下的典型应用分析其行业发展前景。 一云计算定义 云计算到底是什么呢?云计算到目前为止还没有一个统一的定义。云计算的一些领先者如Google、IBM等IT厂商又或者其他一些研究机构,依据各自的利益和各自不同的研究视角都给出了各自对云计算的定义和理解。 首先参考维基百科的定义,“云计算是一种基于互联网的计算新方式,通过互联网上异构、自治的服务为个人和企业用户提供按需即取的计算”;咨询机构Gartner将云计算定义为“云计算是利用互联网技术来将庞大且可伸缩的IT能力集合起来作为服务提供给多个客户的技术”;而IBM 则认为“云计算是一种新兴的IT服务交付方式,应用、数据和计算资源能够通过网络作为标准服务在灵活的价格下快速地提供最终用户。”

图1 云计算示意图 狭义层次的云计算是指IT基础设施的交付和使用模式,通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。广义层面而言云计算则指服务的交付和使用模式,通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以是任意其它的服务。具体而言,由于在后端有规模庞大、非常自动化和高可靠性的云计算中心的存在,人们只要接入互联网,就能非常方便地访问各种基于云的应用和信息,并免去了安装和维护硬件等繁琐操作,同时,企业和个人也能以低廉的价格来使用这些由云计算中心提供的服务或者在云中直接搭建其所需的信息服务。 二云计算体系架构 云计算可以按需提供弹性的服务资源,故而它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架构可大致分为核心服务、服务管理、用户访问接口这三层构架。 核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。服务

云计算的基本概念——什么是云计算、如何理解云计算、云计算的内涵、云计算技术的核心

一、什么是云计算? 云计算是指通过网络以按需、易扩展的方式来获得所需的信息服务,因 此,云计算又常常被称为云服务。 二、如何理解云计算? 云计算中的“云”是一个形象的比喻,也就是说——大家以云可大可 小、可以飘来飘去的这些特点来形容云计算中服务能力和信息资源的伸 缩性和后台服务设施的位置透明性。 三、云计算的内涵: 不同的人从不同的角度来看云计算,都会有或多或少的不同, 如果从技术和系统角度来看,云计算的内涵应该包括以下8大部分: 1、IaaS———基础设施即服务,主要包括存储设施、计算设施和网 络设施等 2、PaaS———平台即服务,主要包括开发平台、运营管理平台等 3、SaaS———软件即服务,主要指各种可供云用户直接使用的各种 应用 4、云安全——回答如何保障各种云服务的安全问题,主要包括存储 安全、访问安全、传输安全、服务连续性等 5、云质量——回答如何保障各种云服务的质量问题,主要包括速度、 精度等 6、云标准——回答如何把上述5类问题标准化,以确保质量和不断 改进等 7、云运维——回答如何通过技术、管理等综合手段,确保整个云服 务系统的质量和不断改进等 8、云运营——回答如何通过整合上述7类问题,向用户提供乐意购 买的云服务等 在上述8大部分中,IaaS、PaaS和SaaS所对应的3个层次构成了云计算系统的基本技术架构,可把它称为“云计算的三层模式”,而云安全、云质量、云标准、云运维和云运营为整个云计算系统(又称为云服务系统)提供了全局保障。这8大部分的有机结合,确保了云服务系统可以向云用户提供高效率高质量的云服务。 四、云计算技术的核心是什么? 云计算技术包含着很多内容,但其中最为关键的是虚拟化和高速网络, 换句话说,云计算是伴随着虚拟化和高速网络的发展和成熟而诞生的, 从这个角度来看,虚拟化和高速网络是云计算的基石。 五. 为什么虚拟化技术对云计算那么重要? 云计算的核心是实现弹性计算,目前来看,虚拟化技术是利用物理设备实现弹性计算的最好的技术,其逻辑思路是“物理→抽象→虚拟”,未来将会向自动化和智能化发展。 六.为什么说云计算是一种商业模式? 简单地来说,商业模式就是指怎么卖东西。

云计算与几种常见计算的区别

云计算与几种常见计算的区别 集群计算(Cluster Computing) 计算机系统中,集群是将多个计算机,如PC或UNIX工作站,多个存储设备,以冗余方式互联,组成一个对用户来说是单一的高可用性的系统。集群计算能够被用来实现负载均衡,对一个企业来说,集群在许多情况下,能够达到高达99.999%的可用性。集群对外界来说,就像是一个唯一的计算机系统,用户好像在使用一台超级计算机,程序跑在集群上就好像在是单服务器上没有什么区别。 分布式计算(Distributed Computing) 分布式计算是一种把需要进行大量计算的数据分割成小块,由多台计算机分别计算,再上传运算结果后,将结果合并起来得出最后结果的计算方式。目前常见的分布式计算项目通常使用世界各地上千万志愿者计算机的闲置计算能力,通过互联网进行数据传输。如分析地外无线电信号,从而搜索地外的生命迹象的SETI@home项目,该项目数据基数很大,超过了千万位数,是目前世界上最大的分布式计算项目,已有一百六十余万台计算机加入了此项目(在中国大陆大约有1万4千位志愿者)。这些项目很庞大,需要惊人的计算量,由一台电脑计算是不可能完成的。 并行计算(Parallel Computing) 并行计算是指同时使用多种计算资源解决计算问题的过程。为执行并行计算,计算资源应包括一台配有多处理机(并行处理)的计算机、一个与网络相连的计算机专有编号,或者两者结合使用。并行计算的主要目的是快速解决大型且复杂的计算问题。此外还包括:利用非本地资源,节约成本―使用多个“廉价”计算资源取代大型计算机,同时克服单个计算机上存在的存储器限制。为利用并行计算,通常计算问题表现为以下特征:将工作分离成离散部分,有助于同时解决;随时并及时地执行多个程序指令;多计算资源下解决问题的耗时要少于单个计算资源下的耗时。 网格计算(Grid Computing) 网格计算是通过利用大量异构计算机(通常为桌面)的未用资源(CPU周期和磁盘存储),将其作为嵌入在分布式电信基础设施中的一个虚拟的计算机集群,为解决大规模的计算问题提供了一个模型。网格计算的焦点放在支持跨管理域计算的能力,这使它与传统的计算机集群或传统的分布式计算相区别。网格计算的设计目标是解决对于任何单一的超级计算机来说仍然大得难以解决的问题,并同时保持解决多个较小的问题的灵活性。这样,网格计算就提供了一个多用户环境。它的第二个目标就是:更好的利用可用计算力,迎合大型的计算练习的断断续续的需求

云计算及大数据未来发展的优点

互联网科技领域,云计算、大数据、人工智能成为最热词汇。 阿里云“为了无法估算的价值”将中国的计算触角伸向海外,百度首次向外界展示“百度大脑”的科技成果。 移动互联网利用人口红利带来的增长已经逐渐见顶,互联网正在进入“下一幕”智能时代,云计算、大数据、人工智能将使全社会迎来变革性的发展。 无论是计算机行业,还是汽车领域,技术形态的成熟是一个必然的要素。 如果某个所谓的时代在技术上、硬件上没有达到产业的要求,数据库和平台都是非完整和非稳定的,时代的产业基础也就十分薄弱。 从产业的政策角度分析,当技术累积到一定层次,产业政策的出台是必然的。

为了激活云计算的发展,国务院在2015年就出台了《关于促进云计算创新发展培育信息产业新业态的意见》、《云计算白皮书2016》等,这些政策的出现并非偶然,在其背后有很多云计算服务商多年默默的技术耕耘。 技术和政策的形态达到一定的地步,真正的产业化和市场化是否也已经达到? 等待入局者必须考虑几个重要因素: 一、目的是什么(为了降低成本、提高效率,还是在渠道上更接近用户);二、企业是否愿意使用(产品同质化严重,如何体现差异化);三、是否有助于提高社会福利(消费者福利、管理效率)。 如果这些问题得到肯定的答案,云计算与时代的发展需求相契合,真正的时代大门就会开启。 大数据本身除了要有数据、采集、汇聚一定量的数据之外,更重要的是数据的处理、挖掘、分析、可视化、应用这样一整套的过程。 关于大数据的话题,基本围绕三个问题展开:

一是数据从哪里来;二是数据如何进行分析;三是数据如何进行商品化。 任何大数据都是以应用为主的,在未来,通过多维度、多复合的大数据的精准挖掘,最终提供出优质的商务解决方案才是最关键的。 数据的三个来源分别是政府、企业行业和个人消费。 政府数据做了授权,但由于法律和其他方面的不健全,政府数据被滥用。消费者数据来源于电信、金融或类似BAT大企业,流量入口处的数据将被自动抓取,数据提供商可以提供所有维度的数据,但每一个都是局部。 数据优化商在大数据产业链里要想长久发展,必须精通大数据的模型、算法以及数据特征,同时对行业及生态要有明显的敏感性。 而算法提供商如果仅仅依赖单纯算法,未来将成为成长软肋。应用提供商最贴近客户、最熟悉客户需求,同时做的是最后的数据整合,在产业链上可能发展空间更大。

云计算与网格计算的比较

云计算与网格计算的比较 沈 舒 (四川大学,四川成都610207) 摘 要:如今,云计算越来越火,关注度也越来越高,但是很多人对它还不是非常了解,甚至还存在着一些误解。故将 云计算与网格计算作比较,并阐述云计算的相关特点,以使更多的人对云计算有所了解。关键词:云计算;网格计算;分布式计算;资源中图分类号:TP301 文献标识码:A 文章编号:1672-7800(2009)12-0010-02 0引言 根据一份最新报告显示,云计算有望成为一项革命性的技 术,虽然现在还不足以满足大众市场的需求,但无疑拥有改变现有格局的潜力。那么,什么是云计算呢?它与网格计算有什么关系?它们之间又有什么区别呢? 1云计算与网格计算的定义 首先,什么是云计算呢? 狭义云计算是指IT 基础设施的交付和使用模式,指通过 网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水电一样使用IT 基础设施。 广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT 和软件、互联网相关的,也可以是任意其他的服务。 那么,什么又是网格计算呢? 网格计算即分布式计算。分布式计算是近年提出的一种新的计算方式。所谓分布式计算就是在两个或多个软件互相共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多台计算机上运行。 网格的内涵包括两个方面:一个方面是所谓的效用计算或者随需计算,在这一点上面,网格计算跟云计算是非常相似的,都是通过一个资源池或者分布式的计算资源来提供在线的计算或者存储等服务;另外一个方面就是所谓的“虚拟超级计算机”,以松耦合的方式将大量的计算资源连接在一起提供单个 计算资源所无法完成的超级计算能力,这也是狭义上的网格计算跟云计算概念上最大的差别。 从以上定义来看,云计算与网格计算都试图将各种IT 资源看成一个虚拟的资源池,然后向外提供相应的服务。云计算试图让“用户透明地使用资源”,而网格计算当初的口号就是让“使用IT 资源像使用水电一样简单”。 2云计算与网格计算的关系 正如像大多数人了解的那样,网格计算与云计算的确有很 多的相似之处,这两者都能够被看成是分布式计算所衍生出来的概念,都是为了让IT 资源能够对用户透明,为了让IT 资源能够达到更好的使用率。 从这个提高资源利用率的角度出发,逐渐诞生了Web 服务的概念,然后网络公司通过部署数以万计的服务器构成庞大的计算资源,得以提供此前无法完成的新服务。企业或者个人能够通过互联网利用那些大网络公司所释放出来的计算资源,进行应用部署或者向外提供服务。这就是从网格计算到云计算的历史过程。 二者的意义就在于,无论是用户还是企业开发者,都能够通过互联网来获得数据或者进行计算,尽管本地资源有限,但是能够通过网络进行复杂的运算,其数据的计算过程对于用户来说就像互联网网络对于本地网络用户一样,正如大家所记得的那个网络云,后端的实现是透明的。 3云计算与网格计算区别 可以看出,网格计算和云计算虽有有相似之处,但它们的 区别也是明显的。主要有以下几点: 第一,网格计算的思路是聚合分布资源,支持虚拟组织,提 作者简介:沈舒(1987-),男,江苏南通人,四川大学计算机学院学生,研究方向为计算机应用技术。 软件导刊 Software Guide 第8卷%第12期 2009年12月Vol.8No.12Dec.2009

基于Google的云计算实例分析

Computer Knowledge and Technology电脑知识与技术第5卷第25期(2009年9月) 基于Google的云计算实例分析 蔡键1,王树梅2 (1.徐州师范大学现代教育技术中心,江苏徐州221116;2.徐州师范大学计算机科学与技术学院,江苏徐州221116) 摘要:首先介绍了云计算产生的背景、概念、基本原理和体系结构,然后以Google系统为例详细阐述了云计算的实现机制。云计算是并行计算、分布式计算和网格计算等计算机科学概念的商业实现。Google拥有自己云计算平台,提供了云计算的实现机制和基础构架模式。该文阐述了Google云计算平台:GFS分布式文件、分布式数据库BigTable及Map/Reduce编程模式。最后分析了云计算发展所面临的挑战。 关键词:云计算;集群;谷歌文件系统;大表;映射/化简 中图分类号:TP311文献标识码:A文章编号:1009-3044(2009)25-7093-03 Cloud Computing System Instances Based on Google CAI Jian1,WANG Shu-mei2 (1.Xuzhou Normal University Modern Educational Technology Center,Xuzhou221116,China;2.Xuzhou Normal University,School of Computer Science&Technology,Xuzhou221116,China) Abstract:This paper introduces the backgrounds,concept,basic principle and infrastructure of cloud computing firstly.Then it surveys im-plementation mechanism of clouding computing based on the instances of Google.Cloud computing is the system in enterprises based on the concepts of computer science.These concepts include parallel computing,distributed computing and grid computing.Google has his own platform of cloud computing.It provides implementation mechanism and infrastructure of cloud computing.This paper surveys the platform of cloud computing:Google File System,Distributed database-BigTable and Map/Reduce.Finally the paper analyse the challenge of cloud computing. Key words:cloud computing;cluster;GFS;bigtable;map/reduce 自2007年第4季度开始,“云计算”变成了IT领域新的热点。而2008年被称为云计算的元年,Google、Amazon、IBM、微软等IT 巨头们以前所未有的速度和规模推动云计算技术和产品的普及。本文介绍一些关于云计算的一些基本概念及Google提出的云计算模型及实现机制。 1云计算综述 云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。 云计算是虚拟化(Virtualization)、效用计算(Utility Computing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演进并跃升的结果。 1.1云计算的概念 云计算现在还没有统一标准的定义,一些大公司在自己的技术文档里给出了自己的定义。例如云计算在IBM的文档中对云计算的定义是:云计算一词用来描述一个系统平台或者一种类型的应用程序。一个云计算的平台按需进行动态的部署、配置、重新配置以及撤销服务等。 而对云计算更加通用的的定义是:云计算是一种商业计算模型。它 将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根 据需要获取计算力、存储空间和各种软件服务。从这个定义上讲可把云 计算看成是“存储云”与“计算云”的有机结合。存储云对第三方用户公 开存储接口,用户通过这个接口可以把数据存储到“云”。计算云通过并 行计算和虚拟化技术给用户提供计算力,它的商业模式是给用户提供计 算力。 1.2云计算实现机制 图1简单的描述了云计算的实现机制。用户通过用户交互接口 (User interaction interface)来请求服务云。一个用户能够请求的所有服务 目录存放在服务目录(Services catalog)里。系统管理(System manage- ment)是用户管理计算机资源是否可用。服务提供工具(Provisioning tool)用来处理请求的服务,需要部署服务配置。监控统计(Monitoring 收稿日期:2009-05-07 作者简介:蔡键,硕士,讲师,主研领域为图形图像处理,网格技术。图1云计算实现机制 ISSN1009-3044 Computer Knowledge and Technology电脑知识与技术Vol.5,No.25,September2009,pp.7093-7095,7107 E-mail:info@https://www.doczj.com/doc/0d10491229.html, https://www.doczj.com/doc/0d10491229.html, Tel:+86-551-56909635690964

云计算考试题库

云计算考试题库 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

1、与SaaS不同的,这种“云”计算形式把开发环境或者运行平台也作为一种服务给用户提供。 A、软件即服务 B、基于平台服务 C、基于WEB服务 D、基于管理服务 2、云计算是对()技术的发展与运用 A、并行计算 B、网格计算 C、分布式计算 D、三个选项都是 3、公司通过()计算云,可以让客户通过WEBService方式租用计算机来运行自己的应用程序。 A、S3 B、HDFS C、EC2 D、GFS 4、互联网就是一个超大云。() A、正确 B、错误 5、不属于桌面虚拟化技术构架的选项是 A、虚拟桌面基础架构(VDI) B、虚拟操作系统基础架构(VOI) C、远程托管桌面 D、OSV智能桌面虚拟化 6、()不属于桌面虚拟化技术构架的选项是。 A、SAAS B、PAAS C、IAAS D、HAAS 7、与网络计算相比,不属于云计算特征的是() A、资源高度共享 B、适合紧耦合科学计算 C、支持虚拟机 D、适用于商业领域 8、云计算的基本原理为:利用非本地或远程服务器(集群)的分布式计算机为互联网用户提供服务(计算、存储、软硬件等服务)。 A、正确 B、错误 9、将平台作为服务的云计算服务类型是() A、IaaS

B、PaaS C、SaaS D、三个选项都是 10、Raid1是备份量极高的Raid策略,相应的他的保护能力也很强()。 A、正确 B、错误 11、我们常提到的"Window装个VMware装个Linux虚拟机"属于() A、存储虚拟化 B、内存虚拟化 C、系统虚拟化化 D、网络虚拟化 12、IaaS是()的简称。 A、软件即服务 B、平台即服务 C、基础设施即服务 D、硬件即服务 13、超大型数据中心运营中,什么费用所占比例最高() A、硬件更换费用 B、软件维护费用 C、空调等支持系统维护费用 D、电费 14、将基础设施作为服务的云计算服务类型是() A、IaaS B、PaaS C、SaaS D、三个选项都是 15、SAN属于 A、内置存储 B、外挂存储 C、网络化存储 D、以上都不对 16、利用并行计算解决大型问题的网格计算和将计算资源作为可计量的服务提供的公用计算,在互联网宽带技术和虚拟化技术高速发展后萌生出云计算。 A、正确 B、错误 17、不属于网络虚拟化的概念是 A、VLAN B、VPN C、VEPA D、SAN 18、不属于原生架构(裸金属架构)的虚拟化系统是 A、VMware Workstation B、ESX Server C、微软的Hyper-V D、H3C CAS

《从网格计算到云计算》

金海:大家好,我是金海,华中科技大学计算机学院的。今天想和大家分享的是从网格计算到云计算——虚拟化的探索与实践。 我的演讲主要分为几个方面: 1、网格计算和云计算 2、计算系统虚拟化基础理论与方法研究973项目简介 3、桌面虚拟化技术实践 4、最后进行一个小的总结 什么是网格计算呢?动态多机构虚拟组织中的资源共享和协同问题求解。 下面我先说一下网格计算的本质: 1、资源异构 2、多机构 3、虚拟组织 4、以科学计算为主 5、采用高性能计算机 6、问题求解环境紧耦合 说到云计算大家比较喜欢,现在没有非常权威的专家说,云计算是什么样的定义,虚拟的资源把它变成一种服务,这就叫做云计算,从这个定义本身来看,你可以看出,云计算它的本质是什么呢?我们比较一下网络计算,我们就给出云计算这几个本质。 第一,云计算并不强调资源,首先在构建领域资源的时候,它是由机构来进行构件,就是它自己的一个云计算平台。云计算是以现在从这几年比较热的虚拟经济。WAS上面各种包括视频共享网站,等等各种它都有很多的商业应用。对云计算来说,并不强调某一个云计算中心我需要非常强大的超级计算机,座谈早上李院士在报告当中就说得非常清楚,云计算是以普通的服务器械集群,作为它的一个基本共享单元。通过大量的分散在各个地方的这种服务器集群,来完成它

的服务。所以从我们在整个计算机体系结构这个角度来看,有分故事系统的一种集中的管理。它需要把这些资源分布在各个地方。 另外,它是采用是普通服务器集群,分在各个不同地方,因此是一种松耦合环境下的处理,就是在松耦合环境下做海量处理的处理方式,变成一种环境,这是云计算的一个本质。 说到虚拟化这是云计算的一个基础的基础,大家谈云计算跟网络计算,在技术层面上有甚么最基础的差异,虚拟化怎么来定义,因为很早就有虚拟化,虚拟化本身就是把底层物理设和上层的操作化,或者上层的软件进行分离的一种去耦合技术,各个层面做各个层面的工作,大家不要捆绑在一起,它希望能够把它进行去耦合,目的就是为了实现信息资源的利用效率和灵活性的最大化。 大家也知道,在云计算出来之前,我们大量集群的时候,它的利用率其实是非常低的,其原因就在于各个机器都采用单一的集群,比如E—mail服务器,每个服务器它的峰值是不一样的,因此会带来整个系统利用率非常不均衡,平均利用率会非常低。我们采用虚拟化技术以后,就可以把这些资源整合在一台机器上,或者相邻的一些机器上,来提高它的利用效率和灵活性的最大化,这就是虚拟化的基础。 说起虚拟化,本来昨天还想公布,我们CSDN这本杂志,网上评的云计算十大事件,我们就没有公布。后来追诉虚拟化历史是可以追溯到1959年,ifip这个组织大家很多人都不知道,这几年这个组织影响力比较小,对ifip这个组织部知道,其实ifip这是非常老的组织,是1959年在奥地利的维也纳成立的一个叫国际信息化联合组织,这个组织它有一个非常大的会议,就是是全世界计算机大会,成立于2000年的时候这个大会是在中国举行,当时国家主席江泽民亲自到场。当时1959年成立ifip的时候,有一篇文章就是再讲。这片文章就是后来虚拟化的基础,一也是操作系统的一个基础,当时是因为资源不够,所以采用共识的方法用一个CPU的资源,当时虚拟化是这种目的,但是现在虚拟化是因为我们资源太多了,这么多的资源怎么样有效的利用这个虚拟化资源,这是虚拟化最早的一个历史。

云计算的概念和特点

云计算的概念和特点 “云计算”面世以来,在IT产业界和学术界掀起了巨大的波澜,不少企业及专家都将云计算看作是未来IT产业的发展方向,并开始全力投入其中。从政策层面来看,云计算己经进入我国中央政府的中长期发展规划,国务院发布了《关于加快培育和发展战略性新兴产业的决定》,确定我国现阶段将重点培育和发展节能环保、新一代信息技术、生物、高端装备制造、新能源、新材料、新能源汽车这七大战略性新型产业,作为新一代信息技术的重点发展领域,云计算将成为新一代信息技术产业中的支柱领域之一。可以说,良好的政策环境将保证云计算技术能够获得持续的政策利好和充足、稳定的资本投入,具有诱人的发展前景。 通俗的来讲,云计算就是让计算变成像水、电、煤气一样的基础设施,人们可以像购买水、电、煤气一样购买计算服务,因此可以说云计算重新定义了IT软硬件资源的设计和购买的方式,从而可能引发IT产业的大规模变革。 云计算主要分为四类:公共云、私有云、社区云及混合云。公共云是利用互联网,面向公众提供云计算服务;私有云是利用企业内网和专网,面向单一企业或组织提供云计算服务,这些服务是不提供于公众使用的;社区云是利用内网、专网及VPN,为多家关联部门提供云计算服务;混合云是上述两种或三种云的组合

云计算的服务模式有三种:(1)软件即是服务(Soft as a Service,简称SaaS),对应的用户主要是直接使用应用软件的终端用户,提供的服务是终端用户所需要的应用软件,终端用户不用购买和部署这些应用软件,而是通过向SaaS提供商支付软件使用或租赁费的方式来 使用部署在云端的应用软件。(2)平台即是服务(Platform as a Service,简称PaaS),对应的用户主要是使用开发工具的应用软件 开发商,提供的服务是开发商所需要的部署在云端的开发平台及针对该平台的技术支持服务。(3)基础设施即是服务(Infrastructure as a Service简称IaaS),对应的用户主要是使用需要虚拟机或存储资源 的应用开发商或IT系统管理部门;提供的服务是开发商或IT系统管 理部门能直接使用的云基础设施,包括计算资源、存储资源等部署在云端的虚拟化硬件资源。 云计算的特点和好处主要有以下几点: 1.低成本 云计算将建设成本转化为运营成本,用户不需要为峰值业务购置设施,不需要大量的软硬件购置和维运成本就可以享用各种IT应用 和服务。 2.灵活性 云计算可以快速灵活的构建基础信息设施,并可以根据需求灵活的扩容IT资源。云计算提供给用户短期使用IT资源的灵活性(例如:

云计算和网格计算有什么本质区别

云计算和网格计算有什么本质区别 https://www.doczj.com/doc/0d10491229.html,/z/q157731426.htm?w=%CD%F8%B8%F1%BC%C6%CB%E3%BC%BC%CA %F5&spi=1&sr=1&w8=%E7%BD%91%E6%A0%BC%E8%AE%A1%E7%AE%97%E6%8A%80%E6%9 C%AF&qf=10&rn=360 [标签:云计算,本质区别,区别] 我对云了解的比较深入,对网格 计算不太了解,但是初步观察发现相 似之处很多,求解两者本质区别 限量版回答:4 人气:108 解决 时间:2009-10-03 20:35 满意答案 耐心看吧 您可能非常关注云计算和网格计 算的比较。本文介绍了云计算服务类 型,云计算和网格计算的相似与不同。 同时本文探讨了云计算优于网格计算 的地方,两者面临的共同问题以及一 些安全方面的问题。本文以Amazon Web Services 为例。 实现云计算需要三个部分:瘦客 户机(或者能够在胖瘦之间切换的客 户机)、网格计算和效用计算。网格 计算将独立的计算机连接成一个大的 基础设施,充分利用闲置的资源。效用计算就是支付在共享服务器上使用的服务,就好象支付公共事业一样(比如电力、天然气等)。 通过网格计算,可以把计算资源作为能够开启关闭的公用事业来提供。云计算更进一步,可以随需提供计算资源。这样在使用公用定价时就可以避免过度供给。在满足数百万用户的需求时也消除了过度供给的需要。 基础设施即服务 消费者通过Internet 可以从完善的计算机基础设施获得服务。这类服务称为基础设施即服务(Infrastructure as a Service,IaaS)。基于Internet 的服务(如存储和数据库)是IaaS 的一部分。Internet 上其他类型的服务包括平台即服务(Platform as a Service,PaaS)和软件即服务(Software as a Service,SaaS)。PaaS 提供了用户可以访问的完整或部分的应用程序开发,SaaS 则提供了完整的可直接使用的应用程序,比如通过Internet 管理企业资源。 作为Infrastructure as a Service (IaaS) 在实际应用中的一个例子,The New York Times 使用成百上千台Amazon EC2 实例在36 小时内处理TB 级的文档数据。如果没有EC2,The New York Times 处理这些数据将要花费数天或者数月的时间。 IaaS 分为两种用法:公共的和私有的。Amazon EC2 在基础设施云中使用公共服务器池。更加私有化的服务会使用企业内部数据中心的一组公用或私有服务器池。如果在企业数据中心环境中开发软件,那么这两种类型都能使用,而且使用EC2 临时扩展资源的成本也很低—比方说测试。结合使用两者可以更快地开发应用程序和服务,缩短开发和测试周期。 Amazon Web 服务

云计算专业调研报告精编版

云计算专业调研报告精 编版 MQS system office room 【MQS16H-TTMS2A-MQSS8Q8-MQSH16898】

呼和浩特民族学院计算机系专业调研报告 题目:云计算专业调研报告 调研单位:呼和浩特民族学院 专业:云计算 班级: 学号: 学生姓名: 指导教师: 2015年 06 月 05日 目录

云计算专业调研报告 一.调研信息 1. 调研目的 对云计算行业进行初步的了解 2. 调研时间 2015年6月3日 3. 调研对象 云计算行业 4. 调研方法 上网查找相关资料 二. 当前应用情况 1. 应用领域 云计算有着广泛的应用前景。协作工具:个人、家庭、组织、社会通过“云”进行协同工作,实现同步处理或接续。例如:科研:地震监测、海洋信息监控、天文信息计算处理等;医学:DNA信息分析、海量病历存储分析、医疗影像处理等;网络安全:病毒库存储、垃圾邮件屏蔽等;图形和图像处理:动画素材存储分析、高仿真动画制作、图片检索等;互联网:Email服务、在线实时翻译、网络检索服务等;服务平台:为需要大规模计算或存储时的各种应用或开发提供虚拟化的资源服务,不同的使用者可以实现资源的共享;创新基地:为用户提供API,鼓励用户进行创新尝试,不断涌现新的应用或服务。 2. 产业现状 自亚马逊EC2产品和Google-IBM并行计算项目提出云计算以来,从技术供应商到软件服务提供商纷纷推出披着“云计算”外衣的各式产品与服务,其中不乏炒作概念、混水摸鱼之辈。总的来看,云计算还处于一个起步的阶段,业务种类还比较单一。目前,提供云计算产品和服务的公司主要来自北美特别是美国。 Amazon:最早提供远程云计算平台服务的公司,云计算平台称为弹性计算云(Elastic Compute Cloud,EC2)。用户租用的是虚拟的计算能力,简化了计费方式。在弹性计算云中,提供了三种不同能力的虚拟机实例,

云计算的五种定义(精)

云计算的五种定义 导读:本文介绍云计算的五种定义. 关键词:云计算 笔者最近加入了一个关于云计算的LinkedIn/Google讨论群。一位成员发表本应是个天真问题的贴子:云计算与我们知道的所谓网格计算之间有什么不同?笔者马上给出了自己的答案,但一夜之间,十几封回信已经潮水般地涌了进来,形成一个显示有关这个术语的有趣的细微差别的电子邮件链。 笔者当然希望这不会让自己被踢出这个群,但在笔者看来,复制其中的一些回信来抛砖引玉可能是件有趣的事情。出于隐私的考虑,这里没有公布任何人的名字,并且为了清楚起见以及文章长度所限,此处对一些定义进行了编辑。以下就是前5条定义: 1. 厂商一如既往模糊新术语的真实定义。 笔者认为(也是其他人的看法)云计算与公用计算不同,而后者与网格计算也不同:“网格计算通常指的是用于运行计算任务(如图像处理)而不是很长的流程(如Web 网站或电子邮件服务器)的汇集资源的环境。” “公用计算通常指的是支持很长的流程的汇集资源的环境,公用计算一般关注于通过提供完成任务所需的最优数量的资源来满足服务水平。” “云计算(对于许多人来说)是指通过Internet提供的各种服务,这些服务在服务提供商的基础设施上提供计算功能(例如,Google Apps或Amazon EC2或https://www.doczj.com/doc/0d10491229.html,)。云计算环境可能实际存在于网格中,或存在于公用计算环境中,但这对服务的用户并不重要。” 2. 云计算与网格、软件服务化、平台服务化 云计算=网格计算。工作负载被传送给由分派任务的主控节点和工作的从属节点组成的IT基础设施。主控节点控制分配给工作负载的资源(多少从属节点运行并行化的工作负载)。这些对于客户机是透明的,客户机只看到工作负载被分配给云/网格,然后结果返回给它。从属节点可以是,也可以不是虚拟主机。 云计算=软件服务化。这是Google的应用模型。在这种模型中,应用处在“云”中,即Web中的某个地方。 云计算=平台服务化。这是Amazon EC2等的模型。在这种模型中,一个外部实体维护IT基础设施(主/从节点),而客户购买这个基础设施上的时间/资源。正是这种“在云中”致使云计算分布在Web上,处在从它租用时间的机构之外。 3. 云仅仅指的是从本地向Web上的服务迁移。 从本地保存文件到把它们存储在安全的、可伸缩的环境中。从开发存储容量限制在GB 空间的应用到不存在存储容量上限的应用,从使用微软Office到使用基于Web的office。

相关主题
文本预览
相关文档 最新文档