数据中心运营的一常见问题(解决方案)
- 格式:docx
- 大小:29.60 KB
- 文档页数:18
数据中心行业的整改措施和改进方案一、背景介绍数据中心是现代信息技术发展中的重要组成部分,承载着大量的数据处理和存储任务。
然而,在数据中心运营过程中,也存在一些问题和挑战,特别是安全性、可靠性和能源效率方面的考量。
为了提升数据中心行业的发展水平,需要制定相应的整改措施和改进方案。
二、安全性方面的整改措施和改进方案1. 加强物理安全:通过采取严密监控措施、加强门禁管理和视频监控等手段,保障数据中心内部设备及数据的物理安全;同时对于重要区域进行适当分区,设置权限访问限制。
2. 提升网络安全:建立完善的防火墙系统、入侵检测系统以及灾备备份系统,确保网络流量可追踪且有足够高效的响应速度;对外网进行合理划分,规避不必要风险和攻击。
3. 定期演练:组织定期演练各种突发事件处理与处置流程,并不断完善相关预案。
在实际情况中发现问题并及时解决,提高应对突发事件的能力。
三、可靠性方面的整改措施和改进方案1. 硬件设备更新:根据设备寿命周期,定期更换老旧设备,并确保新设备性能稳定可靠;除此之外,加强对服务器、存储器等关键硬件设备的监测和维护,预防潜在故障。
2. 多活数据中心架构:通过建立多个数据中心并采用异地备份的方式,增加系统的容错能力,实现双机热备、数据互联互通,以提升整体可靠性。
3. SLA服务水平协议:与客户或运营商签订明确的服务水平协议(SLA),包括合理时间内完成故障处理、响应速度等指标要求,从而保证服务质量和满意度。
四、能源效率方面的整改措施和改进方案1. 优化空调系统:通过使用更加高效节能的空调设备,并合理规划机房布局和冷热通道分离设计,减少冷气流失和热点集聚现象;设置温湿度监测装置并进行动态调整,降低能耗。
2. 采用节能设备:例如新一代服务器的低功耗设计,高效率电源系统和动态电压调整技术等,提高设备使用效能,以及减少用电量等;3. 能源监测和管理系统:引入能源监测和管理系统,对整个数据中心的能源消耗进行实时监控和管理,并通过数据分析和优化策略,降低能源浪费。
数据中心运营的一常见问题(解决方案)1.多大规模的数据中心才足够大?第一个问题通常的最难回答的或者最简单的问题。
对于分析师来说,这个问题的答案是“取决于许多因素”。
但是,当你投资数千万美元建设一个新的数据中心的时候,这个答案就不行了。
这个问题的困难部分不是搞清楚你现在的需求有多大,而是要搞清楚你在15年中的需求是什么。
2.我确实需要多少可用性?数据中心通常是由层次水平确定的。
层次水平实际上确定了这个环境的可用性(正常运行时间)的目标。
虽然经常引用TIA 942行业标准,但是,许多公司在设计的早期阶段都使用正常运行时间学会(UPTIME INSTITUTE)的4层可用性指南作为一个良好的拇指定律。
确定这个层是非常重要的,因为你的60%的资本预算都是由你确定层次的决策确定的。
3.我需要多少能源?传统的数据中心是根据旨在支持当时典型的IT设备的最大容量的静态能源需求建设的。
这种模式现在不在起作用了,数据中心的设计需要考虑能源的伸缩性,以支持未来安装高密度的机架环境。
4.绿色技术如何?在设计数据中心的时候,有没有我需要了解的市场上的绿色技术或者将出现的绿色技术?从设计的角度看,在数据中心中使用句柄头和冷却工作量的最有效的方法是什么?5.这个数据中心要使用多长时间?一个新的数据中心的实际的生命周期是什么?传统数据中心一般使用寿命是15至20年。
但是,由于目前的技术和计算需求的迅速变化,这个时间段是现实的吗?有没有一些方法把新的数据中心寿命延长到20年以上?6.所有的应用程序都以同样的水平创建吗?在传统的数据中心设计中,我们要支持例外的情况:高可用性、高性能和伸缩性。
但是,你的应用程序都需要这些水平的支持吗?我能根据我的应用程序的要求建立一个环境以支持不同的服务和技术水平吗?7.当前最新的设计趋势是什么?当前占主导地位的数据中心设计趋势是什么?使用(或者忽略)这些趋势有什么好处和坏处?8.我应该建设一个还是多个数据中心?在整合项目中,最常提出的问题是“我需要多少了数据中心?”这些问题的答案取决于风险与回报、资本预算、地理位置、服务水平和恢复时间目标。
数据中心机房常见故障原因及处理方法原因:手动控制装置故障,排烟阀机械锈蚀等原因。
处理办法:检查手动控制装置是否正常,检查排烟阀机械是否锈蚀,及时进行维护保养。
3)排烟机故障原因:排烟机电机损坏,电源故障等原因。
处理办法:检查排烟机电机是否损坏,检查电源是否正常,及时更换损坏的部件。
3.电力系统机房电力系统是机房设备正常运行的保障,系统组成主要包括电源系统、配电系统、接地系统、电缆系统等,系统容易出现的问题、产生的原因、简单的处理方法:1)电源故障原因:电源本身故障,电源线路故障等原因。
处理方法:检查电源本身是否故障,检查电源线路是否正常,及时维修或更换。
2)配电系统故障原因:配电系统线路故障,断路器故障等原因。
处理方法:检查配电系统线路是否故障,检查断路器是否正常,及时维修或更换。
4.空调系统机房空调系统是保证机房设备正常运行的重要设施,系统组成主要包括制冷系统、通风系统、空气净化系统等,系统容易出现的问题、产生的原因、简单的处理方法:1)制冷系统故障原因:制冷系统压缩机故障,制冷剂泄漏等原因。
处理方法:检查制冷系统压缩机是否故障,检查制冷剂是否泄漏,及时维修或更换。
2)通风系统故障原因:通风系统风机故障,风管堵塞等原因。
处理方法:检查通风系统风机是否故障,检查风管是否堵塞,及时维修或清洁。
5.网络系统机房网络系统是机房设备正常运行的重要保障,系统组成主要包括网络设备、网络线路等,系统容易出现的问题、产生的原因、简单的处理方法:1)网络设备故障原因:网络设备本身故障,网络线路故障等原因。
处理方法:检查网络设备本身是否故障,检查网络线路是否正常,及时维修或更换。
2)网络线路故障原因:网络线路断开,线路老化等原因。
处理方法:检查网络线路是否断开,检查线路是否老化,及时维修或更换。
处理办法:检查管道中是否有泄漏点,修复泄漏点并更换压力表,确保稳压系统正常运作。
2)消火栓报警按钮无法启动消防泵原因:可能是消防泵本身机械故障,或是消火栓系统控制柜出现问题。
在当今信息化时代,数据中心技术的应用已经无所不在,它是许多企业和组织存储、管理和处理数据的核心。
然而,在日常使用中,数据中心技术也面临着一些常见的问题。
本文将从数据存储、网络连接、安全性和故障处理等方面展开讨论,并提出对应的解决方法。
数据存储是数据中心技术使用中的一个重要环节。
在实际操作中,很多用户会遇到存储空间不足的问题。
解决这个问题的方法之一是优化数据存储策略,及时清理、归档不再使用的数据,释放存储空间。
另外,可以通过扩充存储设备的容量来解决存储空间不足的问题。
此外,数据存储设备的性能也会影响数据中心的运行效率,定期对存储设备进行性能优化和维护是非常必要的。
网络连接是数据中心使用中另一个常见的问题。
网络延迟和断线会影响数据的传输和处理效率。
在面对网络连接问题时,可以通过优化网络配置、增加带宽、采用负载均衡等方式来解决。
此外,定期检查和维护网络设备,及时排查和修复网络故障也是非常重要的。
数据安全性是数据中心技术使用中的一个重要问题。
数据中心中存储的大量数据可能会受到黑客攻击、病毒感染等威胁。
为了保障数据的安全,数据中心需要建立完善的安全策略,包括加密数据、设置访问权限、实施防火墙、定期备份数据等措施。
此外,定期对数据中心进行安全性检查和漏洞扫描也是非常必要的。
故障处理是数据中心使用中不可避免的问题。
硬件故障、软件故障、系统崩溃等问题都可能会影响数据中心的正常运行。
在面对故障时,需要及时排查故障原因、修复故障并采取措施预防类似故障再次发生。
为了提高故障处理的效率,可以建立完善的故障处理流程和应急预案,并对相关人员进行培训和演练。
总之,数据中心技术使用中常见的问题有很多种,但都可以通过合理的方法和措施来解决。
在实际操作中,需要根据具体情况制定相应的解决方案,及时处理和预防问题的发生。
同时,也需要定期对数据中心进行维护和管理,提高数据中心的稳定性和安全性。
只有这样,数据中心技术才能更好地为企业和组织的信息化建设提供支持。
云数据中心运维问题解析在当今信息技术发达的时代,云数据中心逐渐成为许多企业和组织存储和处理数据的首选。
然而,随着云服务的普及,云数据中心运维问题也逐渐浮出水面。
本文将对云数据中心运维面临的问题进行分析和解析,旨在帮助读者更好地了解和应对这些挑战。
一、数据安全问题在云数据中心运维中,数据安全问题是最受关注的一项。
随着云数据中心中数据的不断增长和扩散,保护数据的安全性和完整性成为一项重要任务。
常见的数据安全问题包括数据泄露、数据损坏、数据备份不完备等。
为有效解决这些问题,云数据中心需要建立专门的安全团队,配备完备的安全设施,并制定严格的数据备份和恢复策略。
二、网络带宽问题云数据中心需要应对大量的数据流量和多样化的网络请求。
网络带宽成为云数据中心运维的瓶颈之一。
高峰期的网络流量可能导致网络拥堵,影响用户的访问速度和数据传输效率。
为解决网络带宽问题,云数据中心需要建立冗余网络架构,增加带宽容量,并实时监控网络状态,及时调整网络资源分配。
三、服务器故障问题云数据中心依赖大量的服务器来存储和运行用户的数据和应用。
服务器故障会导致数据丢失、应用中断等严重的后果。
因此,云数据中心运维人员需要密切监控服务器的运行状态,及时检测和修复潜在的故障。
此外,定期进行硬件设备的更新和维护,以提高服务器的可靠性和稳定性也是必不可少的。
四、能耗管理问题云数据中心通常需要消耗大量的能源来运行服务器、网络设备和冷却系统。
过高的能耗不仅造成资源浪费,也对环境产生不利影响。
为解决能耗管理问题,云数据中心可以采用绿色能源供电、优化机房布局和设计、实施节能降耗措施等。
通过合理规划和管理能源,可以降低能耗成本,并推动可持续发展。
五、人员技术素质问题云数据中心运维需要高水平的技术支持和维护。
然而,目前市场上缺乏专业的云数据中心运维人员,技术人员的素质参差不齐,这在一定程度上制约了云数据中心的运维质量。
为解决这个问题,云数据中心需加强人才培养,提供专业技术培训,建立知识共享与交流机制,形成一个云数据中心运维人员的专业社区。
数据中心是一个企业或组织中最重要的部分之一,它承载着各种应用程序和服务,为企业的正常运转提供支持。
在数据中心的运维管理中,常常会遇到一些技术使用上的常见问题,这些问题如果得不到及时有效的对策,就有可能会影响到整个数据中心的稳定性和安全性。
本文将就数据中心技术使用中的常见问题及对策进行深入探讨。
网络安全问题是数据中心管理中的一大难题。
随着云计算和大数据技术的发展,数据中心的网络规模和复杂度越来越大,网络安全问题也日益凸显。
黑客攻击、网络病毒、数据泄露等安全威胁随时可能对数据中心造成严重影响。
为了解决这一问题,数据中心管理者需要加强网络安全意识培训,建立完善的网络安全管理制度,并采取有效的防护措施,如入侵检测系统、防火墙、数据加密等,以确保数据中心网络的安全稳定运行。
另外,数据中心的能源消耗问题也备受关注。
随着数据中心规模的不断扩大,其能源消耗量也在不断增加,给企业带来了巨大的能源支出压力。
针对这一问题,数据中心管理者可以通过优化数据中心的设计和建设,采用节能环保的设备和技术,实施能源管理和监控系统,以降低数据中心的能源消耗,达到节能减排的目的。
此外,数据中心的容量规划和管理也是一个常见问题。
在数据中心运营过程中,很容易出现资源分配不均衡、利用率低下、容量不足等问题。
为了解决这一问题,数据中心管理者需要采用先进的容量规划工具和技术,对数据中心的资源进行合理分配和管理,及时调整和优化数据中心的配置,以满足企业业务发展的需求。
此外,数据中心的高可用性和故障恢复能力也是一个重要问题。
在数据中心的运营过程中,难免会出现硬件故障、网络故障、软件故障等问题,一旦发生故障,就会对企业的业务造成严重影响。
为了提高数据中心的高可用性和故障恢复能力,数据中心管理者需要采用容错容灾技术,建立完善的灾备系统和应急预案,对数据中心的各项设备和系统进行全面监控和维护,以确保数据中心在发生故障时能够快速恢复并保持业务的连续性。
最后,数据中心管理者还需要关注数据中心的监管合规问题。
数据中心建设与运维的挑战与解决方案随着信息技术的快速发展和大数据时代的到来,数据中心建设和运维面临着越来越多的挑战。
本文将探讨数据中心建设与运维的挑战,并提出相应的解决方案,以帮助企业克服这些困难。
一、数据中心建设的挑战1. 能耗和能源效率数据中心作为信息技术的核心基础设施,消耗大量的能源。
然而,传统的数据中心存在着能源利用效率低下的问题。
高能耗不仅给企业带来了巨大的财务负担,也对环境造成了不可忽视的压力。
解决方案:引入绿色数据中心概念,采用节能技术,如虚拟化、服务器整合、智能温控等,以提高能源利用效率,降低能耗。
另外,加强数据中心的监测和管理,实施能源回收利用,进一步提高能源利用效率。
2. 安全性和可靠性数据中心是企业重要的运营支撑,一旦发生故障或安全事故,将给企业带来巨大的经济损失和声誉风险。
因此,数据中心的安全性和可靠性成为一个重要的挑战。
解决方案:采用多重备份和冗余设计,确保数据中心的高可用性。
建立完善的物理访问控制和网络安全措施,加强对数据的加密和备份,以防止数据泄露和丢失。
同时,定期进行安全演练和风险评估,更新技术和策略,确保数据中心的安全和可靠性。
3. 数据管理和容量规划数据中心中的数据量庞大,管理和存储成为一项挑战。
同时,数据中心的容量规划也是一个难题,预测未来的业务增长和数据需求是非常困难的。
解决方案:引入数据管理系统,对数据进行分类和归档,确保数据的完整性和可用性。
同时,建立灵活的扩展机制,根据业务需求动态增加存储容量。
利用大数据分析和预测技术,对数据增长趋势进行分析,以便更精准地进行容量规划。
二、数据中心运维的挑战1. 设备维护和故障处理数据中心中的各种设备,如服务器、网络设备等,需要进行定期的维护和故障处理。
然而,由于设备数量庞大,工作量繁重,维护和故障处理成为一项困难的任务。
解决方案:建立设备管理系统,对设备进行统一管理和监控,实时获取设备运行状态和告警信息,提前预防故障发生。
数据中心有哪些常见故障?数据中心故障如何处理?数据中心是全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。
那么,数据中心有哪些常见故障?数据中心故障又该如何处理呢?数据中心有哪些常见故障数据中心网络常见的通讯故障主要集中在:硬件故障、系统故障两个类别:(1)硬件故障:数据中心是通过无数计算机硬件组成的,硬件出现问题,就会导致部分功能无法正常发挥或运作。
无论是设备、线路、端口,哪一点出现故障,都会导致网络通讯故障的出现。
硬件方面的故障相对比较容易查找,例如线路故障,一般的成因就是线路明显的老化或者破损,而影响到了整体网络的运营;再比如,端口故障,计算机端口作为数据中心网络的重要环节,若出现接触不良、损坏等传输问题,就会影响到整体网络的运行。
硬件故障只要进行逐一排查,就可以及时进行更换处理,相对比较好解决。
(2)系统故障:数据中心是计算机领域比较热门的研究之一,因此研究技术十分成熟。
计算机网络构成主要包括TREE、FAT-TREE、BCUBE、FICONN等,主要采用模块化、层次化、扁平化的设计思路与虚拟化的分割管理技术,将成千上万台设备,以单元为单位进行划分,逐一进行管理。
通过分层、递归的结构进行联结,尽可能的避免了所谓“关键节点”的存在。
这样组合也形成了良好的冗余与容错性,如果其中出现故障的某一个或某几个单元,没有被检测出来,也不至于影响数据中心的整体运行。
但是如果超出一定比例,就会在影响数据中心网络的高速运行,拉慢网络通讯的速度,所以仍旧需要针对性的查找故障进行处理。
数据中心故障如何处理(1)分析故障现象:一般来说由于构成组件比较复杂,故障也呈现出不同的表现方式。
因此想要对于故障进行分析,就要先了解故障的现象。
例如,应用方面出现了支付系统支付不了,网页难以打开等问题,那么就要逐一检查相关的故障点,有哪几个故障是上述表现,如,线路故障,端口故障等,就要更换线路、端口等设备。
数据中心运营的一常见问题(解决方案)1.多大规模的数据中心才足够大?第一个问题通常的最难回答的或者最简单的问题。
对于分析师来说,这个问题的答案是“取决于许多因素”。
但是,当你投资数千万美元建设一个新的数据中心的时候,这个答案就不行了。
这个问题的困难部分不是搞清楚你现在的需求有多大,而是要搞清楚你在15年中的需求是什么。
2.我确实需要多少可用性?数据中心通常是由层次水平确定的。
层次水平实际上确定了这个环境的可用性(正常运行时间)的目标。
虽然经常引用TIA 942行业标准,但是,许多公司在设计的早期阶段都使用正常运行时间学会(UPTIME INSTITUTE)的4层可用性指南作为一个良好的拇指定律。
确定这个层是非常重要的,因为你的60%的资本预算都是由你确定层次的决策确定的。
3.我需要多少能源?传统的数据中心是根据旨在支持当时典型的IT设备的最大容量的静态能源需求建设的。
这种模式现在不在起作用了,数据中心的设计需要考虑能源的伸缩性,以支持未来安装高密度的机架环境。
4.绿色技术如何?在设计数据中心的时候,有没有我需要了解的市场上的绿色技术或者将出现的绿色技术?从设计的角度看,在数据中心中使用句柄头和冷却工作量的最有效的方法是什么?5.这个数据中心要使用多长时间?一个新的数据中心的实际的生命周期是什么?传统数据中心一般使用寿命是15至20年。
但是,由于目前的技术和计算需求的迅速变化,这个时间段是现实的吗?有没有一些方法把新的数据中心寿命延长到20年以上?6.所有的应用程序都以同样的水平创建吗?在传统的数据中心设计中,我们要支持例外的情况:高可用性、高性能和伸缩性。
但是,你的应用程序都需要这些水平的支持吗?我能根据我的应用程序的要求建立一个环境以支持不同的服务和技术水平吗?7.当前最新的设计趋势是什么?当前占主导地位的数据中心设计趋势是什么?使用(或者忽略)这些趋势有什么好处和坏处?8.我应该建设一个还是多个数据中心?在整合项目中,最常提出的问题是“我需要多少了数据中心?”这些问题的答案取决于风险与回报、资本预算、地理位置、服务水平和恢复时间目标。
在某些情况下,建造两个数据中心能够建造一个数据中心便宜一些。
9.业务持续性与灾难恢复如何?当设计一个数据中心的时候,我应该还要制定我的业务持续性计划吗?或者在整个设计阶段考虑业务持续性与灾难恢复?有没有新的技术在解决业务持续性与灾难恢复问题的同时还能为重要的应用程序提供高增长和冗余水平?10.谁建设这个数据中心?我应该提前提出什么问题?我们如何确定这个工程公司、建筑公司、分包商、委托公司等等?目前有没有应该注意的最佳做法或者最糟糕的做法?1、数据中心建设,是建设现代化的高性能机房、购置先进的通信、网络和硬件设备,支持有线无线网络接入方式,实现高速、高带宽接入,搭配高配服务器和海量存储,并向虚拟化方向发展?同时,数据中心要能够实现丰富的各类数据(视频、声像、电子地图和各类图表)综合展现吗?2、数据中心建设,如何深化核心业务需求?如何搞好数据中心规划设计和组织管理?是不是只管数据、不管应用系统的整合建设?只做各类数据的综合信息发布、查询和检索,不考虑核心业务系统的集成(整合)?3、数据中心建设,如何解决数据标准统一问题?目前,信息化中最为薄弱的环节——数据标准化,存在着有标准、不采标;现有标准不科学,数据冗余、系统结构稳定性差;有些标准不实用,不符合业务管理要求,要修订;各类基础标准不统一,分散在不同业务系统中存在多个同义编码,规则不一致,产生信息孤岛、造成系统集成难度加大;而各主流开发商均采用数据交换平台或数据接口的形式来解决集成,无法治本、导致系统的可维护性极差,不能发挥数据中心的数据集中管控及服务功能,使数据中心建设失去现实意义。
4、数据中心建设,与业已存在的相关专业数据中心是什么关系?数据中心建设是采取数据大集中策略?多级数据中心的数据整合策略是什么?下级或基层的本地数据怎么办?如何保证数据一致性的同时、还要提高系统整体效率?5、数据中心建设,涉及到核心业务系统的整合开发建设,要采取的统一定制开发模式是什么?如何保证不同管理层级用户的不同管理需求、并能够实现可配置化?如何避免因业务流程的调整而不断重复修改应用系统?新建业务系统、已建业务系统和在建业务系统间的不同整合策略是什么?如何在建立统一数据标准、支持数据中心建设的同时,兼顾已有投资、实现系统集成?6、数据中心建设项目如何管控?如何结合各类核心业务系统建设,实现体系化建设要求?如何科学组织达到预期?以上问题将会严重影响到数据中心建设的总体策略,也关系到数据中心建设能否实现预期目标,应给以重视并解决。
1.您是否认为数据中心服务器整合真的物有所值?数据中心究竟是否应该对服务器进行整合,有没有不需要整合的情况存在?专家:从理论上讲,数据中心整合是值得肯定的。
整合可以提高IT管理的效率和性能,降低软件和基础设施成本。
企业真正需要考虑的是成本的回收时间。
尽管说通过旧设备的淘汰及软件许可的收益企业可以获得一定的补偿,但新硬件和应用的部署还是会对企业成本产生很大的影响。
另一个需要考虑的因素是如何使企业内部员工能尽全力去完成整合工作,为了完成某些特定项目,我们是否需要对员工进行相关培训?总体来说,在进行任何整合项目规划时,都需要做一个资产评估。
只有这样,企业才能知道它该如何去投资,何时能够收回投资。
如果缺乏适当的预先规划,大多数整合项目都不能确保万无一失。
2.以下是数据中心整合过程中特别需要注意的四个问题。
将网络反应时间与应用反应时间沦为一谈当你将服务器搬离用户所在地之后,你就会面临网络反应时间问题。
用户与服务器间的物理距离会导致二者间信号传输的延迟。
但是,100毫秒的网络延迟并不意味着100毫秒应用反应时间延迟。
即使是面对一些最基本的任务,大多数应用也需要在用户和服务器之间进行反复的数据交换(通常被称为应用“转换”)。
因此,在将服务器迁至远程后,对一个在本地只需3秒钟时间就可以完成的任务而言,如果网络延迟50毫秒的话,就需要30秒才能完成。
应用设计(包括它需要进行“转换”的次数)被认为是IT技术人员的普遍问题,而网络延迟则是广大网络经理经常面对的困难。
但是,网络经理们无法改变光的速度,也无法让东京离纽约更近一些。
因此把这一问题抛给他们是没有任何意义的。
事实上,即使是在服务器进行搬迁之后,影响反应时间的还是应用设计问题。
因此,在网络方面做过多的投资意义并不大。
没有意识到网络延迟对服务器性能和可用性的影响网络延迟会同时影响服务器的性能和可用性。
服务器会将资源分配给当前在线的每个客户任务。
本地客户会在短时间内完成这个任务,因为他们的应用受网络延迟的影响很小。
而远程客户就不是这样了,他们需要花更长的时间来完成这些任务,因为他们的应用需要更多的“转换”次数。
有一点很重要,在某个进程的运行周期内,服务器会对所分配的资源进行锁定,直到该进程完成后再将其释放。
因此,当远程用户与一台服务器进行通信的时候,在很长时间内这台服务器的资源是处于忙碌之中的。
这也就使该服务器无法向其它客户释放资源——这从很大程度上限制了服务器的性能和可用性。
从这个角度讲,IT机构必须要考虑网络延迟的情况,也使他们需要在服务器基础设施方面投入更多的资金。
即使是暂时的服务器分离也会对性能有所影响对一个数据中心的成百上千台服务器进行迁移需要花上几个礼拜甚至是几个月的时间。
在整个迁移过程中,一些系统会留在本地运行,而另外的系统会在新的数据中心内运行。
与服务器和用户间的网络延迟现象相比,这种服务器的分离状况对应用性能的影响会更大,也更难以预料,因为计算进程的设计并不能适应服务器彼此间的延迟状况。
所有在规划设计数据中心的IT机构都需要问几个问题。
当内部互相有联系的服务器被短时间分离后会产生什么影响?哪些服务器必须要和其它服务器一起迁移?Active Diectory服务器是否应该被迁移?哪些服务器在迁移后需要被重新配置?不要到迁移完成后才考虑用户的性能期望值预先解决用户的服务等级期望值显得很重要。
如果你要等到迁移完成后才告诉用户说他们要去适应你所提交的服务,那你就是在把自己往火坑里推。
但是在规划过程中如果你可以预先考虑一下这个问题,你就可以避免这些问题,确保用户的期望值都满足正常要求。
有些时候,重新对服务等级目标(SLO)进行设定显得没有多大意义,因为它与迁移之前的标准是一致的。
如果之前处理一个任务需要花本地用户3秒钟的时间,那在本国范围内对服务器机型迁移后处理该任务所花的时间几乎不可能与原来保持一致。
因此,迁移后确定7秒钟左右的SLO似乎更合情合理。
为了使用户认同这种服务等级,IT机构必须对迁移后的服务器性能进行模拟和预判。
这使IT机构可以模拟出“用户可接受的性能环境”,在实际搬迁项目完成前,用户就已经有了搬迁后系统性能的使用经验。
事实上,IT机构是可以避免这些问题的。
但是要想做到这一点,他们采用一种严格的方法来对项目进行规划,并完善应用团队、系统管理员以及网络架构师们的专业技能。
在搬迁前后对企业环境及传统指标进行模拟的方法对于预测和解决服务器迁移所导致的应用性能问题是特别有用的。
因此,项目规划过程中的所有参与者——包括企业用户在内,都需要明确数据中心搬迁会对应用性能有哪些影响。
因此,如果你在规划数据中心整合或其它类型的服务器迁移项目,你需要考虑一下再系统模拟技术方面的投资,它可以使你有选择地区体验不同的性能指标,从而确定哪些工作需要做哪些工作不需要做。
同时,这也可以确保你数据中心搬迁项目的成功——而不会遭遇潜在的灾难性后果。
3. 灾难恢复计划如何做到成本优化?答:步骤1:使用重复数据删除功能,以减少数据存储和复制费用,通常情况下,这要比运送磁带的成本低。
为了证明这一点,我们假设一家企业使用的是不带重复数据删除功能的标准备份软件、LTO3驱动器和20TB的生产数据。
即便不考虑备份软件成本,提供40TB的磁带容量也需要花费大约66480美元(其中包括驱动器、介质、异地存储、调用成本、操作等)。
但是,如果用户使用一台4TB重复数据删除设备,在重复数据删除比率为10:1条件下就能获得相同的40TB容量。
如果这一设备的成本加运营成本为17700美元,那么比起使用磁带解决方案的成本,可以节省超过300%的资金(66480美元减17700美元等于48,780美元,即实现了300% 以上的节约效益)。
为了进一步消除异地磁带传送和调用的成本,同时消除基于阵列的数据复制许可成本,可以再建议用户再部署一台重复数据删除设备进行异地复制数据,同样只需要10:1的重复数据删除率,就能使复制数据所需的广域网需求降低90%.当DR端进行恢复时,也可以利用磁盘上的数据,这使得查找、加载和恢复数据的速度大大加快,从而简化了恢复过程,将总用时从数天或数周缩短至数小时。