Windows Server 2012重复数据删除七项注意
- 格式:doc
- 大小:26.00 KB
- 文档页数:3
Windows Server 2012课程介绍:Windows server 2012是一款全新的产品,是基于Windows 8基础上开发出来的服务器版系统,同样引入了Metro界面,增强了存储、网络、虚拟化、云等技术的易用性,让管理员更容易地控制服务器,能够快速适应企业变化不断的业务需求与各种场景的应用。
对应证书:Microsoft Certified Solutions Expert (MCSE)考试代号:70-410 Installing and Configuring Windows Server 201270-411 Administering Windows Server 201270-412 Configuring Advanced Windows Server 2012 Services70-413 Designing adn Implementing a Server Infrastructure70-414 Implementing an Advanced Server Infrastructure培训课时:102课时课程大纲:第一天:◆Windows Server 2012最新认证体系介绍(MCSA,MCSE,MCSM)◆微软产品介绍( OS, SQL Server, Forefront, Exchange, Lync , SharePoint, System Center, Virtualization )◆使用Windows Server 2012下的Hyper-v 3.0第二天:◆Windows Server 2012新功能介绍,版本介绍,系统安装◆Windows Server 2012平台常用操作介绍◆管理Windows Server 2012中的用户账号◆管理Windows Server 2012中NTFS权限,EFS加密,磁盘配额◆Windows Server 2012中Bitlocker介绍第三天:◆Windows Server 2012批量激活服务◆Windows Server 2012文件服务器管理概要◆重复删除数据介绍和功能演示◆iSCSI Target SoftWare介绍◆配置Windows Server 2012的文件服务器(DFS, 高级磁盘配额,使用ADRMS加密Office文档,权限迁移等)◆磁盘管理:基本磁盘和动态磁盘的介绍和管理,介绍常用的存储方案(DAS,NAS,SAN) ,如何使用软件来实现SAN第四天:◆Windows Server 2012的备份和恢复:NTBackup介绍,Windows Server Backup的使用,Symantec BE 2012的部署和管理◆DHCP: 运行原理,DHCP安装和基本管理,实现DHCP Relay Agent,DHCP数据库的迁移◆DNS: DNS案例分析,DNS解析原理分析,DNS的安装和管理,DNS的高级管理◆WINS: 和DNS的区别,WINS的案例分析第五天:◆把Windows Server 2012配置成一个路由器,◆VPN配置和管理,VPN案例分析(实现Client-to-Site VPN和Site-to-Site VPN)◆在Windows Server 2012部署和配置WDS架构:微软架构中批量安装系统的反感讨论,WDS部署和基本配置,使用WDS安装Windows 8◆案例:如何使用WDS分发Windows XP第六天:◆管理Windows Server 2012证书服务:加密的方式,Windows Server 2008 R2中证书服务类型, 证书信任,证书的申请方式(工作组和域)◆案例:使用证书加密远程桌面连接◆案例:实现SSTP VPN◆BranchCache功能介绍和两种模式介绍◆演示:Branchcache功能演示第七天:◆DirectAcess 功能介绍和基本原理介绍◆演示:DirectAccess在公司内部的部署和应用◆把Windows Server 2012 R2配置成一个Web Server :挂载网站,挂载虚拟目录,地址重定向,实现Web服务器HTTPS访问◆案例:如何保证单服务器多网站公用80端口访问◆案例:如果企业内部多个Web Server,如果保证共用公网80端口第八天:◆管理Windows Server 2012远程桌面服务:基本操作和介绍,实现RD RemoteAPP, 实现RD Web Access, 实现RD Gateway, 实现RD Session Broker.◆实现Windows Server 2012 RDS NLB◆实现Windows Server 2012下的VDI第九天:◆Hyper-v的高级管理:实现Hyper-v的实时迁移,SCVMM介绍和安装,常用的功能介绍和演示◆案例:实现P2V◆案例:实现V2V◆案例:配置和管理SCVMM的Portal第十天:◆NAP(网络访问保护):NAP介绍,NAP处理过程。
重复数据删除技术重复数据删除技术当前,不管是权威机构,还是众厂商,都非常看好重复删除技术。
重复数据删除通过有效地减少数据,消除备份成为降低数据存储成本的重要技术,成为大家关注的焦点。
然而,重复数据删除是否可以在你的存储设备下工作?你如何在海量的数据中应用重复数据删除技术?本专题深入探讨重复数据删除技术,针对各种重复数据删除产中提出评估建议。
为什么需要重复数据删除?随着企业的数据量不断增长,大量的重复数据给存储带来严峻的挑战。
重复数据删除带来了多种好处。
存储量减少,从而降低了存储成本。
这意味着只需更少的磁盘和更低频率的磁盘采购。
更少的数据同时也意味着备份更小。
•重复数据删除迅猛发展•如何通过重复数据删除降低存储成本什么是重复数据删除?重复数据删除,也被称为智能数据压缩或单一实例存储。
它是一种可以减小数据存储需求的手段。
本系列文章将介绍重复数据删除是如何工作的,重复数据删除技术的基本原则和具体实现等相关问题,并列举一些该技术在实际应用中的例子。
•重复数据删除是如何工作的?•确保重复数据删除的高可用性•重复数据删除技术如何缓解存储需求重复数据删除有哪些产品?重复数据删除还是一个新的市场,不同的厂商为客户提供了不同的产品,这也使得实现重复数据删除的方式变得多样化,而客户面临的则是困难的抉择。
让我们来看一下不同的重复数据删除产品及如何评估基于硬件的重复数据删除产品。
•重复数据删除产品一览•如何评估基于硬件的重复数据删除产品•如何评估基于软件的重复数据删除产品重复数据删除技术比较重复数据删除和其他技术有很多相似点和不同点,在这一系列中我们将深入探讨CAS 和重复数据删除,讨论它们的用途并总结这两种技术的优缺点;介绍压缩、重复数据删除和加密的区别,比较和对照in-band(带内)和out-of-band(带外)两种重复数据删除方式,以及它们各自存在的利弊。
•CAS和重复数据删除:归档双雄•压缩、重复数据删除和加密的区别•重复数据删除in-band VS out-of-band重复数据删除迅猛发展存储经理们已经意识到了重复数据删除技术的诸多优点。
Windows2012文件服务器之重复数据删除Windows Server 2012文件服务器有一个新重复数据删除功能,可以帮助用户节约可用磁盘空间。
“重复数据删除”是指发现并删除数据内的重复信息而不损失数据的精确性或完整性的操作。
一、“重复数据删除”功能,它具有如下优点:1、容量优化:“重复数据删除”使得Windows Server 2012 能够在更少的物理空间中存储更多的数据,并获得比以前版本的Windows 操作系统明显更高的存储效率。
以前版本的Windows 操作系统使用单实例存储(SIS) 或NTFS 文件系统压缩。
“重复数据删除”使用可变分块大小和压缩,常规文件服务器的优化率为 2:1,而虚拟数据的优化率最高可达 20:1。
2、伸缩性和性能: Windows Server 2012 中的“重复数据删除”具有高度的可伸缩性,能够有效利用资源,并且不会产生干扰。
它可以同时对多个大容量主数据运行,而不会影响服务器上的其他工作负载。
通过控制 CPU 和内存资源的消耗,保持对服务器工作负载的较低影响。
此外,用户可以灵活设置何时应该运行“重复数据删除”、指定用于消除重复的资源并为“重复数据删除”创建有关文件选择的策略。
3、可靠性和数据完整性:在对数据应用“重复数据删除”时,保持数据的完整性。
Windows Server 2012 利用校验和值、一致性和身份验证来确保数据的完整性。
此外,Windows Server 2012 中的“重复数据删除”会为所有元数据和最常引用的数据保持冗余,以确保这些数据可以在发生损坏时进行恢复。
4、与 BranchCache 相结合提高带宽效率:通过与BranchCache 进行集成,同样的优化技术还可应用于通过WAN 传输到分支机构的数据。
这会缩短文件下载时间和降低带宽占用。
二、实现重复数据删除的要求:1)服务器:1、服务器硬件应满足运行 Windows Server? 2012 的最低要求重复数据删除功能专用于支持最低配置,如配有4GB RAM 和一个SATA 硬盘驱动器的单处理器系统。
查询及删除重复记录的方法(一)1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断select * from peoplewhere peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid 最小的记录delete from peoplewhere peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)3、查找表中多余的重复记录(多个字段)select * from vitae awhere (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)4、删除表中多余的重复记录(多个字段),只留有rowid最小的记录delete from vitae awhere (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)5、查找表中多余的重复记录(多个字段),不包含rowid最小的记录select * from vitae awhere (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)(二)比方说在A表中存在一个字段“name”,而且不同记录之间的“name”值有可能会相同,现在就是需要查询出在该表中的各记录之间,“name”值存在重复的项;Select Name,Count(*) From A Group By Name Having Count(*) > 1如果还查性别也相同大则如下:Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1(三)方法一declare @max integer,@id integerdeclare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >; 1open cur_rowsfetch cur_rows into @id,@maxwhile @@fetch_status=0beginselect @max = @max -1set rowcount @maxdelete from 表名 where 主字段 = @idfetch cur_rows into @id,@maxendclose cur_rowsset rowcount 0方法二有两个意义上的重复记录,一是完全重复的记录,也即所有字段均重复的记录,二是部分关键字段重复的记录,比如Name字段重复,而其他字段不一定重复或都重复可以忽略。
选择重复数据删除应注意的五个问题作者:张智鸿来源:《中国计算机报》2009年第29期重复数据删除(Data Deduplication)无疑是近年来存储行业最受人关注的技术,甚至有分析师认为,重复数据删除是近十年来最重要的存储技术创新。
重复数据删除技术之所以能在短时间内蹿红,主要原因在于其诉求点非常清楚——消除传统备份技术衍生出的重复储存数据的问题,进而为企业节省成本,而这些诉求又正好符合现今IT 行业大力提倡的节能环保理念。
然而,今天的企业面临的数据保护问题相当复杂,备份数据重复储存的问题仅仅是冰山一角。
重复数据删除在某些厂商的华丽包装下,似乎成了解决所有数据保护问题的万能药,导致用户对重复数据删除产品存在过高的期望,在对技术本身了解不够、欠缺全盘考虑的情况下便部署了重复数据删除方案,结果往往不如预期。
用户在选择具备重复数据删除技术的产品时,不妨参考以下几项建议。
不要陷入重复删除比的谜局几乎所有厂商都会强调,自己的产品可以达到更高的重复数据删除比,有些厂商甚至宣称可以达到500∶1这样不可思议的重复数据删除比。
事实上,重复数据删除比率取决于数据的类型和备份策略,与重复数据删除技术本身关联不大。
举例来说,如果数据的类型为Office文件或电子邮件,由于数据结构本身的重复性较高,能被删除的部分自然就比较多;如果是已经压缩过的影音、图片等文件,重复数据删除的效果则相当有限。
采用全备份方式时的重复数据删除比远大于采用增量或差量备份时的重复数据删除比。
因此,比较不同产品之间的重复数据删除比率是没有意义的,更不能以此来判别重复数据删除产品的优劣。
不能影响服务器性能某些采用资源端重复数据删除技术的解决方案,必须在生产服务器上安装代理程序来执行重复数据删除,因此不可避免地给生产服务器造成了相当大的性能负担。
任何改变传统的数据保护方式,都必须建立在不影响系统运行的前提下,换句话说,服务器的性能绝不能受到数据保护方案的影响。
配置重复数据删除最常见的四个问题作者:郭涛来源:《中国计算机报》2011年第26期NetApp公司的工程师Keith Aasen介绍说:“NetApp的一个客户将600多台虚拟机(VM)从具有11.9TB容量的磁盘阵列迁移到一个新的NetApp存储阵列上。
通过采用重复数据删除技术,新的NetApp存储阵列的容量只需3.2TB即可,存储空间的节省高达73%。
”但是也有人向Keith Aasen抱怨,他们的存储系统的重复数据删除比率很低。
配置重复数据删除时应该注意哪些问题呢?问题1:没有立即启动重复数据删除功能如果用户将NetApp的虚拟存储控制台(VSC)插件用于VMware vCenter,那么使用该插件创建VMware的数据存储时会导致重复数据删除功能的启动。
在这种情况下,NetApp建议客户立即启用重复数据删除功能。
在NetApp的存储系统卷上启用重复数据删除功能后,存储控制器将跟踪写入该卷的新数据块。
在定期删除重复数据的过程中,存储控制器会查看这些新的数据块,并消除所有重复数据。
如果在启用重复数据删除功能之前,卷里已经有了一些虚拟机,又该如何处理呢?除非客户明确地指示NetApp的存储系统扫描现有数据,否则NetApp的存储系统不会检查虚拟机,更不会对虚拟机执行重复数据删除。
这导致重复数据删除的比率会比较低。
幸好有个很简单的办法可以解决这个问题。
用户只要启用Scan选项中的VSC,就可以开启重复数据删除功能。
问题2:LUN的保留NetApp可以根据客户的需求提供多种级别的数据保留功能。
NetApp在卷中为VMware创建了LUN。
用户也可以选择为LUN保留空间,并将此空间从可用卷的空间中删除。
这随之产生了两个问题:首先,客户已经使用卷保留方式保留了所需的空间,所以没必要使用LUN保留方式再次保留空间;其次,为LUN保留空间意味着LUN未使用的空间将占用已保留的空间。
例如,用户有一个100GB的卷,其中有一个90GB的LUN,并且对LUN实现了空间保留。
重复数据删除技术简介这篇文章基于现有的SNIA材料,描述了重复数据删除流程可以进行的几个不同的地方;探讨了压缩与单实例文件以及重复数据删除之间的不同点;研究了次文件层重复数据删除执行的几个不同方式。
它同时还解释了哪种类型的数据适合重复数据删除,以及哪些不适合。
介绍重复数据删除已经成为存储行业非常热门的话题和一大类商业产品。
这是因为重复数据删除可以大幅减少购置和运行成本,同时提高存储效率。
随着数据量的爆炸性增长,接近一半的数据中心管理员都将数据增长评为三大挑战之一。
根据最近的Gartner调查结果,重复数据删除可以减轻存储预算的压力并帮助存储管理员应对数据的增长。
虽然重复数据删除主要被视为一种容量优化技术,不过该技术也可以带来性能上的好处--随着所需存储的数据的减少,系统所需迁移的数据也减少。
重复数据删除技术可以应用在数据生命周期上的不同点上:从来源端重复数据删除,到传输中重复数据删除,一直到存储目标端重复数据删除。
这些技术还可以应用在所有的存储层上:备份、归档和主存储。
重复数据删除的解释无论使用哪种方式,重复数据删除就是一个在不同层次的粒度性上识别重复数据并将重复数据替代为指向共享复件的指针的过程,这样可以节约存储空间和迁移数据所需的带宽。
重复数据删除流程包括跟踪并识别那些被删除的重复数据,以及识别和存储那些新的和独一无二的数据。
数据的终端用户完全不会感到这些数据可能已经被执行重复数据删除流程并已经在其数据生命周期中被重建许多次。
对数据进行重复数据删除操作有几种不同的方式。
单实例存储(SIS)是在文件或块层次上进行重复数据删除。
重复副本会被一个带着指针的实例所取代,而指针则指向原始文件或对象。
次文件层重复数据删除的操作粒度则比文件或对象更小。
这种技术有两种常见的方式:固定块重复数据删除--数据被分解成固定长度的部分或块;可变长度重复数据删除--数据根据一个滑行的窗口进行重复数据删除。
数据压缩是对数据进行编码以减小它的大小;它还可以用于那些已经被重复数据删除的数据以进一步减少存储消耗。
(一)、PowerShell安装与配置重复数据删除功能安装:1、启动 Windows PowerShell。
在任务栏上,右键单击 Windows PowerShell 图标,然后单击“以管理员身份运行”。
运行以下 Windows PowerShell 命令:C:\> Import-Module ServerManagerC:\> Add-WindowsFeature -name FS-Data-DeduplicationC:\> Import-Module Deduplication启用重复数据删除功能:若要在卷上启用重复数据删除,请在服务器上运行以下 Windows PowerShell 命令。
卷 E 上启用了重复数据删除。
C:\> Enable-DedupVolume E:设置最少保留天数:设置文件进行重复数据删除前,应保留的最少天数。
C:\> Set-Dedupvolume E: -MinimumFileAgeDays 20如果将 MinimumFileAgeDays 设为 0,那么重复数据删除将处理所有文件,不论其留存时间有多久。
这适合于测试环境,在这种环境中你想要进行最大限度的重复数据删除。
但是,在生产环境中,最好是等待几天(默认为 3 天),因为在更改率减缓前,文件往往会在短时间内改变很多。
这允许对服务器资源进行最有效的使用。
清理日志存放地点:清理作业在位于此处的 Windows 事件日志中输出一个摘要报告:事件查看器\应用程序和服务日志\Microsoft\Windows\删除重复\清理数据清理作业:虽然重复数据删除默认值以每周一次(周六)的频率创建数据完整性清理作业,但你也可以使用以下命令,按照需要触发这种清理作业:C:\> Start-DedupJob E: –Type Scrubbing垃圾回收作业:重复数据删除包含了垃圾回收作业,来处理卷上已删除或已修改的数据,这样任何不再访问的数据区块都被清理。
WindowsServer2012R2文件服务器安装与配置01 文件服务器配置的相关目录02 基础说明与安装一、文件服务器的基础说明文件服务器是企业里面用的最多的服务器之一,它主要用于提供文件共享。
为了配合文件服务器的权限管理,从WindowsServer2008新增了文件服务器资源管理器,其实在WindowsServer2003里面也有文件服务器资源管理器的功能,只是放于DFS功能模块里面了。
文件服务器资源管理器是一组可让你对文件服务器上存储的数据进行管理和分类的功能。
文件服务器资源管理器包括以下功能:文件分类基础结构文件分类基础结构通过分类流程的自动化提供对数据的洞察力,从而让你更有效地管理数据。
你可以基于此分类对文件进行分类并应用策略。
示例策略包括限制访问文件的动态访问控制、文件加密和文件过期。
可以使用文件分类规则自动分类文件,也可以修改所选文件或文件夹的属性手动分类文件。
文件管理任务文件管理任务可让你基于分类对文件应用有条件的策略或操作。
文件管理任务的条件包括文件位置、分类属性、创建文件的数据、文件的上一次修改日期或上一次访问文件的时间。
文件管理任务可以采取的操作包括使文件过期、加密文件的功能,或运行自定义命令的功能。
配额管理配额允许你限制卷或文件夹可拥有的空间,并且它们可自动应用于卷上创建的新文件夹。
你还可以定义可应用于新卷或文件夹的配额模板。
文件屏蔽管理文件屏蔽可帮助控制用户可存储在文件服务器上的文件类型。
你可以限制可存储在共享文件上的扩展名。
例如,你可以创建文件屏蔽,不允许包含MP3扩展名的文件存储在文件服务器上的个人共享文件夹上。
存储报告存储报告可用于帮助你确定磁盘使用的趋势以及数据分类的方式。
你还可以监视尝试要保存未授权文件的一组所选用户。
通过使用文件服务器资源管理器Microsoft管理控制台<MMC>或使用WindowsPowerShell,可以配置和管理文件服务器资源管理器包含的功能。
(精华版)国家开放大学电大专科《Windows网络操作系统管理》判断单选题题库及答案盗传必究一、判断题题目1一个域中可以包含工作组。
选择一项:错题目2一个工作组中可以包含域。
选择一项:错题目3工作组网络也被称为对等式网络。
选择一项:对题目4域属于分散式的管理模式。
选择一项:错题目5在工作组中,存储活动目录数据库的计算机被称为域控制器。
选择一项:错题目6在工作组中,每一台计算机都有一个本地的安全帐户管理器。
选择一项:对题目7在一个物理网络中,可以同时建立多个域。
选择一项:对题目8Server Core 针对私有云和数据中心的托管环境进行了优化,并包含了完整的本地图形管理界面。
选择一项:错题目9Nano Server是一个新的安装选项,Windows Server 2012 和早期版本没有这个安装选项。
选择一项:对题目10服务器管理器是用于管理Windows Server服务器的命令行管理工具。
选择一项:错题目11Windows Server 2016操作系统,默认启用了“远程桌面”功能。
选择一项:错题目12使用密钥管理服务(Key Management Services)服务器能够统一激活网络环境中的Windows操作系统,而不是在每台计算机上逐一完成系统的激活。
选择一项:对题目13一个用户帐户只能被一个人使用,无法被多人同时使用。
选择一项:错题目14一个用户可以同时拥有多个用户帐户。
选择一项:对题目15内置的用户帐户可以被删除。
选择一项:题目16在工作组中,每台计算机分别是一个独立的安全范围,拥有自己的本地用户帐户信息。
选择一项:对题目17Guest(来宾帐户)是供用户临时访问本台计算机所使用的用户帐户。
选择一项:对题目18每一个用户帐户都拥有一个唯一的安全标识符(Security Identifier,简称SID),是在创建用户帐户时由系统管理员手动分配的。
选择一项:错题目19不能删除计算机中内置的组帐户。
中国计算机报/2007年/7月/2日/第C07版专题重复数据删除技术解析中国传媒大学计算机学院朱立谷重复数据删除利用了文件之间和文件内的相同和相似性,处理的粒度可以是文件、数据块、字节甚至位。
处理粒度越细,删除冗余数据越多,存储容量减少越多,同时消耗的计算资源也越多。
文件相似性为了理解文件相似性对重复数据删除效率的重要性,首先要了解相似性与存储量之间的关系。
数据的相似性变化范围极大,压缩效率变化范围也很大。
使用不同版本的Linux源代码来评估文件相似性,对gzip压缩(文件内压缩)与Delta压缩(文件内和文件间压缩)进行比较,结果如图1所示。
在8万多个文件(1GB大小)中,有相当多的文件具有很高的相似性,而且有很多是完全相同的。
gzip压缩后,文件体积减少到原来的25%~30%,而Delta压缩后,文件体积减少到原来的4%。
这充分表明,利用文件相似性在文件内和文件间进行压缩有很多益处。
通过对文件内和文件间的冗余数据进行删除,最后得到的数据再加上经过压缩计算产生的索引数据,其总量也只有原始数据量的1%。
重复数据删除的算法1.Hash算法Hash一般翻译为散列,或音译为哈希,就是把任意长度的输入(称为预映射)通过Hash算法变换成固定长度的输出,该输出就是Hash值。
这种转换是一种压缩映射,Hash值的空间通常远小于输入的空间。
Hash算法的数学表达式为CA=Hc(Content),其中Hc( )表示单向Hash函数,而Content代表任意长度字符串,CA则代表固定长度Hash值。
Hash算法在信息安全领域中被广泛应用,具有如下关键特性:第一,单向性(One Way),从预映射能够简单迅速地得到Hash值,但在计算上不可能构造一个预映射,使Hash的计算结果等于某个特定的Hash值,即构造相应的Content=Hc-1(CA)不可行;第二,抗冲突性(Collision Resistant),即在统计上无法产生两个Hash值相同的预映射,计算上也难以寻找到一对任意的Content和Content',满足HC(Content)=HC(Content') ,此谓强抗冲突性;第三,映射分布均匀性和差分分布均匀性。
选择重复数据删除注意“四”项重复数据删除技术目前已成为存储行业最为热门的技术,不仅众多厂商极力推荐其重复数据删除产品,广大用户也在热切的关注着重复数据删除技术。
这种热闹局面主要是由当前经济大环境不景气的外部原因和企业自身数据飞速增长的内部原因共同形成的。
然而,重复数据删除产品越来越受用户关注的同时,其功能作用也被一些厂商过分的放大,成为厂商推销其产品的卖点和噱头。
所以,用户在选择重复数据删除产品时还需要谨慎起见。
重复数据删除对你是否有意义?用户首先需要问自己的就是是否真的需要重复数据删除技术。
就目前的一些调查情况来看:一些类似医疗影像处理的数据并不适合进行重复数据删除,另外金融、电信等对数据可靠性要求比较高的行业对重复数据删除也需要谨慎对待。
用户如果赶时髦、追潮流,不考虑自身企业的数据情况,购买重复数据删除产品只能取得适得其反的结果。
事实上,这种只保存数据单一实例的技术早已存在,只是在备份领域中才被突显出来,并定名为重复数据删除。
正是由于企业在备份过程中存储了大量的重复数据、浪费了大量存储空间,最终才催化出重复数据删除技术。
重复数据删除的宗旨就是为企业用户的备份解决方案服务,使得企业备份解决方案更加完善、高效。
如果脱离这个宗旨,厂商一味强调重复数据删除的一些优点,却忽视企业在数据安全性和备份等方面可能做出的巨大牺牲,那么毫无疑问,这种本末倒置的作法最终受害的将是用户。
因此,用户在选购重复数据删除产品时需要思考重复数据删除是否对你有意义?你的企业是否真的需要重复数据删除?如果厂商不顾你的现实情况,不负责任的向你推销其重复数据删除产品,那么恭喜你,你遇到“骗子”了……重复数据删除对现有备份环境是否造成影响?影响有多大?企业用户备份做两次全备份时间间隔一般不长,通常只有不超过5%的数据是不同的,剩余大部分数据都是相同的,因此,重复数据删除绝对可以给企业备份系统带来很大的好处。
从而衍生出这样一个问题:重复数据删除是否会对企业现有备份环境造成影响?可能会造成什么样的影响?这种影响有多大?举个例子,如果你的备份环境已经有比较长的时间了,各项备份机制都趋于完善,这个时候你应该考虑加入重复数据删除解决方案。
一、填空题1.(A.专用网络)通常用来承载群集节点内部通信。
群集节点使用这个网络交换检测信号并检查其他节点。
A.专用网络B.公共网络C.存储网络D.虚拟机网络2.(B..PFX)格式的证书文件包含私有密钥。
A..CER B..PFX C..P7B D.SST3.(B.Guest )是“内置的本地用户帐户”。
(单选)A.Administrators B.Guest C.Power Users D.Domain Admins操作系统会自动创建四个本地用户帐户:Administrator、Guest、DefaultAccount、WDAGUtilityAccount)4.(B.Hyper-V )是微软公司提供的虚拟化平台,能够在服务器上创建并运行虚拟机。
A.Intel VT B.Hyper-V C.AMD-V D.AMD x645.(A.条件转发器)能够将不同域名的查询转发给不同的转发器A.条件转发器B.根提示C.转发器D.辅助区域6.(AAAA记录)用来将主机的FQDN 解析为IPv4地址。
A.AAAA记录B.MX记录C.A记录D.PTR记录7.(B.心跳)是群集的一种健康检查机制,通过一个专用网络向群集所有节点发送UDP数据包,以检查群集中的所有节点是否在线。
A.资源B.心跳C.存储D.角色8.(C.iisstart.html)是IIS的默认站点中的默认文档。
A.Default.htm B.Default.aspx C.iisstart.html D.index.asp9.Hyper-V提供了三种虚拟网络:(A.专用)网络、内部网络和外部网络。
A.专用B.并联C.串联D.环形10.IIS默认站点的根目录位于(A.C:\inetpub\wwwroot)。
A.C:\inetpub\wwwroot B.C:\inetpub\custerr C.C:\inetpub\logs D.C:\inetpub\web11.MBR分区表格式只支持最大为(B.2TB )的磁盘。
部署重复数据删除不得不知道的事作者:暂无来源:《计算机世界》 2010年第20期■ 清水编译重复数据删除技术已经引起了厂商和IT管理者的高度关注,人们寄希望以此来减少大多数数据中心遇到的数据急剧增长所带来的困难。
但是部署这一新技术时,需要从各方面考虑清楚。
大约在十年前,重复数据删除技术(DataDeduplication)就开始浮出水面,而只是最近它才成为一项主流技术。
在接下来的几年里,重复数据删除技术可能会像今天的时间点拷贝和RAID技术一样常见。
重复数据删除是一种激动人心的概念,因为它能够大幅降低存储及移动数据的成本。
许多厂商在介绍自身产品优点的同时,夸大了其他替代产品的缺点,这使得潜在的客户不由得犯疑:“我该不该部署重复数据删除技术?该把它用在何处?什么产品最适合我的环境?”我们还是来客观地分析一下这项技术以及每种方案各自的优缺点,以免IT管理员、IT经理和CIO们盲目相信厂商们营销时的一套说法。
重复数据删除是如何工作的?重复数据删除技术基于数据压缩的概念和方法,包括重复数据集删除及其他技术。
重复数据删除借鉴了数据压缩采用的寻找冗余信息这一概念,但所处理的数据量大大增加。
重复数据删除要处理的数据达到TB级或PB级,而不是压缩技术的KB级。
所有重复数据删除解决方案都会寻找数据中的冗余信息,无论是在文件级、对象级还是子对象块级。
早期的重复数据删除技术着眼于文件,旨在消除重复文件。
目前市场上仍存在这些方法,称为单实例存储(single instance storage)。
最近的改良版技术可以针对多种类型的数据寻找重复数据,找出长度不一的重复部分。
重复数据删除的工作方式通常是先分析数据,为某部分信息计算出简写或惟一的标识。
子文件级或块级的重复数据删除技术通常把数据细分成几段,用于进行重复数据删除。
每段数据都有指纹印,使用密码散列来查看这部分信息之前有没有存储过。
只要存在相同部分的数据,就用原始数据的索引来替换,因而节省了空间。
《【如何选择重复数据删除解决方案】删除重复数据》重复数据删除应当成为it战略的一个有机组成部分。
数据冗余是导致数据急剧增长的一个主要因素。
最初,重复数据删除技术致力于消除像完全备份、电子邮件附件和vmware镜像文件这些特定环境中的数据冗余。
不过,客户们逐渐注意到了冗余数据这个问题的普遍性。
企业环境中的测试和开发数据数量激增。
复制、备份和归档带来了多个数据副本,分散在企业的各个角落。
有时用户为了图个方便,就把数据拷贝到多个位置。
研究估计,如今数据的众多副本要求企业购买、使用及管理的存储量比使用重复数据删除技术之后,实际所需的存储量多2―50倍。
考虑到这给企业利润带来的负面影响,许多企业认识到:重复数据删除绝不仅仅是一项应用范围狭小的技术,需要成为整个it战略当中一个必不可少的有机部分。
哪些企业适用。
遇到下列问题的中小企业客户最适合使用重复数据删除解决方案:•数据急剧增长,导致存储成本失去控制;•备份窗口日益缩小或不够充足;•恢复时间比较长,特别是恢复主备份介质上的旧数据时;•把磁带发送到灾难恢复站点面临成本、风险和复杂性;•备份系统和归档系统上数据传输速度慢;•需要满足电子发现、法规遵循和服务级别协议方面的要求;•成本高昂的局域网和广域网存在瓶颈。
应当具备的功能it决策者们在评估重复数据删除解决方案时,应当关注下列必要功能:•能够灵活扩展,不需要成本高昂的硬件升级;•更多的恢复点,恢复时间比较短;•点击式重复数据删除管理;•面对不同的厂商、数据类型、来源和平台,重复数据删除解决方案内置了报告功能;•与所有必要的应用程序紧密集成,尽量缩短最终用户的停机时间;•提供了单一解决方案的简洁性,易于部署和管理;•能够迅速、安全地恢复所有位置、应用程序、存储介质和时间点上的关键业务数据;•磁盘到磁盘到磁带(d2d2t)进行了优化,以提高备份性能、确保可靠的数据恢复;•快速、全面的搜索功能,有助于恢复;•内置的灾难恢复功能;•数据分类;•经济、高效、即时的电子发现;•使用通用技术平台;•单一管理点。
Windows Server 2012重复数据删除七项注意
【文章摘要】微软公司敏锐地发现了这一需求,在其最新的服务器操作系统Windows Server 2012中,该公司增加了重复数据删除子系统的特性,它提供了一种方式,在由一个给定的Windows Server实例管理的所有卷上执行重复数据删除。
它并是把重复数据删除的任务推给一个硬件或软件层,而是在OS中进行,包括块级和文件级的 - 也就是说,多种类型的数据(例如虚拟机的多个实例)都可以成功地以最小的开销进行重复数据删除。
在当前的“大数据”时代,尽管磁盘空间越来越便宜,I/O速度在提升,但重复数据删除仍是存储管理员最为关注的神奇策略之一,这项技术的存在,使得我们能够以更低的存储成本和管理成本,得到更高的存储效率。
微软公司敏锐地发现了这一需求,在其最新的服务器操作系统Windows Server 2012中,该公司增加了重复数据删除子系统的特性,它提供了一种方式,在由一个给定的Windows Server实例管理的所有卷上执行重复数据删除。
它并是把重复数据删除的任务推给一个硬件或软件层,而是在OS中进行,包括块级和文件级的 - 也就是说,多种类型的数据(例如虚拟机的多个实例)都可以成功地以最小的开销进行重复数据删除。
如果您打算实施Windows Server 2012的重复数据删除技术,确保您了解以下七点:
1、重复数据删除默认情况下不启用
不要指望升级到Windows Server 2012之后,节省空间的情况会自动出现。
重复数据删除被当做一项文件和存储服务的功能,而不是核心OS组件。
为了达到这个目的,您必须启用它并手动配置,在服务器角色文件和存储服务文件和iSCSI服务(Server Roles File And Storage Services File and iSCSI Services)。
启用之后,还需要进行基础配置。
2、重复数据删除将无系统负担
在设置重复数据删除技术,微软投入了相当的精力,所以它只要一个很小的系统占用空间,甚至可以运行在有较大的负载的服务器上。
这是三条理由:
首先,存储内容只会在n天(默认情况下n为5)之后才重复数据删除,这是用户可配置的。
这个时间延迟,阻止了deduplicator试图处理这样的内容:当前的和常用的,或正在被写入到磁盘上的文件(这将构成重大的性能损失)。
其次,重复数据删除受到目录或文件类型的限制。
如果您要排除某些类型的文件或文件夹的重复数据删除,您可以指定自如。
再次,重复数据删除进程是自我调节的,可以运行在不同的优先级。
例如,您可以设置实际的重复数据删除进程运行在低优先级中,它会在系统本身处在重负载的情况下暂停。
您还可以设置一个时间窗口,让deduplicator在非工作时间全速运行。
这样一来,只需要很少的管理监督,重复数据删除就可以到位,即使在繁忙的服务器上,也不会影响其性能。
3、重复数据删除的卷是“原子单位”
“原子单位(Atomic units)”意味着给定卷的所有重复数据删除信息保持在该卷上,因此它可以移动而不会伤害到另一个支持重复数据删除系统。
如果你将它移动到一个不具有重复数据删除功能的系统,你将只能能够看到nondeduplicated文件。
最好的原则是,不要移动一个重复数据删除卷,除非它是到另一台Windows Server 2012计算机的。
4、重复数据删除支持BranchCache
如果你有某个分公司的服务器同时运行重复数据删除技术,它与中央服务器共享重复数据删除的文件数据,从而减少了两者之间需要发送的数据量。
5、备份重复数据删除卷可能棘手
基于块的备份解决方案 - 例如磁盘映像备份的方式 - 应该保留所有的重复数据删除的数据。
基于文件的备份工作,但它们将不会保留重复数据删除的数据,除非它们是重复数据删除感知的(dedupe-aware)。
它们将以原来的、分离的、没有重复数据删除的形式备份一切。
更重要的是,这意味着备份媒介需要足够大,才能hold住没有重复数据删除的数据。
本机的Windows Server Backup解决方案是重复数据删除感知的,但任何适用于Windows Server 2012的第三方备份产品应被检查,重复数据删除感知已经存在还是将被添加在将来的修订版。
6、投入CPU核心和内存会更好
微软建议专门投入至少有一个CPU核心和350 MB可用内存来处理一个卷,每一个小时大约有100 GB的存储空间(无中断),或者每天2 TB。
你有越多并行的空闲资源,你就可以同时处理越多的卷。
7、重复数据删除的收益可能会有所不同
微软已经快速大量地处理自己的信息,并发现部署的性质影响节省空间的数量。
虚拟硬盘(VHD)上的多个OS实例表现出了很大的节省,因为它们之间的多余材料的数量更少。
在关于重复数据删除好的和坏的候选人的描述中,微软指出Exchange Server数据库其实是可怜的候选人。
这听起来似乎不可思议,你会认为Exchange邮箱数据库中的冗余数据可能有很多。
但是,数据不断变化的性质(消息的移动,删除,创建等)抵消了重复数据删除的吞吐量和存储空间节省的所带来的收益。
但是,一个Exchange Server备份卷是一个更好的候选人,因为它的改变较少,可以进行重复数据删除而没有明显的慢下来。
真正考验是否使用重复数据删除技术的,是在您的特定环境里面它的实际收益是多少。
因此,最好的做法也许是先在一个备用服务器上临时启用它,您可以设置crawl rate,让重复数据删除以最快的速度运行,看看您的数据存储空间节省了多少,然后据此为您的Live 服务器建立自己的重复数据删除执行时间表。