当前位置:文档之家› 太平洋保险备份解决方案

太平洋保险备份解决方案

寿险总公司集中备份

解决方案

二零零三年三月

目录

前言 (3)

第一章现状和需求分析 (4)

1.1现状 (4)

1.2需求分析 (5)

1.3应用需求分析 (14)

1.4磁带和磁带机数量建议 (15)

第二章方案的确定与产品的选型 (16)

2.1方案的确定 (16)

2.2产品的建议 (16)

2.3工作环境下遇到的问题及考虑 (16)

第三章方案描述 (20)

第四章备份系统面临问题及解决 (22)

4.1面临问题 (22)

4.2解决办法 (24)

第五章技术服务及技术培训 (25)

5.1ADIC全天热线技术支持(ATAC) (25)

5.2ADIC先期硬件更换服务(RMA) (25)

5.3软件升级 (25)

5.4ADIC现场技术支持 (26)

附录1:ADIC S CALAR1000磁带库 (27)

附录2:SCALAR10K技术手册 (36)

附录3:AMASS软件介绍 (47)

附录4:SDLC软件介绍 (53)

附录5:磁带机技术介绍 (54)

LTO是专门为数据备份设计 (54)

AIT-3磁带机技术是AMASS存储管理软件的最佳拍档 (55)

前言

社会的进步,把我们带到一个新的时代,各种新技术应用的结果产生的大量的数据,成为当今信息时代的血脉,也成为企业赖以生存的重要根源。人们不断讨论着数据的重要性,也努力建立安全可靠的数据系统,来保护我们的成果。不仅仅需要数据系统能够24*7的不间断的运转,还需要整体系统具备极强的稳定性与可靠性,使系统能够长时间安全、稳定地正常运转。从根本上来说,计算机系统的稳定性与可靠性在很大程度上取决于相关保障子系统的性能,就象楼宇的安全可靠性主要取决于各类防护措施及消防保护等系统一样。对信息系统来说,其保障子系统主要指的就是本方案的主题----数据存储系统。

数据存储系统指为了确保信息系统的顺畅运转与数据的安全存储,而实施的各类保障系统。它的范畴涵盖企业数据的安全性、可访问性、可管理性、访问的高性能、可扩展性等各个方面,确保企业的应用能够安全高效运行,为企业的业务扩展提供保障。

第一章现状和需求分析

1.1 现状

中国太平洋人寿保险有限公司机房拥有IBM、HP、DELL等多种主机和Informix、DB2、Domino Notes数据库,承担着总公司包括两核、医保、单证等多种应用系统的维护工作。

总公司现阶段没有成熟的备份系统,数据的保护使用的人为参与管理,使用操作系统或者数据库本身的工具对数据进行备份。

这存在着很多问题:

?不能满足现在数据快速增长的需求;

?不能与目前磁盘阵列有效的整合;

?备份手段比较落后。目前大多数系统还处在依靠手工拷贝来实现数据备份的阶段,维护成本过高。

?不能进行历史数据的保留。虽然有些系统建立起了容灾系统、双机热备份、磁盘阵列等,但这些方式的目的在于保证系统数据和服务的“在线

性”,即当系统发生故障时,仍能够正常地向用户提供数据和服务,以使系

统不致停顿,这些措施无法将在线数据转移成离线数据,无法解决系统数

据中的逻辑错误和历史数据保存问题。

?不能进行集中备份。没有专业的备份软件和磁带库对关键业务数据进行集中、自动备份。

?没有统一的备份策略。各系统备份时间的随意性较大。

?当系统数据量大于单盘磁带、磁盘容量时,备份工作需要人工干预,耗费大量的人力和时间。

?不能实现在线备份。备份数据时,需将系统停下来。

数据恢复问题。当系统出问题时,数据恢复要过多的人工干预。

1.2 需求分析

1.2.1系统需求

根据中国太平洋人寿保险有限公司数据备份系统的现状,建议采用专业的磁带库设备来解决以上问题,对于专业的磁带库设备我们认为应该具备:

1.所提供的磁带库系统的技术是成熟先进,不仅仅有先进的技术基础还有大量的使用经验。

2.对磁带库的容量应该给予考虑,包括磁带数和磁带机数。而且磁带库系统应该支持磁带机混装及交流电源冗余。

3.针对磁带库的主要部分机械手,应该拥有具备先进水平的机械手,同时还要求机械手能够与主流平台互连。

4.针对磁带机的要求,应该从磁带机的技术发展角度考虑,对于有特殊应用的系统,应该支持磁带机混装,这样可以根据不同磁带机技

术的特点为某一应用系统服务。

5.从磁带库系统的可扩充性应该注意两个方面的内容,一个是磁带和磁带机的扩充,另一个是对SAN的支持。这里面不仅仅是数量的扩

展,而且是技术的扩充,要有不断接受新技术的能力。

在解决方案的以下内容中,将逐步对以上的建议做进一步的阐述。

1.2.2磁带库系统容量需求

根据《寿险总公司应用系统集中备份需求表》,得出

1.两核服务器:Informix数据库165GB数据量

数据保留期限:

数据库分配容量:

1.在线备份每日全备14份,14×165GB=2310GB

2.In-line备份磁带库中全备24份,24×165GB=3960GB

3.In-line备份离库有全备48份,48×165GB=7290GB

磁带分配原则:

1.在线备份数据量为2310GB,一卷磁带100GB,分配24卷磁带.

2.离线备份是备份的同时,多做两份拷贝(用户要求两份出库),在做完备份作业,磁带出库异地保存,所以每次离库的

代价是每个全备需要2卷磁带(2份出库),两年每月一次共

48个全备.一个全备需要2卷磁带,共需要磁带96卷。

3.离线备份数据量为3960GB,一卷磁带100GB,分配40卷磁带.

磁带数:160卷

2.医保服务器:Informix数据库180GB数据量

数据保留期限:

数据库分配容量:

1.在线备份每日全备14份,14×180GB=2520GB

2.In-line备份磁带库中全备24份,24×180GB=4320GB

3.In-line备份离库有全备48份,48×180GB=8640GB

磁带分配原则:

1.在线备份数据量为2520GB,一卷磁带100GB,分配26卷磁带.

2.离线备份是备份的同时,多做两份拷贝(用户要求两份出库),

在做完备份作业,磁带出库异地保存,所以每次离库的代价是每个

全备需要2卷磁带(2份出库),两年每月一次共48个全备.一个

全备需要2卷磁带,共需要磁带96卷。

3.离线备份数据量为4320GB,一卷磁带100GB,分配44卷磁带.

磁带数:166卷

3.单证服务器:Informix数据库100GB

数据保留期限:

数据库分配容量:

1.在线备份每日全备14份,14×100GB=1400GB

2.In-line备份磁带库中全备24份,24×100GB=2400GB

3.In-line备份离库有全备48份,48×100GB=4800GB

磁带分配原则:

1.在线备份数据量为1400GB,一卷磁带100GB,分配14卷磁带.

2.离线备份是备份的同时,多做两份拷贝(用户要求两份出库),

在做完备份作业,磁带出库异地保存,所以每次离库的代价是每个

全备需要2卷磁带(2份出库),两年每月一次共48个全备.一个

全备需要2卷磁带,共需要磁带48卷。

3.离线备份数据量为4800GB,一卷磁带100GB,分配48卷磁带.

磁带数:110卷

4.全面预算服务器: DB2数据库30GB

1.在线备份每日全备14份,14×30GB=420GB

2.In-line备份磁带库中全备24份,24×30GB=720GB

3.In-line备份离库有全备48份,48×30GB =1440GB

磁带分配原则:

1.在线备份数据量为420GB,一卷磁带100GB,分配5卷磁带.

2.离线备份是备份的同时,多做两份拷贝(用户要求两份出库),

在做完备份作业,磁带出库异地保存,所以每次离库的代价是每个

全备需要2卷磁带(2份出库),两年每月一次共48个全备.一个

全备需要2卷磁带,共需要磁带48卷。

3.离线备份数据量为720GB,一卷磁带100GB,分配8卷磁带.

磁带数:61卷

650GB

5.两核影像服务器: 文件系统数据

1.在线备份每周全备2份,2×650GB=1300GB

2.In-line备份磁带库中全备20份,20×650GB=13000GB

3.In-line备份离库有全备40份,40×650GB=26000GB

磁带分配原则:

1.在线备份数据量为1300GB,一卷磁带100GB,分配13卷磁带.

2.离线备份是备份的同时,多做两份拷贝(用户要求两份出库),

在做完备份作业,磁带出库异地保存,所以每次离库的代价是每个

全备需要6卷磁带(2份出库),两年每月一次共48个全备.一个

全备需要6卷磁带,共需要磁带48*6=288卷。

3.离线备份数据量为13000GB,一卷磁带100GB,分配130卷磁带.

磁带数:431卷

6.OA公文服务器:文件系统数据 11GB

数据库分配容量:

1.在线备份每日全备3份,3×11GB=33G B

2.In-line备份磁带库中全备2份,2×11GB=22GB

3.In-line备份离库有全备4份,4×11GB=44GB

磁带分配原则:

1. 在线备份分配2卷磁带,是出于磁带冗余的角度出发,我们把隔

天的数据写在一卷磁带上,可以避免磁带故障导致备份作业失败,也

可以保证数据恢复的可用性。

2. 离线备份是备份的同时,多做两份拷贝(用户要求两份出

库),在做完备份作业,磁带出库异地保存,所以每次离库的代价

是2卷磁带(2份出库),每年一次保存两年共4份。

3.离线备份分配2卷磁带,是出于磁带冗余的角度出发,我们把隔

天的数据写在一卷磁带上,可以避免磁带故障导致备份作业失败,

也可以保证数据恢复的可用性。这份全备是保存在磁带库中的。

磁带数:8卷磁带

7.OA邮件服务器:文件系统数据 4GB

1.在线备份每日全备3份,3×4GB=12G B

2.In-line备份磁带库中全备2份,2×4GB=8GB

3.In-line备份离库有全备4份,4×4GB=16GB

磁带分配原则:

1. 在线备份分配2卷磁带,是出于磁带冗余的角度出发,我们把隔

天的数据写在一卷磁带上,可以避免磁带故障导致备份作业失败,也

可以保证数据恢复的可用性。

2. 离线备份是备份的同时,多做两份拷贝(用户要求两份出

库),在做完备份作业,磁带出库异地保存,所以每次离库的代价

是2卷磁带(2份出库),每年一次保存两年共4份。

3.离线备份分配2卷磁带,是出于磁带冗余的角度出发,我们把隔

天的数据写在一卷磁带上,可以避免磁带故障导致备份作业失败,

也可以保证数据恢复的可用性。这份全备是保存在磁带库中的。

磁带数:8卷磁带

8.财务服务器:Informix数据库数据20GB

1.在线备份每日全备30份,30×20GB=600G B

2.In-line备份磁带库中全备24份,24×20GB=480GB

3.In-line备份离库有全备48份,48×20GB=960GB

磁带分配原则:

1. 在线备份分配6卷磁带,总数据量为600GB,一卷磁带容量为

100GB,所以分配6卷磁带。

2. 离线备份是备份的同时,多做两份拷贝(用户要求两份出

库),在做完备份作业,磁带出库异地保存,所以每次离库的代价

是2卷磁带(2份出库),每年一次保存两年共48份。分配48卷

磁带。

3.离线备份分配10卷磁带,总数据量为960GB,一卷磁带容量为

100GB,所以分配10卷磁带。

磁带数:64卷磁带

9.精算服务器:Informix数据库110GB/文件系统30GB

1. 数据库在线备份每季全备8份,8×110GB=880G B

文件系统在线备份每日全备30份,30×30GB=90G B

2. 数据库In-line备份磁带库中全备20份,20×110GB=2200GB

文件系统In-line备份磁带库中全备24份,24×30GB=720GB

3. 数据库In-line备份离库有全备40份,40×110GB=4400GB

文件系统In-line备份离库有全备48份,48×30GB=1440GB 磁带分配原则:

1. 数据库在线备份分配9卷磁带,总数据量为880GB,一卷磁带容

量为100GB,所以分配9卷磁带;数据库在线备份分配2卷磁

带,是出于磁带冗余的角度出发,我们把隔天的数据写在一卷磁

带上,可以避免磁带故障导致备份作业失败,也可以保证数据恢

复的可用性。

2. 离线备份是备份的同时,多做两份拷贝(用户要求两份出库),

在做完备份作业,磁带出库异地保存。数据库离线备份分配80

卷磁带,一次全备数据量为110,使用2卷磁带,每季一份保存

5年一共是40份,所以分配80卷磁带;文件系统离线备份,每

次离库的代价是2卷磁带(2份出库),每月一份保存2年,共

48份全备,分配48卷磁带。

3.离线备份要求在磁带库中有一份全备。数据库离线备份分配22卷磁带,总数据量为2200GB,一卷磁带容量为100GB,所以分配

22卷磁带;数据库离线备份分配8卷磁带,总数据量为

720GB,一卷磁带容量为100GB,所以分配8卷磁带磁带数:169卷磁带

10.统计查询服务器Informix数据库34GB/文件系统30GB

1. 数据库在线备份每季全备3份,3×34GB=102G B

文件系统在线备份每日全备3份,3×30GB=90G B

2. 数据库In-line备份磁带库中全备24份,24×34GB=816GB

文件系统In-line备份磁带库中全备24份,24×30GB=720GB

3. 数据库In-line备份离库有全备48份,48×34GB=1632GB

文件系统In-line备份离库有全备48份,48×30GB=1440GB 磁带分配原则:

1. 数据库在线备份分配2卷磁带,总数据量为102GB,是出于磁带

冗余的角度出发,我们把隔天的数据写在一卷磁带上,可以避免

磁带故障导致备份作业失败,也可以保证数据恢复的可用性;文

件系统在线备份分配2卷磁带,是出于磁带冗余的角度出发,我

们把隔天的数据写在一卷磁带上,可以避免磁带故障导致备份作

业失败,也可以保证数据恢复的可用性。

2. 离线备份是备份的同时,多做两份拷贝(用户要求两份出库),

在做完备份作业,磁带出库异地保存。数据库离线备份分配80

卷磁带,一次全备数据量为110,使用2卷磁带,每月一份保存

2年一共是48份,所以分配48卷磁带;文件系统离线备份,每

次离库的代价是2卷磁带(2份出库),每月一份保存2年,共

48份全备,分配48卷磁带。

3.离线备份要求在磁带库中有一份全备。数据库离线备份分配9卷磁带,总数据量为816GB,一卷磁带容量为100GB,所以分配9

卷磁带;数据库离线备份分配8卷磁带,总数据量为720GB,一

卷磁带容量为100GB,所以分配8卷磁带。

磁带数:117卷磁带

根据对数据的分析我们得出,磁带使用情况。(单位:卷)

10%的冗余和增量备份130卷磁带

需要磁带:1294+130=1424卷磁带

磁带库内必须配置:331+107=438卷磁带+10%冗余=481卷

1.2.3磁带库系统磁带机需求

磁带机是磁带库的读写部件,磁带库的总体读写速度直接与磁带机有关。这里我们建议备份系统采用LTO技术。我们这里选用系统最大数据量的系统做参照进行需求分析,备份窗口建议为4个小时,最大数据体为两核服务器650GB

LTO的速度是15MB/S,经测试我们得出数据库备份速度为14MB/S;恢复速度为9MB/S;

1个小时备份数据:50GB;恢复数据32GB

一次全备的数据量为:240GB

备份需要LTO磁带机560/50/4=3台

恢复需要LTO磁带机560/32/4=5台

要实现有2份备份出库管理,系统要求做备份的时候有3个备份同时进行,一份备份保留在磁带库中,另外两份出库。这样要求磁带机是原来的3倍。

我们最终需要磁带机:5×3台+1台冗余=16台LTO磁带机

1.3 应用需求分析

保险公司的数据有他们自己的特点,很多对数据检索的需求,有典型的一次写入多次读的数据特征,不经常被访问的数据放在硬盘上是对磁盘资源的浪费;光盘技术又有不易使用、容量小、出错率高等许多弊端,所以我们推荐使用磁带机技术代替光盘技术,来实现数据检索的功能。

分级存储技术的特别:

文件的目录和相关信息仍然保留在磁盘,应用程序可操作;

?自动将使用频度较少的数据迁移到二级存储;

?自动预防空间溢出问题;

?对用户和应用程序透明:

?数据看起来始终在线;

?应用程序看起来始终使用空间无限;

?发生被迁文件的调用时,文件自动迁回。

从以上特点我们看出了数据系统层次化管理所蕴含的巨大效益,因此本系统的建设ADIC认为应该使用分级存储管理模式。我们强烈推荐ADIC AMASS软件。

注:设备使用建议建议使用AIT-3技术(详见 2.7),因为没有详细的需求,暂无配置。

1.4 磁带和磁带机数量建议

根据太平洋寿险有限公司的实际情况,由于磁带机和磁带数量过大,从实际情况来说,一份磁带出库就可以起到出库管理的效果。所有建议,使用磁带:在线备份+离线备份(库内部分)=331+107=438卷磁带+10%冗余=481卷

离线备份(离库部分)=856/2=428卷

使用磁带机:5×2磁带机+1台冗余=11台磁带机

第二章方案的确定与产品的选型

2.1 方案的确定

根据上述对中国太平洋人寿保险有限公司的需求分析,归根结底是要建

立两个子系统,

1.磁带库子系统,与备份软件结合,用于数据库和文件系统的备份。

2.数据检索子系统,与实际应用结合,建立完善的数据检索系统。

2.2 产品的建议

根据上一章的分析,为了建立上述两个子系统,建议使用,

1.ADIC Scalar1000磁带库,最基本包括磁带库控制柜和2个扩展柜。

(技术文档见附录1)

2.ADIC AMASS软件,用来建立数据检索系统。(软件介绍见附录3)

3.ADIC SDLC软件,为了整合备份和数据检索系统。(软件介绍见附录4) 4.LTO磁带机用于数据备份;AIT-3磁带机用于数据检索。(详见附录5)

2.3 工作环境下遇到的问题及考虑

太平洋保险寿险总公司的存储系统环境是SAN的环境,磁带库子系统针对SAN

环境提出了一整套解决方案,是为了磁带库设备在SAN的环境下真正实现最高的可

靠性和性能指标。使磁带库不仅是一种大容量存储设备,而成为SAN存储网络的有

机组成部分。

在现实备份软件工作过程中,我们会发现许多问题

?问题1:一次备份作业失败,查找原因,原来是磁带机故障造成作业失败

分析:如果在磁带机故障初始,我们发现问题并解决它,我们可以不用那么被动。

磁带机设备不同于磁盘设备,磁盘设备与主机实时通讯,主机可以知道磁盘的状态,可以在发生故障时即使得到解决;磁带机设备没有实时通讯的机制,也就是说等主机系统使用磁带机时才可能发现磁带机不可用,ADIC 磁带库提供端到端的验证机制。

?通过可定义的时间间隔主动验证数据路径的可用性

?从任何一台主机到任一台磁带库或磁带机

?检测系统连接的变化,为处理数据流通做准备

?通过标准的SNMP traps向系统管理工具报警

?问题二:观察备份作业数据流,有经验的备份工程师都看到过,数据流时有时无。数据流不是很均匀。

分析:数据流的不均匀必定导致磁带机机械的启停,一个方面不能充分发挥磁带机的性能;也缩短磁带机的寿命。

磁带机设备属于流设备,读写操作是在磁带上顺序进行,如果数据流流量不均匀,会造成磁带机读写操作时停时动,磁带机设备有很大一部分时机械部分,长期处于这种状态对磁带机时一种伤害,ADIC提出优化磁带机驱动器的性能。

?预先请求数据,避免磁带机驱动器的缓冲区等待数据到来

?降低数据延迟,保证驱动器持续读写数据

?降低磁带机驱动器的磨损,延长驱动器使用寿命

?采用ADIC专有的专利技术

在寿险测试过程中,我们看到了很明显的效果。磁带库很稳定的以很高的速度运行。

?问题三:我们在测试的时候曾经通过配置SNC,看到EMC上所有的LUN.

分析:SAN的安全应该是数据保护的重要组成部分

网络的安全已经被IT管理者所认同和实施,实际上SAN也存在同样的问题,实施过SAN环境工程的人员都有过这样的经历,如果在光纤交换机没有做任何配置,与光纤交换机相连的主机可以看到磁盘阵列中所有的数据。同理,如果没有任何配置,在SAN环境下的主机都能看到磁带库并对其进行操作,这是IT管理者不可容忍的,Scalar提供防火墙管理员,主动的配置主机对磁带库的访问权限。

?保证数据和通道配置的一致性

?在主机和驱动器之间提供可编程的访问控制能力

?独立于SAN交换机的分区(zoning)功能

?在磁带库中控制到每个设备地址

?可以和所有主流交换机、FC卡互操作

?限止未授权主机访问

?问题四:有过实施备份项目的人都有过不停穿梭于机房和操作间的经历,要查看磁带库的状态,又要兼顾备份软件的调试。

分析:可管理性应该成为选择产品的原则,降低管理的的复杂性是解放IT 管理的途径。

1.简单,以一个完整系统的方式管理磁带库

a)类似RAID磁盘阵列的概念

b)简化系统视图的复杂程度

c)简化资源共享

d)管理通讯协议接口

2.灵活,增值功能

a)同时支持多种存储网络结构(Fabric)

b)同冗余链路

c)允许集成不同的驱动器类型

3.强大,发展未来功能的平台

a)磁带库分区

b)驱动器管理(驱动器备份和驱动器池)

c)主动、预见性的报警机制

?问题五:磁带库设备和SAN相连是很多工程实施者所面临的挑战。

分析:磁带库原来设计目的是主机的附属设备,随着科技发展,正悄悄改变着这种模式,磁带库与SAN的互联成为很多用户最关心的问题。

ADIC SNC5100提供很好的互联互通能力,在我们测试的过程中使用的是一台新的SNC模块,安装到调试到可以使用不超过半个小时。这样可以简单快速安装的设备在设备扩容过程中可以发挥更大的作用。

相关主题
文本预览
相关文档 最新文档