电信核心业务系统容灾解决方案
- 格式:doc
- 大小:199.50 KB
- 文档页数:5
华为容灾解决方案一、背景介绍容灾是指在面临各种自然灾害、人为意外或硬件故障等突发情况时,通过采取措施确保业务的连续性和数据的安全性。
华为作为一家全球领先的信息与通信技术解决方案供应商,提供了全面的容灾解决方案,帮助企业实现高可用性、高可靠性的业务运行。
二、华为容灾解决方案的核心特点华为容灾解决方案具有以下核心特点:1. 可靠性华为容灾解决方案采用先进的硬件设备和可靠的技术架构,确保业务连续运行并保障数据安全。
华为的设备经过严格的质量控制和测试,具有高可靠性和稳定性,能够在各种恶劣环境下正常运行。
2. 灵活性华为容灾解决方案提供多种灵活的部署方式,可以根据企业的实际需求进行定制化设计。
无论是私有云、公有云还是混合云,都可以通过华为的容灾解决方案来实现高可用性和业务连续性。
3. 可扩展性华为容灾解决方案支持横向和纵向的扩展,可以根据业务的发展需求进行弹性扩容。
无论是增加服务器、存储设备还是网络带宽,都可以方便地进行扩展,保证业务的高可用性和可靠性。
4. 故障切换速度快华为容灾解决方案采用了先进的故障检测和切换机制,可以在毫秒级别内完成故障的切换。
即使在故障发生时,用户几乎感受不到业务的中断,保证业务的连续性和可用性。
5. 多层级的保护方案华为容灾解决方案采用了多层次的保护策略,包括数据备份、数据同步、灾备容器、灾备中心等。
无论是硬件故障、软件故障还是自然灾害,都可以通过华为容灾解决方案来保护数据和业务的安全。
三、华为容灾解决方案的应用场景华为容灾解决方案适用于各种行业和企业规模,以下是一些常见的应用场景:1. 金融行业在金融行业,业务的连续性和数据的安全性至关重要。
华为容灾解决方案可以帮助银行和证券公司实现金融交易系统的高可用性和可靠性,保障用户的资金安全和交易效率。
2. 电信运营商电信运营商需要保证通信网络的稳定性和可用性。
华为容灾解决方案可以帮助电信运营商实现网络设备的冗余备份和快速故障切换,保证用户的通信服务不中断。
数据容灾解决方案"抗地震"的应用系统高可用性方案适用范围惠普的高可用性群集方案适用于对应用系统要求7x24小时不间断运行的企业用户,尤其适用于对数据的完整性,实时性极为敏感的银行,电信,保险及大型企业用户等等。
现状及问题保持业务的持续性是当今企业用户进行数据存储需要考虑的一个重要方面。
系统故障的出现,可能导致生产停顿,客户满意度降低,甚至失去客户,企业的竞争力也大打折扣。
就在前不久,某网站的RAID卡的故障导致免费的主页大部分丢失,网民们采用各种方式声讨,导致该网站的声誉大降,一部分网民对之失去信心。
因此,保持业务的持续性是用户在选择计算机系统的重要指标。
究其根本,保护业务持续性的重要手段就是提高计算机系统的高可靠性。
高可靠性系统必须能够解决各种导致计算机系统失效的意外情况,保护业务应用在7x24小时的时间内不间歇运行。
1. 避免单点失效的情况出现。
普通的高可靠性方案主要是利用冗余硬件设备保护用户IT环境内某个服务器,网络设备,如双网卡,双交换机等等。
2. 避免灾难发生后所导致的数据灾难。
即如何有效利用用户实施的灾难恢复方案在应急地点迅速地重新恢复业务应用。
在这里,灾难的定义主要是指自然的和人为的灾难,包括系统硬件,网络故障,机房断电甚至火灾地震,例如台湾的台北大地震导致该区域内建筑及大部分机器均遭到严重破坏。
而灾难发生从而引发的系统宕机的损失可能导致生产停顿,失去客户以及减少定单、收入。
根据美国有关机构统计,在美国银行业,每次计算机系统宕机导致的损失平均为一千万美元,这还不包括对公司声誉的影响所导致的无形资产的损失,而采取灾难恢复方案总共花费平均只有一百万美元。
因此,高可靠性方案应该考虑到应用、数据和系统各级的保护。
一个有效的高可靠性计算环境应该能够做到:◆数据中心任何计算机系统硬件,软件,应用故障将不影响整个中心的处理工作;◆数据中心由于灾难(火灾、地震)等原因无法工作时,应有一个备份数据中心能够立即接管关键应用,继续运行;◆主数据中心恢复后,应用、数据应迅速切换回主中心运行。
SRDF容灾解决方案概述SRDF(Symmetrix Remote Data Facility)是一种高级数据复制技术,由戴尔EMC公司开发,用于实现数据的容灾和灾难恢复。
该技术通过在主机和存储系统之间建立远程数据镜像,可以将数据实时复制到远程位置,并能在发生灾难时快速恢复数据,确保业务的持续性和数据的安全性。
下面将详细介绍SRDF容灾解决方案的概述。
SRDF容灾解决方案基本架构如下图所示:[图]在SRDF容灾解决方案中,主要包含以下几个核心组件:1. 主机系统(Host System):主机系统是运行应用程序的服务器,可以是物理服务器或虚拟机。
主机通过光纤通道(Fibre Channel)或以太网(Ethernet)连接到存储系统。
2. 存储系统(Storage System):存储系统通常是戴尔EMC的Symmetrix系列产品,包括VMAX、PowerMax等。
存储系统负责存储和管理数据,并提供高级数据保护和复制服务。
3. 远程存储系统(Remote Storage System):远程存储系统是主存储系统的镜像,位于远程位置。
远程存储系统通过光纤通道或以太网与主存储系统进行数据复制和同步。
4. 光纤通道(Fibre Channel):光纤通道是连接主机和存储系统的高速传输介质,用于传输数据和控制信息。
光纤通道具有较低的延迟和高带宽,并能支持远距离的数据传输。
SRDF容灾解决方案的工作流程如下:1. 初始化:在开始容灾之前,需要对主存储系统和远程存储系统进行初始化配置。
主存储系统将指定一部分容量作为远程存储系统的镜像,并建立数据保护策略。
2. 复制数据:一旦完成初始化配置,主存储系统会实时将数据复制到远程存储系统。
数据复制可以通过同步或异步模式进行,同步模式要求主存储系统和远程存储系统的数据保持一致,而异步模式则允许一定程度的延迟。
3. 失效转移:当主存储系统发生故障或不可用时,自动切换到远程存储系统。
应用容灾方案1. 引言应用容灾是指在系统遭到灾害性故障或中断后,通过多副本的部署方式保证应用的高可用性,保障业务连续性和稳定性。
本文将介绍应用容灾的概念、重要性以及常见的应用容灾方案。
2. 应用容灾的概念应用容灾是指在系统发生故障时,通过备份和复原技术,确保系统的持续运行和提供可信赖的服务。
应用容灾可以有效减少因系统故障造成的业务损失,提高系统的可用性和可靠性。
3. 应用容灾的重要性应用容灾对于保障业务的连续性和稳定性至关重要。
以下是应用容灾的几个重要原因:3.1. 保证业务连续性当系统遭遇故障时,应用容灾方案可以快速切换到备份系统,确保业务的连续性。
这对于金融、电信、电力等关键行业来说尤为重要,以免因系统故障导致的业务中断带来巨大损失。
3.2. 提高系统可用性通过部署多副本的方式,应用容灾方案可以保证系统的高可用性,当一个节点出现故障时,其他节点可以接管服务,避免单点故障带来的系统不可用。
3.3. 减少数据丢失风险良好的应用容灾方案可以确保数据的实时备份和同步,最大限度地减少因系统故障导致的数据丢失风险。
这对于数据密集型应用和需要实时数据同步的系统来说尤为重要。
4. 常见的应用容灾方案以下是几种常见的应用容灾方案,可以根据实际情况选择合适的方案:4.1. 冷备容灾方案冷备容灾方案是指在备份系统上预留足够资源和环境,但不实时同步数据。
当主系统发生故障时,需要手动切换到备份系统,并进行数据恢复。
这种方案适用于对数据实时性要求不高的应用场景,成本较低。
4.2. 热备容灾方案热备容灾方案是指备份系统实时同步主系统的数据,并保持与主系统的状态一致。
当主系统故障时,可以直接切换到备份系统,业务继续运行。
这种方案适用于对数据实时性要求高的应用场景,成本较高。
4.3. 多活容灾方案多活容灾方案是指同时部署多个集群,每个集群都可以独立提供服务。
通过实时数据同步和负载均衡技术,实现高可用性和负载均衡。
这种方案适用于大规模分布式系统和全球化应用,成本较高。
异地容灾方案一、引言在当今信息化时代,对于企业来说,数据的安全性和业务的连续性至关重要。
由于自然灾害、人为因素等原因,数据中心或服务器出现故障或中断的情况时有发生。
为了保障数据的安全和业务的稳定运行,异地容灾方案就应运而生。
异地容灾是指将主要业务系统和数据备份部署在不同的地理位置,当发生灾害或故障时,能够迅速切换到备份系统,确保业务的连续性和数据的完整性。
本文将介绍异地容灾方案的基本概念、实施步骤以及常见的技术方案和应用场景。
二、异地容灾方案的概念1. 异地容灾的定义异地容灾是企业为了应对可能发生的灾害、故障或其他意外事件而制定的一系列措施和技术手段。
其目标是保证业务系统的高可用性、数据的安全性和完整性,并尽量减少业务中断的时间和影响范围。
2. 异地容灾的原则异地容灾方案的设计应遵循以下原则:•故障独立性:异地容灾系统应与主要业务系统相互独立,避免单点故障,确保故障不会同时影响两个系统。
•数据一致性:异地容灾系统应定期备份主要业务系统的数据,并且保证备份数据的完整性和一致性。
•快速恢复:异地容灾系统应能够在短时间内快速切换到备份系统,实现业务的连续性。
•可扩展性:异地容灾系统应具备灵活的扩展性,能够适应业务的增长和变化。
•成本效益:异地容灾方案应在保证业务连续性的前提下,尽量控制成本。
三、异地容灾方案的实施步骤异地容灾方案的实施可分为以下步骤:1. 需求分析与规划在开始实施异地容灾方案之前,需要先进行需求分析和规划。
根据业务的需求确定容灾目标、容灾等级和容灾策略,以及选择适合的容灾技术和解决方案。
2. 环境准备与部署根据规划的容灾目标和策略,进行环境准备和部署工作。
包括建立备份服务器、搭建网络环境、配置存储设备等,确保备份系统的稳定性和可靠性。
3. 数据备份与同步在主要业务系统上配置定期备份任务,并将备份数据传输到备份服务器。
同时,使用同步技术保持备份数据与主要业务系统数据的一致性,例如异步复制、同步复制等。
SRDF容灾解决方案概述SRDF(Symmetrix Remote Data Facility)是EMC公司推出的一种用于数据中心容灾的解决方案。
它基于EMC的Symmetrix存储阵列,可以实现数据的实时复制和故障切换,确保业务的高可用性和数据的持久性。
SRDF容灾解决方案的核心思想是通过将数据从一个数据中心复制到另一个数据中心,以实现数据的容灾备份和灾难恢复。
该解决方案主要包括以下几个组件和功能:1. Symmetrix存储阵列:SRDF解决方案是基于EMC的Symmetrix存储阵列的,它提供了高性能、高可靠性的存储能力,可以支持大规模的数据中心和关键业务的容灾需求。
2. 全局地址空间(Global Address Space):SRDF利用全局地址空间将多个数据中心中的存储设备组织成一个逻辑的存储池。
这样,复制的数据可以跨越不同的存储设备进行传输和存储,从而实现数据的灾难恢复和容灾备份。
3. 三种复制模式:SRDF提供了三种不同的复制模式,分别是同步模式、半同步模式和异步模式。
同步模式要求主节点将数据写入到备份节点后,必须等待备份节点将数据写入存储设备后才返回,从而确保数据的一致性;半同步模式要求主节点将数据写入到备份节点后,只需等待备份节点将数据传输到存储设备后才返回;异步模式则没有同步需求,主节点将数据写入到备份节点后立即返回。
4. 快照和克隆:SRDF可以基于存储设备的快照和克隆功能来实现灾难恢复和容灾备份。
快照是存储设备对当前数据的一种镜像,可以用于快速恢复数据。
克隆是对整个存储设备创建的一个完全相同的副本,可以在灾难发生时替代主设备以恢复业务。
5. 自动故障切换和恢复:SRDF可以自动检测主节点的故障,并将业务切换到备份节点,从而实现业务的高可用性和灾难恢复。
一旦主节点故障,SRDF会自动将备份节点上的数据激活,并启动数据的传输和恢复过程。
6. 灾难恢复测试:SRDF还提供了灾难恢复测试功能,可以定期模拟灾难场景,检查容灾解决方案的可用性和有效性。
系统容灾备份方案2015年6月目录1总则 (2)1.1适用范围 (3)2应急人员名单 (3)3系统总体架构图 (4)4硬件设备应急方案 (4)4.1硬件设备应急内容 (4)4.2主机异常宕机且硬件报错 (4)4.3主机操作系统无法正常启动应急处置 (5)4.4主机数据和存储崩溃应急处置 (6)5服务器应急方案 (7)5.1主机操作系统检测 (7)5.2应用程序服务检测 (7)5.2.1故障场景及应急操作 (7)5.2.2故障恢复验证 (9)5.3双机软件检测 (10)5.3.1双机检测 (10)5.4数据库应急方案 (10)1总则1.1适用范围本操作手册适用于Bankeys后台系统出现主机硬件、系统程序、数据库系统紧急情况时的应急处置。
相关紧急情况信息如下:●主机紧急情况包括:主机服务器宕机,主机硬件报错、硬盘储存空间不足等情况。
●系统服务器紧急情况包括:主机操作系统不间断重启,系统宕机,系统报错,程序服务报错无法重启,主备机无法正常切换等情况。
●数据库紧急情况包括:主机操作系统不间断重启,系统宕机,系统报错,数据库无法启动,主备机无法正常切换等情况。
出现上述紧急情况之一,应立即上报信息系统应急指挥领导小组,经领导同意后立即启动相应的处理流程。
2应急人员名单3系统总体容灾架构图架构说明:4硬件设备应急方案4.1硬件设备应急内容主机服务器设备紧急情况包括:1.主机异常宕机,主机硬件报错;2.设备操作系统无法正常启动;3.设备数据和存储崩溃;若发生上述紧急情况,立刻通知电信系统维护岗工程师到现场,同时维护厂商的IBM专项工程师也必须到达现场,且维护厂商的电信PM(维护项目经理)也应立刻知晓并进行调度。
若发生需要协调原厂工程师到达现场之情形,则由维护厂商的电信PM进行原厂报修派单,备件原则为未过保设备由原厂经维保厂商提交报修后提供,在特殊需求下,维保厂商可以预先提供故障备件先行恢复业务后,由原厂提交的备件在业务非繁忙时段进行替换,替换工作的流程调度,时间点由系统维护岗工程师安排,经领导批准后方可进行。
容灾实施方案1. 引言容灾(Disaster Recovery, DR)即灾难恢复,是指在发生灾难性事件后能够迅速恢复系统正常运行。
容灾实施方案是为了应对各种可能的系统故障、硬件损坏、自然灾害等情况而制定的一套应急预案,旨在最大程度地减少系统故障对业务的影响,保证业务的连续性和可靠性。
本文将介绍容灾实施方案的相关内容。
2. 容灾类型容灾方案可以分为三个基本类型:远程备份、冷备份和热备份。
2.1 远程备份远程备份是将主要数据和应用程序备份到远程位置,以防止本地数据中心发生故障或灾难。
这种类型的容灾方案要求具备高带宽和低延迟的网络连接,并需要定期将数据和系统配置备份到远程位置。
当本地数据中心发生故障时,可以快速切换到远程备份设施,保持业务的连续性。
2.2 冷备份冷备份是将数据和应用程序备份到离线媒体(如磁带、硬盘等)上,并存储在离主要数据中心较远的地方。
在发生灾难时,需要将备份媒体转移到备用设备上,并进行系统恢复。
这种类型的容灾方案适用于对业务中断时间要求不高的场景。
2.3 热备份热备份是将数据和应用程序实时备份到另一个设备或数据中心,并保持数据的同步更新。
当主要数据中心发生故障时,可以立即切换到备用设备或数据中心,并继续提供业务服务。
这种类型的容灾方案对业务连续性要求非常高,适用于金融、电信等对业务中断时间要求严格的行业。
3. 容灾实施方案步骤容灾实施方案的步骤可以概括为:需求分析、架构设计、设备采购和配置、方案测试和优化。
3.1 需求分析在制定容灾方案之前,需要充分了解业务需求和系统特点,包括数据量、业务连续性要求、数据安全性要求等。
通过需求分析,确定容灾方案的目标和关键指标,为后续的架构设计提供依据。
3.2 架构设计根据需求分析的结果,进行容灾架构的设计。
需要考虑数据同步机制、备份设备的选择及配置、网络连接的设计、自动切换机制等。
一般情况下,需要采用多层容灾方案,以提供更高的可靠性和容错能力。
数据容灾技术及容灾方案介绍近几年来,容灾已经成为信息数据中心建设的热门课题,很多容灾技术也快速发展起来,用户也有很大的选择余地。
但由于容灾方案的技术复杂性和多样性,一般用户很难搞清其中的优劣,以确定如何选择最适合自己状况的容灾解决方案。
容灾方案的分类目前有很多种容灾技术,分类也比较复杂。
但总体上可以区分为离线式容灾(冷容灾)和在线容灾(热容灾)两种类型。
所谓的离线式容灾主要依靠备份技术来实现。
其重要步骤是将数据通过备份系统备份到磁带上面,而后将磁带运送到异地保存管理。
这种方式主要由备份软件来实现备份和磁带的管理,除了磁带的运送和存放外,其他步骤可实现自动化管理。
整个方案的部署和管理比较简单,相应的投资也较少。
但缺点也比较明显:由于采用磁带存放数据,所以数据恢复较慢,而且备份窗口内的数据都会丢失,实时性比较差。
对于资金受限、对数据恢复的RTO和RPO要求较低的用户可以选择这种方式。
在线式容灾要求生产中心和灾备中心同时工作,生产中心和灾备中心之间有传输链路连接。
数据自生产中心实时复制传送到灾备中心。
在此基础上,可以在应用层进行集群管理,当生产中心遭受灾难、出现故障时,可由灾备中心自动接管并继续提供服务。
应用层的管理一般由专门的软件来实现,可以代替管理员实现自动管理。
由上面分析可见,实现在线容灾的关键是数据的复制。
数据的复制有多种实现方式,各有利弊,后面我们将深入讨论。
由于在线容灾可以实现数据的实时复制,因此,数据恢复的RTO和RPO都可以满足用户的高要求。
因此,数据重要性很高的用户都应选择这种方式,比如金融行业的用户。
但要实现这种方式的容灾必须有很高的投入,一般中小型企业用户很难负担。
在方案选择时一定要考虑多方面的因素。
很多用户在初期规划时都过于追求完美,对RTO和RPO要求过高,并不考虑自身的经济承受能力,导致最后的预算无法负担。
所以,选择容灾方案一定要结合自己的实际情况,并不一定要求无数据丢失,只要能确保在业务的可承受范围内就可以了。
电信运营商解决方案摘要:在本文中,我们深入分析了____年电信运营商所遭遇的主要挑战,并提出了一系列旨在促进电信业务持续增长的策略性解决方案。
伴随物联网、5G技术以及人工智能等前沿科技的飞速进步,电信运营商面临不断攀升的数据处理需求、网络安全挑战以及客户服务质量提升等紧迫问题。
本文旨在探讨如何克服这些挑战,推动电信产业的健康发展。
一、应对挑战:满足数据需求的持续增长物联网技术的广泛应用导致数据量激增,对网络带宽和存储能力提出了更高要求。
新兴技术如云计算、大数据和人工智能为数据处理和分析提供了新的契机。
具体对策:1. 加强网络基础设施建设:电信运营商需加大投资,提升网络带宽,扩充数据中心规模,以适应数据增长需求。
2. 优化网络管理及资源配置:利用自动化技术和智能算法,提高网络资源的管理和调度效率,确保服务质量与用户体验。
二、应对挑战:网络安全威胁的加剧互联网的快速发展也带来了网络安全问题的增加。
网络攻击、数据泄露和恶意软件等威胁对运营商网络和用户数据安全构成严重挑战。
具体对策:1. 提升网络安全防护能力:建立全面的安全防护体系,采用先进加密技术,保障网络和用户数据安全。
2. 加强安全监控与应急响应:建立实时监控系统和快速响应机制,及时发现并处理安全威胁,减少风险和损失。
三、应对挑战:提升客户体验用户对高速、可靠通信服务的需求日益增长,电信运营商需提供更优质的服务以满足客户期望,保持市场竞争力。
具体对策:1. 扩大宽带网络覆盖:加强偏远地区的宽带网络建设,满足用户通信需求。
2. 提升网络速度与稳定性:推动5G技术发展,优化网络架构,强化设备管理,提供更快速、稳定的网络服务。
3. 实施个性化服务:利用人工智能和大数据技术,深入理解用户需求,提供定制化服务和产品,提升用户满意度和忠诚度。
四、应对挑战:实现环境可持续性电信行业的快速发展给环境带来了压力。
电信设备的高能耗和碳排放问题需要得到有效控制,以实现可持续发展。
中国电信解决方案1. 简介中国电信是中国最大的电信运营商之一,提供广泛的电信服务和解决方案。
本文将探讨中国电信的解决方案,并介绍如何利用这些解决方案来满足企业和个人的相关需求。
2. 企业解决方案2.1 云计算中国电信提供完善的云计算解决方案,帮助企业实现信息技术资源的灵活、高效、安全的使用。
这些解决方案包括:•弹性计算:提供按需可扩展的计算资源,帮助企业根据业务需求灵活调整IT资源的规模。
•云存储:提供可靠、高可用的云存储服务,帮助企业存储和管理海量数据。
•容器服务:提供高效、安全的容器服务,帮助企业快速构建和部署应用程序。
•人工智能:提供人工智能平台和解决方案,帮助企业实现智能化的业务应用。
2.2 物联网中国电信的物联网解决方案可以帮助企业构建和管理大规模的物联网设备网络。
这些解决方案包括:•物联网接入:提供多种接入方式,包括蜂窝网络、无线局域网等,帮助企业实现物联网设备的连接。
•设备管理:提供设备管理平台,帮助企业实现对物联网设备的监控、维护和管理。
•数据管理:提供数据管理平台,帮助企业实现对物联网设备产生的数据进行采集、存储和分析。
•应用开发:提供应用开发平台和工具,帮助企业开发和部署物联网应用程序。
2.3 数据中心中国电信的数据中心解决方案可以帮助企业构建和管理高可靠、高性能的数据中心。
这些解决方案包括:•服务器托管:提供服务器托管服务,帮助企业将服务器集中放置在数据中心进行统一管理。
•网络服务:提供高速、可靠的网络接入服务,为企业提供稳定的网络连接。
•存储与备份:提供高容量、高可靠的存储系统和备份服务,帮助企业存储和保护重要数据。
•灾备与容灾:提供容灾解决方案,帮助企业实现业务的持续性和可恢复性。
3. 个人解决方案3.1 移动通信中国电信为个人用户提供多种移动通信解决方案,包括手机支付、通话、短信、上网等服务。
这些解决方案包括:•手机支付:提供安全、方便的手机支付服务,支持多种支付方式,如二维码支付、NFC支付等。
某电信10000号多媒体客服系统灾容方案设计
孙敏
【期刊名称】《信息通信》
【年(卷),期】2016(000)003
【摘要】建设10000号多媒体客服系统双中心,通过排队机、CTI、IVR、数据库等核心部件的容灾设计,排除客服系统单节点故障,满足系统稳定性、功能性要求.【总页数】2页(P250-251)
【作者】孙敏
【作者单位】华信咨询设计研究院有限公司,浙江杭州310014
【正文语种】中文
【中图分类】F274
【相关文献】
1.基于“军卫一号”数据库的DataGuard数据容灾方案设计与实现 [J], 王兴强;侯玉玲;刘长兴;刘国伟
2.构建中国电信智慧10000号客服系统的研究与实现 [J], 俞科峰
3.容灾系统应用实例分析:应用行业:电信行业实施厂商:惠普公司——大连电信综合业务容灾方案 [J],
4.贴心365 用心每一天--记"全国用户满意电信服务明星班组"四川电信泸州市分公司10000号 [J],
5.贴心365 用心每一天——记“全国用户满意电信服务明星班组”四川电信泸州市分公司10000号 [J],
因版权原因,仅展示原文概要,查看原文内容请购买。
电信核心业务系统容灾解决方案
Oracle 技术产品咨询顾问 高壮志 2004/05/24
随着电信运营商多年的系统建设,其核心业务系统的高可用性越来越受到人们的关注。
从整个系统的角度来看高可用性,包括主机、操作系统、数据库、应用、网络设备等许多方
面。而这些系统的一个显著特点就是以数据为中心,因此对数据的保护是整个系统高可用性
的核心体现。Oracle数据库作为电信运营商核心系统的主流数据库,针对企业用户的重要数
据、重要业务高可用性的需求提出了建立在数据库级别的容灾方案-- Oracle Data Guard (数
据卫士)。
为什么要使用Data Guard
电信行业现有系统在容灾方面基本上有两种做法。一是采用备份的方法,即定期地将数
据备份到硬盘和磁带上。这种方法的缺陷是实时性较差,恢复时间较长;另外备份设备和生
产系统一般都处于同一物理位置,不能满足异地容灾的要求。另一种做法就是硬件镜像的做
法,这种做法在硬件投资上较大,对两点间网络带宽有较大要求。鱼和熊掌,可否兼得?下
面让我们来看看Oracle Data Guard解决方案。
Oracle Data Guard
Oracle9i Data Guard 维护了一个或多个与客户生产数据的同步备份。Oracle9i Data
Guard配置包括一个松散连接的系统集合,由一个生产数据库和若干备用数据库组成,形成
一个独立、易于管理的数据保护方案。现有运营商的核心业务系统的数据库在物理位置上往
往位于省信息中心或计费中心的机房内,如果在同一城市有其它机房或利用其它城市机房部
署同步备份的数据库,通过Oracle网络服务连接到一起,就可以构成一个很好的容灾解决
方案。在修改主数据库时,对主数据库更改而生成的更新数据即发送到备用数据库,这些更
改在备用数据库被重新应用。当生产数据库出现故障时,备用数据库可以继续提供服务。
图1提供了一个例子。
图1简单的双工作区配置
由于只是日志文件在主备用数据库之间的传送,其对应用程序是透明的,所以不需更改
现有应用。由于核心业务系统的负载很大,所以我们也会非常关心这种数据同步是否会对生
产数据库产生影响?实际上,生产数据库和备用数据库之间数据同步的方式有同步和异步之
分,我们可以配置备用数据库使其对主数据库的性能几乎没有任何影响。由于仅对生产数据
库所做的更改才发送到备用数据库中,因而这样的应急方案相对于镜像所有数据库文件记录
的方式来说,能够与高事务处理率保持同步,在很大程度上降低了网络流量。
Oracle8i和Oracle9i的第一个版本只支持物理备用数据库,在Oracle9i的第二个版本革
命性地引入了逻辑备用数据库。物理备用数据库和逻辑备用数据库的主要区别在于备用数据
库得到日志文件后,如何应用日志文件(见图2)。
图2 Physical Standby & Logical Standby
物理备用数据库在应用日志文件时,是基于数据块级别来进行。因此,要求备用数据库
和主数据库具有相同的物理结构,而且备用数据库只能处在恢复状态和只读打开两种状态中
的一种。而逻辑备用数据库在应用日志文件时,首先将其转化为SQL语句,然后再进行同
步应用。因此,逻辑备用数据库一直处于打开状态,在应用日志文件的同时,可以同时读取
数据(见图3)。
图3
逻辑备用数据库与主数据库只要求逻辑结构相同,因此,还可以建立自己的数据库对象,
进行读写操作。这样备用数据库就可以分担一部分主数据库的负载,如生成报表、备份等,
在一定程度上提高了用户的投资回报。
Oracle9i Data Guard中主数据库和备用数据库的角色切换有两种方式:Switch Over和
Fail Over。Switch Over使用于计划内宕机的情况,如主数据库进行硬件和操作系统的升级,
Switch Over可以在不产生数据丢失的情况下,可逆地切换主数据库和备用数据库的角色。
切换后,备用数据库成为主数据库,主数据库自动成为备用数据库。在需要时,还可切换回
来。如果发生计划之外的故障,就需通过Fail Over进行角色切换,使备用数据库担当起主
数据库的责任。这时主数据库不会自动成为备用数据库,并且需要一些手工操作来进行恢复。
每笔电信业务以及计费对生产数据库中的数据做出修改时,Oracle9i数据库将在一个联
机重做日志文件中记录此次更改。在Data Gurard中可配置写日志的这个过程,在大的方面
可分为同步方式和异步方式。所谓同步方式就是在提交对生产数据库所做的修改时,要求此
次修改已在备用数据库被应用,在生产数据库的操作才能成功。异步方式是通过维护一个本
地缓存,当积累到一定程度时才将日志传送到备用数据库,在提交事务时不受备用数据库的
影响。可以看出同步方式可更有效地保护数据不丢失,但会对生产数据库的性能有一定影响。
异步方式则对生产数据库的性能影响很小,但会存在一定数据丢失的可能。
Oracle9i第二版提供了三种模式来完成备用数据库的日志传送,通过一些设置选项,使
其可针对不同级别的可用性进行设置。让我们来看看这三种模式的情况,以及哪些模式适用
于我们电信行业的业务系统(见图4)。
图4
·最大保护模式
最大保护模式为主数据库提供最高级别的数据可用性。它保证在主数据库提交的事务可
在备用数据库恢复并可用。当所有的备用数据库都不可用时,主数据库的处理会自动挂起,
保证主数据库和备用数据库之间不会出现不一致。
在以最大保护模式运行时,日志写进程(LGWR)负责将日志记录从主数据库传送到备
用数据库,在没有得到传送数据已在备用数据库可用之前,主数据库的事务不会提交。这会
在某种程度上影响主数据库的性能,但最大程度地保护了数据的一致性。
当主数据库出现故障时,因为所有在主数据库提交的事务都已在备用数据库同步,所以
不会有数据丢失。
·最高可用模式
最高可用模式也为主数据库提供了高级别的保护,同最大保护模式相比,当备用数据库
不可用时,主数据库不会挂起,而是降为最大性能模式。由于主数据库仍在继续运行,主数
据库和备用数据库之间会出现数据不一致的情况。这种模式也是一种同步模式,日志写进程
(LGWR)负责将日志记录从主数据库传送到备用数据库,在没有得到传送数据已在备用数
据库可用之前,主数据库的事务不会提交。
·最大性能模式
最大性能模式是缺省的保护模式,它是一种异步模式。在正常操作过程中,主数据库不
会确认数据是否已经在备用数据库可用,就继续进行本地操作。如果备用数据库出现故障,
主数据库的处理也不会挂起,因此它对主数据库的性能影响很小。
最大保护模式保证了生产数据库和备用数据库的一致性,但带来的问题是,如果备用数
据库或网络出现问题也会造成生产数据库的不可用。因此,建议采用多个备用数据库,只要
有一个备用数据库可以同步数据,生产数据库依然可用。从现有电信行业容灾建设的情况和
业务特点来看最高可用模式和最大性能模式更贴近现状,尤其是最大性能模式对生产数据库
的性能影响很小。
实际使用情况
在这里简单介绍一个某省移动公司帐务系统采用Oracle Data Guard物理备用数据库的
情况(见图5)。
这是一个典型的将Oracle集群数据库RAC和Data Guard相结合的容灾方式。在主数据
库采用四个节点的集群数据库(RAC),数据存放在共享的裸设备上。集群数据库针对服
务器故障提供了保护,并可分担负载,在此基础上,采用异步物理备用数据库来保护数据,
其中日志传送的间隔平均为半个小时,主数据库的数据量在1TB左右。
结束语
"居安思危"这句成语同样适用于我们电信行业核心业务系统的建设,随着电信行业竞争
的加剧,电信运营商在推出各种业务服务用户的同时,如何建设和完善自己内部的核心业务
系统,提供可靠的业务保障,Oracle Data Guard正是针对核心业务系统高可用性的需求,从
数据库角度提出的解决方案。