运维手册_数据库_DataGuard日常运维手册
- 格式:docx
- 大小:31.29 KB
- 文档页数:10
神州数码信息系统有限公司数据库日常运维手册神州数码信息系统有限公司2015/9/5日常运维操作手册主要针对ORACLE数据库管理员对数据库系统做定期监控:(1). 每天对ORACLE数据库的运行状态、日志文件、备份情况、数据库的空间使用情况、系统资源的使用情况进行检查,发现并解决问题。
并要有相关的人员负责每天查看,发现问题及时上报分析。
检查每天的数据库备份完成情况。
(2). 每周对数据库对象的空间扩展情况、数据的增长情况进行监控、对数据库做健康检查、对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze、检查表空间碎片、寻找数据库性能调整的机会、进行数据库性能调整、提出下一步空间管理计划。
对ORACLE数据库状态进行一次全面检查(4)根据公司数据库的安全策略对ORACLE DB进行加固一.日维护过程1.1、确认所有的INSTANCE状态正常登陆到所有数据库或例程,检测ORACLE后台进程:$ps –ef|grep ora1.2、检查文件系统的使用(剩余空间)如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
#df –k1.3、检查日志文件和trace文件记录检查相关的日志文件和trace文件中是否存在错误。
A、连接到每个需管理的系统使用’telnet’命令B、对每个数据库,进入到数据库的bdump目录,unix系统中BDUMP目录通常是$ORACLE_BASE/<SID>/bdump#$ORACLE_BASE/<SID>/bdumpC、使用 Unix ‘tail’命令来查看alert_<SID>.log文件#tail $ORACLE_BASE/<SID>/bdump/alert_<SID>.logD、如果发现任何新的ORA- 错误,记录并解决1.4、检查数据库当日备份的有效性。
对RMAN备份方式:1.5、检查数据文件的状态检查所有数据文件并记录状态不是“online”的数据文件,并做恢复。
数据仓库生产环境操作手册一.运维概述“数据仓库生产系统”的运行维护责任在于保障系统运行,运维方式主要是操作员通过工作机远程登陆到系统中的相关主机,对主机进行操作,包括automation调度系统、数据库、磁盘、软件环境、数据情况等,查看批出理的运行情况,一旦运行出现问题作相应的记录并通知相关的技术人员,作出相应的处理。
所有运维项目成员严格按照《数据仓库系统运维守则.doc》文档来进行运维检查工作,否则出现事故由值班人员和当日值班负责人承担事故责任。
二.运维内容1.每日维护1.1数据检查每日批处理运行前运行完成后都需要对源头的数据和生产出的数据进行检查,确保当日批处理程序正常从事生产。
检查工作在每日9:00-9:30之间完成,且必须在启动程序(批处理程序)前执行。
具体规定如下:1.1.1 转定长数据的检查每天上午9:00--9:45之间,运维值班人员进行这项工作具体执行步骤如下:1.在本地工作机上使用telnet远程登录工具登录到168.7.6.163服务器上,输入用户名sjtq,密码:cib2009edw,2.输入命令cd EDW/sh/log3.输入命令more yyyymmdd当天的日志,是否有错误信息,最后数据是否都上传结束。
4.以下错误属于正常情况:03:00:03 : 1.检查20091031标志文件失败~~~~~~~~~03:00:03 : 1.数据标志检查失败,等待5分钟(06001/dta_varied)正常等待情况5.检查点如下:1)每个大任务开始的初始化操作03:00:00 : ================ 0.环境变量设置完毕================2)数据装载,卸载,上传,整个模块处理结束的情况。
05:41:50 : ================ 2.装载Unl数据完毕================05:41:50 : ---------------- 2.开始装载BAK数据----------------05:41:50 : ================ 2.装载BAK数据完毕================05:41:50 : ---------------- 3.开始卸载fix数据----------------06:26:11 : ================ 3.卸载fix数据完毕================06:26:11 : ---------------- 4.开始向批量数据交换平台送fix数据----------------06001 send ok06001 send ok06002 send ok06002 send ok07002 send ok07002 send ok06027 send ok06027 send ok06:28:56 : ================ 4.向批量数据交换平台送fix数据完毕================06:28:58 : END6.查找是否存在“错误“,”出错“字样。
数据库运维说明书数据库运维说明书1、概述1.1 目的1.2 范围1.3 定义2、数据库环境2.1 硬件要求2.2 软件要求2.3 网络要求3、数据库部署3.1 安装数据库软件3.2 配置数据库参数3.3 创建数据库实例3.4 设置访问权限3.5 数据库初始化3.6 数据库备份与恢复4、数据库运维4.1 监控数据库性能4.2 处理数据库故障4.3 数据库优化4.4 数据库迁移与升级 4.5 实施数据库安全策略4.6 数据库定期维护5、数据库备份与恢复策略 5.1 定义备份策略5.2 备份类型5.3 备份工具5.4 恢复数据库6、数据库性能优化6.1 监控数据库性能指标 6.2 优化查询语句6.3 索引优化6.4 内存与磁盘优化6.5 锁和并发控制7、数据库安全策略7.1 设定访问权限7.2 加密数据传输7.3 数据库审计7.4 定期更新和升级数据库软件7.5 数据备份与灾备8、数据库维护8.1 清理数据库日志8.2 数据库碎片整理8.3 统计信息收集8.4 数据库定期备份与归档8.5 监控和修复数据库文件法律名词及注释:1、数据库:指在计算机中存储、管理和维护电子数据的软件系统。
2、备份:将数据库中的数据和结构复制到另一个存储设备或位置,以防止数据丢失。
3、恢复:从备份中恢复数据库的过程,使数据库回到崩溃或故障之前的状态。
4、性能优化:通过改进数据库设计和调整参数来提高数据库性能。
5、安全策略:制定和实施保护数据库安全的策略和规定。
6、维护:定期检查和保养数据库以确保其正常运行和高效性能。
数据库维护工作手册(总21页) -本页仅作为预览文档封面,使用时请删除本页-数据库维护工作手册文档编号:文档名称:编写:审核:批准:批准日期:目录1概述.................................................................................................. 错误!未定义书签。
2数据库监控....................................................................................... 错误!未定义书签。
数据库监控工作内容....................................................................... 错误!未定义书签。
数据库监控工作步骤....................................................................... 错误!未定义书签。
查看数据库日志....................................................................... 错误!未定义书签。
检查是否有失效的数据库对象............................................... 错误!未定义书签。
查看数据库剩余空间............................................................... 错误!未定义书签。
重点表检查............................................................................... 错误!未定义书签。
查看数据库是否正常............................................................... 错误!未定义书签。
数据库日常运维操作手册日常运维操作手册主要针对ORACLE数据库管理员对数据库系统做定期监控:(1). 每天对ORACLE数据库的运行状态、日志文件、备份情况、数据库的空间使用情况、系统资源的使用情况进行检查,发现并解决问题。
并要有相关的人员负责每天查看,发现问题及时上报分析。
检查每天的数据库备份完成情况。
(2). 每周对数据库对象的空间扩展情况、数据的增长情况进行监控、对数据库做健康检查、对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze、检查表空间碎片、寻找数据库性能调整的机会、进行数据库性能调整、提出下一步空间管理计划。
对ORACLE数据库状态进行一次全面检查(4)根据贵公司数据库的安全策略对ORACLE DB进行加固一.日维护过程1.1、确认所有的INSTANCE状态正常登陆到所有数据库或例程,检测ORACLE后台进程:$ps –ef|grep ora1.2、检查文件系统的使用(剩余空间)如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
#df –k1.3、检查日志文件和trace文件记录检查相关的日志文件和trace文件中是否存在错误。
A、连接到每个需管理的系统使用’telnet’命令B、对每个数据库,进入到数据库的bdump目录,unix系统中BDUMP目录通常是$ORACLE_BASE/<SID>/bdump#$ORACLE_BASE/<SID>/bdumpC、使用Unix ‘tail’命令来查看alert_<SID>.log文件#tail $ORACLE_BASE/<SID>/bdump/alert_<SID>.logD、如果发现任何新的ORA- 错误,记录并解决1.4、检查数据库当日备份的有效性。
对RMAN备份方式:1.5、检查数据文件的状态检查所有数据文件并记录状态不是“online”的数据文件,并做恢复。
数据中心机房运行维护手册一、前言数据中心机房是企业信息化建设的核心基础设施,承担着数据存储、处理、传输等重要任务。
为了确保机房的稳定运行,提高设备的可靠性和可用性,延长设备的使用寿命,保障业务的连续性,特编写本运行维护手册。
二、机房环境要求(一)温度与湿度机房内应保持适宜的温度和湿度。
理想的温度范围通常在 20℃至25℃之间,相对湿度应控制在 40%至 60%之间。
温度过高或过低,湿度过大或过小,都可能影响设备的正常运行。
(二)洁净度机房内应保持清洁,减少灰尘的积聚。
定期清洁地面、机柜、设备表面等,防止灰尘进入设备内部,影响散热和电气性能。
(三)通风与空调系统确保通风系统正常运行,保证机房内空气流通。
空调系统应具备制冷、制热、除湿等功能,并定期进行维护和保养。
三、电力系统维护定期检查 UPS(不间断电源)的工作状态,包括电池电量、充电情况、输出电压等。
按照规定的时间间隔对电池进行充放电测试,及时更换老化的电池。
(二)配电柜检查配电柜内的开关、刀闸、接触器等设备的连接是否紧固,有无发热、打火等异常现象。
定期对配电柜进行清洁,防止灰尘积聚导致短路。
(三)电力线路检查电力线路的绝缘情况,有无破损、老化等问题。
确保线路的敷设符合规范,避免受到外力的破坏。
四、服务器与网络设备维护(一)服务器定期检查服务器的硬件状态,如 CPU、内存、硬盘等的工作情况。
安装系统补丁和更新软件,进行病毒查杀和防火墙设置,保障服务器的安全性。
(二)网络设备对路由器、交换机等网络设备进行配置备份,检查端口状态、流量情况。
及时清理设备的缓存,升级设备的固件。
五、存储设备维护定期检查磁带库的机械部件,如磁带驱动器、机械手等的工作情况。
对磁带进行定期的读写测试,确保数据的可恢复性。
(二)磁盘阵列监控磁盘阵列的磁盘状态,及时发现并更换故障磁盘。
优化阵列的配置,提高存储性能和数据安全性。
六、安全管理(一)门禁系统确保门禁系统正常运行,只有授权人员能够进入机房。
文档类型:系统运行维护手册XXXX局XXXX平台项目运行维护手册第1页/总11页1.手册说明本手册为XXXXXXXX平台运行维护手册,目前维护方式为当前实际硬件环境。
系统地址(截止目前)为:XXXXXX2.维护操作XXXXXXXX平台在试运行阶段因断电、网络中断等不可预测原因情况下出现系统停止、甚至崩溃的情况;总集方数据环境出现异常,无法获取实时数据导致等原因出现无法查看相应产品的情况,可如下处理。
主要处理原则如下:(1)如出现系统无法访问,请参照“网络访问异常的处理”一节进行处理(2)如出现产品缺失,请先参照“XXXXX数据环境异常造成缺图的处理”进行处理;如仍未解决,请先按照“定常产品调用子系统异常的处理”和“定时出图服务出现异常的处理”进行处理,再按照“XXXXX数据环境异常造成缺图的处理”进行补图。
2.1.XXXXX数据环境异常或其他原因造成的处理先打开IE浏览器,输入地址:XXXXXXXXXX若能成功打开如下图所示:则说明后台服务正常运行。
请按下面方式进行补图;若不能正常打开,请参考“XXXX子系统异常的处理”重新启动后台服务。
图2-1后台定时出图管理界面能够正常打开之后,按照以下步骤进行处理:第2页/总11页(1)登陆BS系统打开后台XXXXXXXXX如下图:图2-2补图处理界面(2)本窗口共分为“默认时间规则”,“自定义时间段规则”和“补数据”三个模块。
(3)XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXx2.2.XXXXXX子系统异常的处理定常产品调用子系统异常多由于网络异常、操作系统异常等原因,主要恢复操作方式如下:步骤1:在桌面上打开XSehll软件(),界面如下图所示。
选择daopian,点击Connect。
如提示输入密码:输入super即可。
(或关掉sessions窗口,直接输入ssh ***********.31.107,回车后输入密码super 来替代第一步)。
数据仓库生产环境操作手册一.运维概述“数据仓库生产系统”的运行维护责任在于保障系统运行,运维方式主要是操作员通过工作机远程登陆到系统中的相关主机,对主机进行操作,包括automation调度系统、数据库、磁盘、软件环境、数据情况等,查看批出理的运行情况,一旦运行出现问题作相应的记录并通知相关的技术人员,作出相应的处理。
所有运维项目成员严格按照《数据仓库系统运维守则.doc》文档来进行运维检查工作,否则出现事故由值班人员和当日值班负责人承担事故责任。
二.运维内容1.每日维护1.1数据检查每日批处理运行前运行完成后都需要对源头的数据和生产出的数据进行检查,确保当日批处理程序正常从事生产。
检查工作在每日9:00-9:30之间完成,且必须在启动程序(批处理程序)前执行。
具体规定如下:1.1.1 转定长数据的检查每天上午9:00--9:45之间,运维值班人员进行这项工作具体执行步骤如下:1.在本地工作机上使用telnet远程登录工具登录到168.7.6.163服务器上,输入用户名sjtq,密码:cib2009edw,2.输入命令 cd EDW/sh/log3.输入命令 more yyyymmdd当天的日志,是否有错误信息,最后数据是否都上传结束。
4.以下错误属于正常情况:03:00:03 : 1.检查20091031标志文件失败~~~~~~~~~03:00:03 : 1.数据标志检查失败,等待5分钟(06001/dta_varied)正常等待情况5.检查点如下:1)每个大任务开始的初始化操作03:00:00 : ================ 0.环境变量设置完毕 ================ 2)数据装载,卸载,上传,整个模块处理结束的情况。
05:41:50 : ================ 2.装载Unl数据完毕 ================05:41:50 : ---------------- 2.开始装载BAK数据----------------05:41:50 : ================ 2.装载BAK数据完毕 ================05:41:50 : ---------------- 3.开始卸载fix数据----------------06:26:11 : ================ 3.卸载fix数据完毕================06:26:11 : ---------------- 4.开始向批量数据交换平台送fix数据----------------06001 send ok06001 send ok06002 send ok06002 send ok07002 send ok07002 send ok06027 send ok06027 send ok06:28:56 : ================ 4.向批量数据交换平台送fix数据完毕================06:28:58 : END6.查找是否存在“错误“,”出错“字样。
正确的开关机顺序是:启动的时候,先备库的listener,再启动备库,再启动主库的listener,再启动主库。
关闭的时候,先关闭主库,再关闭备库。
--为主数据库或备用数据库添加/删除日志组SQL> alter database add standby logfile group 5 '/oracle/oradata/orcl/standbyredo05.log' size 100M;SQL> alter database drop standby logfile group 5;--查询DataGuard当前处于哪种日志传输方式:SQL> select process,client_process,sequence#,status from v$managed_standby;PROCESS列显示进程信息CLIENT_PROCESS列显示对应的主数据库中的进程SEQUENCE#列显示归档redo的序列号STATUS列显示的进程状态--查询standby库中所有已被应用的归档文件信息(不论该归档文件是否还存在)SQL> select first_time,first_change#,next_change#,sequence# from v$log_history;--最后一个被应用的logSQL> SELECT THREAD#, MAX(SEQUENCE#) AS "LAST_APPLIED_LOG" FROM V$LOG_HISTORY GROUP BY THREAD#;--在primary server上查询有哪些日志没有被传输到StandbySQL> SELECT LOCAL.THREAD#, LOCAL.SEQUENCE# FROM (SELECT THREAD#, SEQUENCE# FROM V$ARCHIVED_LOG WHERE DEST_ID=1) LOCAL WHERE LOCAL.SEQUENCE# NOT IN(SELECT SEQUENCE# FROM V$ARCHIVED_LOG WHERE DEST_ID=2 AND THREAD# = LOCAL.THREAD#);--对于troubleshooting有用SQL> SELECT MESSAGE FROM V$DATAGUARD_STATUS;m.监控恢复操作的进程SELECT ARCHIVED_THREAD#, ARCHIVED_SEQ#, APPLIED_THREAD#, APPLIED_SEQ# FROM V$ARCHIVE_DEST_STA TUS;--从正在恢复状态只读打开;SQL> Alter DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;SQL> Alter DATABASE OPEN READ ONL Y;--切换回到恢复状态;SQL> Alter DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;切换角色注意:Swithover时只能先从Primary切到Standby,再从Standby切到Primary.1、在主库端select database_role,switchover_status from v$database;如果是to standby 表可以正常切换.直接执行ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY;否则执行: ALTER DA TABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY WITH SESSION SHUTDOWN;SQL> shutdown immediate;SQL> startup nomount;SQL> alter database mount standby database;SQL> select database_role from v$database;SQL> alter database recover managed standby database disconnect from session;2、在备库端select database_role,switchover_status from v$database;如果是to_primary 表可以正常切换.执行:ALTER DA TABASE COMMIT TO SWITCHOVER TO PRIMARY;否则执行: ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY WITH SESSION SHUTDOWN;shutdown immediate;startup;然后观察主备库日志,如果正常的话会看到备库会自动应用日志.failover测试1. 备库上检查是否存在归档中断SQL> SELECT THREAD#, LOW_SEQUENCE#, HIGH_SEQUENCE# FROM V$ARCHIVE_GAP;2. 在主库上执行语句并找出归档文件SQL> SELECT NAME FROM V$ARCHIVED_LOG WHERE THREAD#=1 AND DEST_ID=1 AND SEQUENCE# BETWEEN XX AND XX;--如果存在拷贝相应的归档到STANDBY数据库,并注册.SQL> ALTER DATABASE REGISTER PHYSICAL LOGFILE 'xxx';***其他情况(primary数据库无法打开):--检查归档文件是否完整分别在primary/standby执行下列语句:SQL> select distinct thread#,max(sequence#) over(partition by thread#) a from v$archived_log;把相差的归档复制到待转换的standby服务器3. 启动failoverSQL> alter database recover managed standby database finish force;FORCE关键字将会停止当前活动的RFS进程,以便立刻执行failover。
数据库使用说明及维护手册数据库是一种用来存储和管理数据的系统,它在当今信息化时代具有重要的作用。
本文将为您提供数据库的使用说明及维护手册,旨在帮助您掌握数据库的基本操作和常见问题的解决方法。
一、数据库基础知识在开始使用数据库之前,我们首先需要了解一些基础知识。
数据库可以分为关系型数据库和非关系型数据库两种类型,其中关系型数据库是最常见的类型,它通过表格的形式存储和管理数据。
而非关系型数据库则以文档、键值对等方式存储数据。
二、数据库的安装和配置1. 安装数据库软件:根据您的需求选择适合的数据库软件,并按照安装向导进行安装。
2. 配置数据库:安装完成后,您需要进行一些基本的配置,包括设置数据库的存储路径、监听端口等。
三、数据库的使用1. 数据库的连接:首先,您需要使用数据库客户端连接到数据库。
在连接过程中,需要输入正确的数据库地址、端口号、用户名和密码等信息。
2. 创建数据库:连接成功后,您可以创建新的数据库。
在创建数据库时,需要设置数据库的名称和字符集等参数。
3. 创建数据表:数据库中的数据是以表格的形式组织和存储的,您需要创建数据表来存储具体的数据。
在创建数据表时,需要定义表的字段和字段类型等信息。
4. 插入数据:一旦数据表创建完成,您可以通过执行插入语句将数据插入表中。
插入语句的语法类似于"INSERT INTO 表名 (字段1, 字段2, ...) VALUES (值1, 值2, ...)"。
5. 查询数据:查询是数据库中常用的操作之一,您可以使用SQL语句来查询满足条件的数据。
查询语句的语法类似于"SELECT *FROM 表名 WHERE 条件"。
6. 更新和删除数据:如果需要更新或删除数据库中的数据,可以使用UPDATE和DELETE语句实现。
更新语句的语法为"UPDATE 表名SET 字段=新值 WHERE 条件",删除语句的语法为"DELETE FROM 表名 WHERE 条件"。
运维工作手册一、运维概述运维(Operations and Maintenance)是指对IT系统进行日常的维护、管理和监控工作。
运维工作旨在确保系统的稳定性、安全性和高效性,为业务的持续运行提供支持。
二、运维工作内容1. 硬件设备维护:包括服务器、网络设备、存储设备等硬件设备的巡检、维护和故障处理。
2. 系统软件维护:包括操作系统、数据库、中间件等软件的安装、配置、升级和补丁管理。
3. 网络管理:包括网络拓扑设计、网络设备配置、网络安全管理等工作。
4. 安全管理:包括系统安全策略的制定、安全漏洞的修复、安全事件的响应等工作。
5. 性能优化:包括系统性能监控、性能调优、容量规划等工作。
6. 应用部署:包括新应用的部署、配置、监控和故障排除。
7. 数据备份与恢复:包括数据备份策略的制定、备份任务的管理、数据恢复的测试等工作。
三、运维工作流程1. 问题报告:用户或监控系统发现问题后,向运维团队提交问题报告。
2. 问题诊断:运维人员对问题进行诊断,确定问题的原因和影响范围。
3. 问题处理:运维人员根据问题的严重程度和影响范围,采取相应的处理措施。
4. 问题跟踪:运维人员对问题的处理过程进行跟踪和记录,直到问题完全解决。
5. 问题总结:对于重要的问题,运维团队进行问题总结,分析问题的原因和解决方案,以避免类似问题再次发生。
四、运维工作规范1. 服务水平协议(SLA):运维团队与业务部门签订SLA,明确各项服务的响应时间、解决时间等指标。
2. 变更管理:对系统的变更进行严格管理,确保变更的安全性和稳定性。
3. 故障排除:建立完善的故障排除流程,快速定位和解决故障。
4. 安全审计:定期进行安全审计,发现潜在的安全风险并及时处理。
5. 文档管理:对系统的配置、日常维护等工作进行详细的文档记录,确保工作的可追溯性和可复制性。
五、运维工作技能要求1. 熟练掌握操作系统(Linux/Windows)的安装、配置和故障排除技能。
数据库维护手册范本1. 引言数据库是现代信息系统的核心组成部分,负责存储和管理大量的数据。
为了保证数据库的稳定运行和高效性能,数据库维护工作显得尤为重要。
本手册将介绍一些常见的数据库维护任务和技巧,以帮助管理员更好地管理和维护数据库系统。
2. 数据库备份2.1 定期备份定期备份是数据库维护的首要任务之一,它能够保证数据的安全性和可靠性。
管理员应该根据实际情况设置备份策略,包括备份频率、备份方式以及备份存储位置等。
常见的备份方式包括完全备份和增量备份,管理员需要根据数据库的大小和重要性来选择适当的备份方式。
2.2 恢复测试备份的有效性需要经过恢复测试来验证。
管理员应定期进行恢复测试,以确保备份文件的完整性和可用性。
在恢复测试过程中,需要检查数据库是否能够正常恢复,并验证数据的完整性和一致性。
3. 数据库性能优化3.1 索引优化索引是提升数据库查询性能的重要手段之一。
管理员应当定期评估和优化索引,包括删除无用的索引、添加缺失的索引以及调整现有索引的定义等。
同时,需要注意索引的维护对数据库性能的影响,避免过多的索引导致性能下降。
3.2 查询优化数据库查询是常见的操作,也是性能瓶颈的来源之一。
管理员应该关注数据库查询的性能,并根据实际情况对查询进行优化。
常见的查询优化方法包括合理使用查询语句、避免全表扫描、使用合适的连接方式以及避免在查询中使用函数等。
4. 安全管理4.1 数据库权限合理的数据库权限管理可以确保数据库的数据安全。
管理员应该根据实际需求设置用户的权限,避免用户越权操作。
同时,对于敏感数据需要进行额外的访问控制,以防止数据泄露。
4.2 审计日志审计日志是对数据库操作的记录和分析,可以帮助管理员追踪和监控数据库的安全性。
管理员应该启用数据库的审计功能,并定期检查和分析审计日志,发现和处理潜在的安全问题。
5. 故障恢复5.1 故障诊断故障诊断是数据库维护中不可或缺的一环。
管理员需要掌握一些常见的故障诊断方法,如查看数据库日志、使用系统监控工具等,以快速发现和解决故障。
大数据系统运维手册范本第一章:概述1.1 引言本手册是针对大数据系统运维工作而编写的指南,旨在提供详细的操作流程和技术要点,以确保大数据系统的正常运行和高效维护。
通过本手册,运维人员能够了解到关键的运维任务和注意事项,提高工作效率,保障系统稳定性。
1.2 大数据系统概述大数据系统是指基于大数据技术构建的数据处理和分析系统,它能够处理和存储海量的结构化和非结构化数据,并从中获取有价值的信息和洞察。
大数据系统的核心组件包括分布式文件系统、分布式数据库、数据采集与清洗工具、数据处理与分析框架等。
第二章:系统运行环境2.1 硬件环境要求大数据系统对硬件环境有一定的要求,运维人员需要根据实际情况为大数据系统提供合适的硬件配置,包括服务器、存储设备、网络设备等。
具体的硬件环境要求将根据系统规模和业务需求而变化,运维人员应根据厂商提供的技术文档进行配置。
2.2 软件环境要求大数据系统运行所需的软件环境包括操作系统、数据库、中间件等。
不同的大数据系统可能对软件环境有不同的要求,运维人员需要根据系统需求选择合适的软件版本,并按照厂商提供的安装指南进行操作。
第三章:系统安装与配置3.1 安装前的准备工作在进行大数据系统的安装之前,需要进行一系列的准备工作,包括网络设置、用户权限配置、软件包下载等。
运维人员应根据安装指南逐步完成这些准备工作,确保系统安装的顺利进行。
3.2 系统组件的安装与配置大数据系统由多个组件组成,每个组件都有自己的安装和配置过程。
运维人员需要按照安装指南,依次完成各个组件的安装和配置工作,包括安装软件包、配置参数、启动服务等。
第四章:系统监控与维护4.1 系统监控大数据系统的监控是保障系统稳定运行的重要手段。
通过监控系统的关键指标,运维人员能够及时发现系统异常和瓶颈,采取相应的措施进行调整和优化。
本节内容将介绍常用的监控工具和监控指标,并详细说明如何配置监控系统。
4.2 故障排除与日志分析运维人员在系统运行过程中,可能会遇到各种故障和问题。
数据库部署运维手册一、引言数据库是现代信息系统的核心组成部分之一,它的部署和运维对于保障系统的正常运行至关重要。
本手册旨在详细介绍数据库的部署和运维流程,以帮助管理员有效管理和维护数据库系统。
二、数据库部署1. 服务器规划在进行数据库部署之前,需要对服务器进行规划。
确定服务器的硬件配置、操作系统以及网络环境,以满足数据库系统的需求。
2. 数据库选择根据实际需求选择合适的数据库软件,例如MySQL、Oracle等。
考虑到系统的性能、安全性和可扩展性等方面的要求,做出明智的选择。
3. 安装数据库软件按照数据库软件提供的安装步骤,进行软件的安装。
确保遵循安全规范,设置强密码并限制数据库的访问权限。
4. 数据库初始化和配置完成数据库安装后,进行必要的初始化和配置工作。
包括创建管理员账户、设置字符集、指定存储路径等。
5. 数据库备份策略制定合理的数据备份策略,确保数据的安全性和可恢复性。
包括全量备份和增量备份,同时要定期检查备份文件的完整性。
三、数据库运维1. 安全管理为了保障数据库的安全,需要定期检查和修复潜在的安全漏洞。
包括加强用户管理、设置访问权限、使用防火墙等。
2. 性能优化优化数据库的性能是运维工作中的重要一环。
可以通过监控数据库的运行状态、调整系统参数、优化查询语句等手段来提升数据库的性能。
3. 故障处理及时响应并解决数据库故障是运维工作的关键之一。
建立故障响应机制,监测数据库的运行状态,预测可能出现的故障,并建立相应的应急处理方案。
4. 日志管理数据库的日志记录是进行故障排查和审计的重要依据。
要定期清理和归档日志文件,确保日志记录的完整性和可读性。
四、数据库监控1. 监控指标选择选择合适的监控指标来评估数据库的性能和稳定性。
包括CPU使用率、内存利用率、磁盘空间等。
2. 监控工具选择适合的监控工具,如Zabbix、Nagios等,进行数据库的实时监控。
配置告警机制,及时发现并解决潜在的问题。
数据库维护手册随着互联网的快速发展,数据越来越成为企业的核心资产。
数据库作为数据的重要存储和管理工具,扮演着至关重要的角色。
采用适当的数据库系统,并且定期进行维护和管理能够确保数据库的稳定性、安全性和高效性。
本文将介绍数据库维护手册,以便管理人员更好地维护和管理数据库。
一、备份数据库在管理数据库时,备份是非常重要的一项工作。
备份数据库能够保护数据免受意外删除、病毒攻击、硬件故障等损失。
建议做好以下备份:1.完全备份:包含所有数据和数据库对象。
这种备份应该定期进行,如每天或每周。
2.增量备份:这种备份只包含自上次备份以来更改的数据。
建议每天至少进行一次增量备份。
3.差异备份:与增量备份类似,差异备份仅包含自上次备份以来更改的数据。
但是与增量备份不同的是,差异备份只包含自上次完全备份以来的更改。
备份通常包括完整物理备份和逻辑备份。
完整物理备份备份整个数据库,包括数据文件和日志文件,而逻辑备份仅备份逻辑数据和表。
需要注意的是,还应该保留一份离线备份,存储在不同的地点,而且需要定期检查备份是否完整和正常工作。
二、定期维护数据库数据库需要根据其使用情况定期维护。
以下是一些常见的维护任务:1.索引重建:索引需要定期重建以优化查询性能。
2.清除临时表空间:临时表空间的不经常使用的数据可以定期清除以释放空间。
3.删除不必要的对象:删除已完成的对象,例如过时的表和视图等。
4.修复和重建数据库:需要定期检查数据库中的坏块和分散数据。
如果发现坏块,则需要修复为可读状态的数据块,如果出现分散数据,需要定期重建数据库以优化性能。
三、监控数据库活动监视数据库活动对于管理数据库至关重要。
管理人员应该定期监控以下活动:1.查询活动:识别可能影响数据库性能的查询。
这将有助于确定哪些查询需要优化或重新编写。
2.空间使用情况:了解数据库的空间使用情况,以便及时进行空间管理。
3.错误和异常:监控数据库错误和异常,及时做出相应的响应。
四、数据库安全数据库安全是数据库维护的一个基本组成部分。
数据库维护处事脚册之阳早格格创做文档编号:文档称呼:编写:审核:批准: 接受日期:目录1概括22数据库监控3数据库监控处事真质3数据库监控处事步调3查看数据库日志3查看是可有做废的数据库对付象5查看数据库结余空间6沉面表查看6查看数据库是可寻常7死锁查看7监控SQL语句的真止7支配系统级查看8其余83数据库维护9数据库维护处事真质9数据库维护处事事项9页里建复9数据库对付象沉建9碎片回支(数据沉组)9简略不必的数据10备份回复10履历数据迁移11定期建改暗号11简略掉不需要的用户11其余124数据库管制时常使用SQL足本125凡是维护战问题管制23脚法23例止处事提议23相关挖表证明241概括数据库的凡是监控是使管制员即时相识系统非常十分的脚法.大部分情况下,系统经常寻常运止的.惟有对付寻常情况的充分相识,才搞通过对付比寻常情况创制非常十分情况.对付于数据库的凡是监控要有记录,笔墨记录大概者电子文档保存.对付于数据库非常十分举止分解,提出办理规划.凡是处事包罗监控战维护二个部分.此文档中关于数据库的运止下令示例主要针对付于ORACLE数据库,但是对付于SYBASE数据库共样有参照价格,只消换用相对付应的语句即可.数据库监控2数据库监控数据库监控处事真质制定战矫正监控规划,编写监控足本.对付于数据库举止凡是监测,提接记录.根据监测截止举止分解、预测,提接相映的系统矫正提议规划.数据库监控处事步调2.1.1查看数据库日志数据库的日志上会有洪量对付于管制员有用的疑息.ORACLE的Alert日志记录了数据库系统所报的系统级过得疑息,以及数据块做废等宽沉过得疑息.过得疑息的爆收,会爆收相映的逃踪文献,通过查看告诫日志战逃踪文献可查找过得本果,对付于创制的问题应即时办理战报告.如:1.表空间是可谦,是可需要举止增加大概者扩展.Alert文献中会隐现有表块无法扩展的提示.2.表的块大概者页里是可益坏.(往往那时alert文献中会隐现ora-600的过得.)3.数据库是可举止了非常十分支配.(如:droptablespace等等).真用下令:·报警日志文献(alert.log大概alrt<SID>.ora)记录数据库开用,关关战一些要害的堕落疑息.数据库管制员该当时常查看那个文献,并对付出现的问题做出纵然的反应.不妨通过以下SQL 找到他的路径select value from v$parameter where upper(name) ='BACKGROUND_DUMP_DEST',大概通过参数文献赢得其路径,大概者show parameter BACKGROUND_DUMP_DEST.·背景逃踪文献路径与报警文献路径普遍,记录了系统背景进程堕落时写进的疑息.·用户逃踪文献记录了用户进程堕落时写进的疑息,普遍不可能读懂,不妨通过ORACLE的TKPROF工具转移为不妨读懂的圆法.用户逃踪文献的路径,您不妨通过以下SQL找到他的路径select value from v$parameter where upper(name) ='USER_DUMP_DEST',大概通过参数文献赢得其路径,大概者show parameter USER_DUMP_DEST.不妨通过树立用户逃踪大概dump下令去爆收用户逃踪文献,普遍正在调试、劣化、系统分解中有很大的效用.可正在参数文献种用SQL_TRACE=TRUE挨开该文献(对付所有用户),也可用alter session set sql_trace=true挨开目前会话,也可用execute dbms_system.set_sql_trace_in_session(sid,serial#,true)挨开指定会话.2.1.2查看是可有做废的数据库对付象主要关注索引,触收器,保存历程,函数等等.如:查找user_objects数据字典,瞅其中是可有状态为invalid的对付象.推断做废本果(如:视图做废的本果有大概是由于创制视图的基表被简略等等),找出本果可举止对付象沉建大概建复.真用下令:Select object_name,object_typeFrom user_objectsWhere object_type=’INV ALID’;2.1.3查看数据库结余空间1.结余空间缺累时要扩展空间,普遍的,当结余空间小于10%时,要举止空间扩展.对付于ORACLE数据库,通过查找TABLESPACES相关的数据字典不妨瞅到有用的疑息.2.查看数据赶快删少的表,通过对付于DBA_SEGMENTS数据字典的监视不妨找到,当过快删万古,协做开垦人员,决定办理规划.2.1.4沉面表查看1.查看系统核心接易表.果为那些表健壮与可与凡是接易的寻常运止稀切相关.沉面查看那些表的索引是可做废,表的统计疑息是可即时革新,如:当那些表举止了大的数据拆载大概者简略支配之后.准则上需要查看所有的表,不过由于上头那些表更关键,提议管制员给以更多的关注.2.沉面查看数据量超出百万止的表,各天的情况大概纷歧样,当数据超出百万止之后,如果索引做废会引导表扫描,占用洪量系统IO,宽沉效用系统本能.2.1.5查看数据库是可寻常包罗数据库真例是可寻常处事、listener是可处事寻常,保证数据库系统环境寻常.数据库对接是可寻常、查看是可有超出寻常火仄的对接数.如:寻常500个,某天下午忽然达到600个.应记录那种非常十分情况.分解爆收那种情况的本果,如:正在矮版本的ORACLE中,很大概是一些其余非常十分的应用堕落后爆收的死对接.2.1.6死锁查看监控数据库运止历程中,出现的阻塞,记录局里,记录爆收阻塞的SQL语句,真止的用户,爆收时间,频次,处理(杀掉、等待自然解锁等).ORACLE版本中的死锁会正在alert文献中爆收记录,oracle会自动解锁(本去是采用一个杀掉).对付于死锁的处理历程要举止记录.不妨使用OEM工具大概者查找相关的V$视图去确认爆收阻塞的语句.2.1.7监控SQL语句的真止查找效用矮下的SQL语句,通联协做开垦人员,举止相关处理.可使用ORACLE提供的AWR举止,也可使用ORACLE提供的OEM工具真止,大概者自止体例的足本等等.2.1.8支配系统级查看运止vmstat,sar,topas(AIX系统),glance(HP系统)等下令查看CPU、内存、假制内存等的使用情况.运止df,du,iostat查看磁盘使用情况运止netstat查看搜集情况运止脚工体例的监控足本查看.针对付于支配系统的分歧,使用的下令也会有分歧,请参照相映的支配系统文档.提议使用man下令瞅察相映的助闲疑息.2.1.9其余每天查看早间定时真止的数据库疑息支集做业战备份做业的日志输出,确认皆已寻常完毕.往往不克不迭寻常完毕是由于如下的本果:请确认足本是可变动(过得的建变革成等等),设备(主机,磁盘阵列,磁戴库,搜集等等)是可寻常,空间是可足够等等.提议每天按接易峰值情况,对付数据库本能数据举止定时支集及分解.3数据库维护数据库维护处事真质包罗维护、障碍诊疗、过得建复、备份回复、履历数据迁移等历程.数据库维护处事事项3.1.1页里建复根据凡是监控的截止,举止页里(大概者数据库坏块)建复,如将表数据导出后沉建表,而后导进数据.提接建复记录.3.1.2数据库对付象沉建根据数据库监控的截止,沉建做废的对付象.如:索引、保存历程、函数、视图、触收器等等.真用下令:Alter index <索引名> rebuild [online];3.1.3碎片回支(数据沉组)当某些数据库运止一段时间后,表会爆收碎片,效用数据库的本能.可根据凡是查看的截止,使用功具大概足本对付于数据库空间举止沉组大概回支.由于ORACLE数据库自己的本果,正在举止了DELETE支配之后也不会使HWM (High Water Mark下火位线)落矮,果此不会释搁所占用的空间,所以提议正在举止了数据迁移之后将齐库举止EXP,而后举止IMP支配,以释搁占用的空间.3.1.4简略不必的数据此项处事要得到开垦圆、安排人员、以及相关人员的确认后,圆可真止.3.1.5备份回复需要定期对付于数据库备份举止灵验性检测,定期举止数据回复的演练支配.以预防万一的数据库事变时准备缺累.数据库需要采与正在线的热备份,不需要关关数据库举止,正在备份的共时不妨举止寻常的数据库的百般支配,谦足了7*24的系统的需要.数据库的备份不克不迭效用用户对付数据库的考察.目标需要正在线热备份多级删量备份并止备份,回复减小所需要备份量备份,回复使用简朴可参照如下的规划:1.每月搞一个数据库的齐备份(包罗只读表空间)2.每星期搞一次整级备份(不包罗只读表空间)3.每个星期三搞一次一级备份4.每天搞一个二级备份5.所有表空间改成只读状态后搞一个该表空间的备份.6.当需要时(如四个小时归档文献系统便要靠近谦了)备份归档文献.3.1.6履历数据迁移定期举止履历数据迁移,缩小死产数据库的压力.3.1.7定期建改暗号包罗SYS,SYSTEM等用户.3.1.8简略掉不需要的用户对付于系统拆置时的演示用户,如:hr,scott等.提议每周定期浑理战备份一周所爆收的Alert日志、逃踪文献战dump文献.分别位于$ORACLE_BASE/admin/$ORACLE_SID/bdump, $ORACLE_BASE/admin/$ORACLE_SID/udump, $ORACLE_BASE/admin/$ORACLE_SID/cdump,等目录下.定期对付表举止统计分解,(如可使用analyze等下令,8i 以上有dbms_stats包去真止,使SQL劣化器经常能找到最佳的查询战术.制定战真止记录包管死产库的仄安:应千万于克制正在死产库上举止开垦、尝试.3.1.9其余针对付分歧的数据库版本的分歧特性举止相映的维护支配.简直情况请拜睹ORACLE文档大概者考察metalink.4数据库管制时常使用SQL足本时常使用的SQL足本,正在真施时可供数据库管制员参照,正在真止时,需要举止相映的建改.1.结余空间查看SELECT tablespace_name, sum ( blocks ) as free_blk , trunc ( sum ( bytes ) /(1024*1024) ) as free_m, max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunksFROM dba_free_spaceGROUP BY tablespace_name2.表空间数据量情况隐现SELECT tablespace_name, max_blocks, count_blocks, sum_free_blocks, to_char(100*sum_free_blocks/sum_alloc_blocks, '99.99') || '%' AS pct_freeFROM ( SELECT tablespace_name, sum(blocks) AS sum_alloc_blocksFROM dba_data_filesGROUP BY tablespace_name), ( SELECT tablespace_name AS fs_ts_name, max(blocks) AS max_blocks, count(blocks) AS count_blocks, sum(blocks) AS sum_free_blocksFROM dba_free_spaceGROUP BY tablespace_name )WHERE tablespace_name = fs_ts_name3.表战索引分解BEGINdbms_utility.analyze_schema ( '&OWNER', 'ESTIMATE', NULL, 5 ) ;END ;4.查看空间情况FROM all_tables a,( SELECT tablespace_name, max(bytes) as big_chunkFROM dba_free_spaceGROUP BY tablespace_name ) f5.查看已经存留的空间扩展FROM dba_tablespaces dt, dba_extents dxs AND dx.owner = '&OWNER'6.查看不主键的表SELECT table_nameFROM all_tablesWHERE owner = '&OWNER'MINUSSELECT table_nameFROM all_constraintsWHERE owner = '&&OWNER'AND constraint_type = 'P'7.查看做废的主键SELECT owner, constraint_name, table_name, statusFROM all_constraintsWHERE owner = '&OWNER' AND status = 'DISABLED’ AND constraint_type = 'P'8.沉建索引,简直参数请根据本质情况举止建改SELECT 'alter index ' || index_name || ' rebuild ', 'tablespace INDEXES storage ( initial 256 K next 256 K ) ; ' FROM all_indexesWHERE ( tablespace_name != 'INDEXES'OR next_extent != ( 256 * 1024 ))AND owner = '&OWNER'9.对付比二个真例的分歧SELECT object_name, object_typeFROM user_objectsMINUSSELECT object_name, object_typeFROM user_objects@&my_db_link10.查看动向本能视图Select * from V$FIXED_TABLE11.查看拘束select a.constraint_name, a.constraint_type,a.*from user_constraints awhere table_name='table_name';select constraint_name, column_namefrom user_cons_columnswhere table_name='table_name';12.查看索引user_indexes包罗索引的名字,user_ind_columns包罗索引的列.13.查看数据库开用参数:show parameter para,v$parameter提供目前会话疑息,v$system_parameter提供目前系统疑息.其中isses_modifiable,issys_modifiable表示是可允许动向建改.14.查看进程号:select p.spid, ernamefrom v$process p, v$session swhere p.addr=s.paddr;15.查看数据文献:select name, statusfrom v$datafile;select *from dba_data_files;16.查看数据文献状态from v$datafile d, v$datafile_header hwhere d.file#=h.file#;17.查看统制文献select namefrom v$controlfile;select type, record_size, records_total, records_used from v$controlfile_record_sectionwhere type=’DATAFILE’;18.查看是可归档模式:archive log listselect name, log_modefrom v$database;select archiverfrom v$instance;19.查看日志组:select groups, current_group#, sequence#from v$thread;select group#, sequence#, bytes, members, status from v$log;select *from v$logfile;其中status为空表示寻常.20.查看large poolselect *from v$sgastatwhere pool=’large pool’;21.查看归档位子show parameter archiveselect destination, binding, target, status from v$archive_dest;22.查看归档进程select *from v$archive_processes;23.查看正正在备份的数据文献select *from v$backup;24.查看需要回复的文献select *from v$recover_file;25.查看所有归档日志文献select *from v$archived_log;26.查看回复时要用到的日志文献select *from v$recovery_log;27.查看SGA的结构Show sga;select *from v$sgastat;28.提与library cache的掷中率select gethitratiofrom v$librarycachewhere namespace=’…’;29.查看正正在运止的SQL语句select sql_text, users_executing, executions, loadsfrom v$sqlarea;select *from v$sqltextwhere sql_text=’select * from emp%’;30.查看library cache reload情况:select sum(pins) “Executions”, sum(reloads) “cache Misses”, sum(reloads)/sum(pins)from v$librarycache;31.查看大藏名块select sql_text from v$sqlareawhere command_type=47and length(sql_text)>500;32.查看目前会话的UGA区select sum(value)||’bytes’ “Total session memory”from v$mystat, v$statnamewhere name=’session uga memory’and v$mystat.statistic#=v$statname.statistic#;33.查看所有MTS用户的UGA区:select sum(value)||’bytes’ “Total session memory”from v$sesstat, v$statnamewhere name=’session uga memory’and v$sesstat.statistic#=v$statname.statistic#;34.查看所有用户使用的最大的UGA区:select sum(value)||’bytes’ “Total session memory”from v$sesstat, v$statnamewhere name=’session uga memory max’and v$sesstat.statistic#=v$statname.statistic#;35.查看high-water mark以下的块数select table_name, blocksfrom dba_tableswhere table_name=’table_name’;36.查看会话的I/O:from v$sess_io io, v$session swhere s.audsid=USERENV(‘SESSIONID’)and io.sid=s.sid;37.查看Buffer pool的掷中率select name, 1-(physical_reads/(db_block_gets+consistent_gets)) “HIT_RATIO”from sys.v$buffer_pool_statisticswhere db_block_gets+consistent_gets>0;38.查看free list的比赛select class, count, timefrom v$waitstatwhere class=’segment header’;select event, total_waitsfrom v$system_eventwhere event=’buffer busy waits’;buffer busy waits可正在二种情况爆收:1dirty queue已谦,2free list比赛.39.查看free list比赛爆收正在哪个segment上select s.segment_name, s.segment_type, s.freelists, w.wait_time, from dba_segments s, v$session_wait wwhere w.event=’buffer busy waits’and w.p2=s.header_block;40.查看齐表扫描爆收的次数select name, valuefrom v$sysstatwhere name like ‘%table scan%’;41.查看大支配的真止情况select sid, serial#, opname,to_char(start_time, ‘HH24:MI:SS’) as start_t,(sofar/totalwork)*100 as percent_completefrom v$session_longops;42.查看数据文献的I/Ofrom v$datafile d, v$filestat fwhere d.file#=f.file# order by ;43.查看空闲块数少于10%的segment(blocks正在high-watermark以下,empty_blocks其上)select owner, table_name, blocks, empty_blocksfrom dba_tableswhere empty_blocks/(blocks+empty_blocks)<0.1and blocks+empty_blocks!=0;44.查看migration战chaininganalyze table table_name compute statistics;select num_rows, chain_cntfrom dba_tableswhere table_name=’table_name’;45.查看表的统计疑息analyze table table_name compute statistics;select num_rows, blocks, empty_blocks as empty, avg_space, chain_cnt, avg_row_lenfrom dba_tableswhere ow ner=’HR’ andtable_name=’table_name’;46.查看索引的统计疑息analyze index index_name validate structure;select (del_lf_rows_len/lf_rows_len)*100 as index_usagefrom index_stats;5凡是维护战问题管制脚法动做一名数据库管制员,数据库应用的寻常宁静运止是包管咱们应用系统的要害包管,而数据库的凡是监控战维护处事至关要害.搞佳它的查看处事的文档管制也是数据库管制的必不可少的处事之一,那有好处咱们逃踪问题战对付数据库的版本统制非常要害.例止处事提议每天例止处事:1.决定数据库真例处于运奇迹态2.查看ALERT 日志3.决定数据库乐成备份4.决定数据库归档到磁戴5.决定有足够的资材使数据库能运止正在良佳状态6.抽时间阅读DBA管制脚册每周例止处事:1.查看是可有对付象处于非寻常状态2.查看仄安战术3.查看SQL*NET 日志中是可有过得4.归档所有ALERT 日志每月例止处事:1.查看潜正在的妨害2.查看是可需要本能调劣及调劣时机3.查看I/O比赛4.查看数据库碎片5.制定将去的本能计划6.举止数据库调劣战维护相关挖表证明凡是维护查看表:是数据库管制员正在通常的凡是监控维护处事后搞的处事记录.只挖写查看的截止.仔细的问题管制记录妥协决历程便挖写问题管制记录表.如果正在查看历程中寻常正在相映栏目挨√,如果有非常十分情景挨X,共时正在后里写上相对付应的问题管制记录的编号.问题编号的命名圆法是12位,便是当时挖写记录表的日期战时间,比圆数据库管制员正在2010年04月11日14:00正在搞例止查看时创制了问题,那么正在挖写凡是维护查看表时便应正在相对付应的栏目写上问题编号201004111400.问题管制记录表是正在挖写凡是维护查看表的前提上创制了问题再挖写仔细的问题爆收妥协决历程.其中问题编号便是凡是维护查看表中的问题编号.变动记录表是咱们对付数据库搞支配前后的一个记录表.凡是查看维护表问题管制记录变动管制记录变动流火号:1.变动提出变动提出人变动提出日期变动本果简要形貌:2.变动评估变动评估人变动评估日期变动是可真施θ是θ可变动慢迫程度θ慢迫θ普遍θ不慢迫变动真施克日3.变动真施变动真施人变动真施日期。
文档标识文件状态:[] 草稿[√] 正式发布[ ] 正在修改Oracle RAC+DataGuard运维手册版本:1.0.0编制周光晖2015年01月20审核批准年月日生效日期:年月日修订历史记录日期版本修订说明作者目录第一章引言 (3)**. 编写目的 (3)**. 定义、首字母缩写词和缩略语 (4)第二章......................................................................................................... D ATA G UARD状态查询4**. 检查主备库的D ATA G UARD状态信息 (4)**. 检查进程 (4)**. 检查归档状态 (4)**. 检查最后应用的日志S EQUENCE (5)**. 查看是否使用实时应用 (5)**. 检查GAP (5)**. 检查保护模式 (5)**. 相关视图 (6)第三章................................................................................................................... SWITCHOVER 6**. 确认主库状态是否支持切换操作 (6)**. 执行主库转换 (7)**. 关闭并MOUNT新备库 (7)**. 确认老备库状态 (7)**. 切换目标备库为主库 (7)**. 打开新主库 (8)**. 启动新备库的日志应用 (8)**. 开启新备库的ADG (8)第一章引言1.1. 编写目的本文档描述了Oracle 11gR2 RAC+ADG操作手册。
包含RAC DOWN机测试,日常查询状态,启停RAC等指令同时包含oracle 11g R2 ACTIVE DATAGUARD 的日常维护指令。
1.2. 定义、首字母缩写词和缩略语第二章DataGuard状态查询2.1. 检查主备库的DataGuard状态信息SQL> Alter session set nls_date_format ='‘YYYY-MM-DD HH24:MISS';SQL> SELECT MESSAGE FROM V$DATAGUARD_STATUS;使用V$DATAGUARD_STATUS结合alert日志信息,判断DataGuard使用过程中的错误信息,查看当前日志应用的状态。
可以用ls -lt|more命令来查看主库最新归档日志文件的序号,对比备库当前归档日志应用状态了解备库目前和主库日志文件之间的差异情况。
2.2. 检查进程在主库:SELECT PROCESS, CLIENT_PROCESS, SEQUENCE#, STATUS FROM V$MANAGED_STANDBY;在备库:SELECT PROCESS, CLIENT_PROCESS, SEQUENCE#, STATUS FROM V$MANAGED_STANDBY; PROCESS CLIENT_P SEQUENCE# STATUS--------- -------- ---------- ------------ARCH ARCH 0 CONNECTEDARCH ARCH 0 CONNECTEDARCH ARCH 38 CLOSINGARCH ARCH 8 CLOSINGRFS ARCH 0 IDLEMRP0 N/A 39 APPLYING_LOGRFS LGWR 39 IDLERFS UNKNOWN0 IDLERFS UNKNOWN0 IDLEMRP是应用日志,ARCH是归档进程,RFS是接收重做日志的进程。
主库进程需要确认有ARCH进程,备库需要确认存在MRP、ARCH、RFS进程,如果不存在则表示dataguard工作不正常,查询V$DATAGUARD_STATUS视图和alert日志需找具体的错误信息。
2.3. 检查归档状态在主库运行查询:SELECT DEST_ID,DEST_NAME,STATUS from V$ARCHIVE_DEST_STATUS;判断primary库的两个归档路径是否为valid状态在备库执行查询:set linesize 1000col NAMEfor a60col CREATOR for a10col SEQUENCE# for a10col APPLIED for a10col COMPLETION_TIME for a15SELECT NAME, CREATOR,SEQUENCE#, APPLIED, COMPLETION_TIME FROMV$ARCHIVED_LOG;判断当前有哪些未APPLY,可通过操作系统命令ls查看对应目录下未APPLY的日志是否已经传输到standby端2.4. 检查最后应用的日志SequenceSQL> SELECT THREAD#, MAX(SEQUENCE#) FROM V$LOG_HISTORY GROUP BY THREAD#;2.5. 查看是否使用实时应用在备库执行如下查询:SQL>select recovery_mode from v$archive_dest_status where recovery_mode !='IDLE'; RECOVERY_MODE-----------------------MANAGED REAL TIME APPLY2.6. 检查GAP在备库运行:SQL> SELECT * FROM V$ARCHIVE_GAP;2.7. 检查保护模式set linesize 1000;col DATABASE_ROLE for a25;col INSTANCEfor a25;col OPEN_MODE for a25;col PROTECTION_MODE for a25;col PROTECTION_LEVEL for a25;col SWITCHOVER_STATUS for a25;SELECT DATABASE_ROLE, DB_UNIQUE_NAME INSTANCE, OPEN_MODE,PROTECTION_MODE,PROTECTION_LEVEL,SWITCHOVER_STATUS FROM V$DATABASE;确认主库状态为to standby或者为sessions active、保护模式应该MAXIMUM AVAILABILITY、角色为PRIMARY,如果状态异常,请按《检查DataGauard状态》章节操作检查DataGuard信息--在备库查询时通常为not allowed 或者sessions active,角色为PHYSICAL STANDBY;当primary 主库改为standby角色后,那么其中的任意一个standby库都可能被切换为primary角色,这时需要确认standby库的状态为to primary2.8. 相关视图V$ARCHIVE_DESTV$ARCHIVE_DEST_STATUSV$ARCHIVE_GAPV$ARCHIVED_LOGV$DATABASEV$DATAFILEV$DATAGUARD_STATUSV$LOGV$LOGFILEV$LOG_HISTORYV$MANAGED_STANDBY (Physical Standby Databases Only)V$STANDBY_LOGSWITCHOVER第三章DataGuard启动关闭3.1. 启动(for 10g)在主库端:#su - oracle$lsnrctl start$sqlplus / as sysdbaSQL>startup在备库端:#su - oracle$sqlplus / as sysdbaSQL>startup mountSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE NODELAY PARALLEL 2 USING CURRENT LOGFILE DISCONNECT FROM SESSION;SQL> select process,status from v$managed_standby;PROCESS STATUS--------- ------------ARCH CLOSINGARCH CONNECTEDRFS IDLERFS IDLEMRP0 APPLYING_LOG3.2. 关闭(for 10g)在主库端:#su - oracle$sqlplus / as sysdbaSQL>shutdown immediate在备库端#su - oracle$sqlplus / as sysdbaSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;SQL>shutdown immediate3.3. 启动(for 11g)在主库端:#su - oracle$lsnrctl start$sqlplus / as sysdbaSQL>startup在备库端:#su - oracle$sqlplus / as sysdbaSQL>startupSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE NODELAY PARALLEL 2 USING CURRENT LOGFILE DISCONNECT FROM SESSION;SQL> select process,status from v$managed_standby;PROCESS STATUS--------- ------------ARCH CLOSINGARCH CONNECTEDRFS IDLERFS IDLEMRP0 APPLYING_LOG3.4. 关闭(for 11g)在主库端:#su - oracle$sqlplus / as sysdbaSQL>shutdown immediate在备库端#su - oracle$sqlplus / as sysdbaSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;SQL>shutdown immediate第四章SWITCHOVER4.1. 主库4.1.1.如果主库是RAC,先做4.1.2。
如果是单机,直接做4.1.34.1.2.停掉节点2实例ssh 节点2#su - oracle$sqlplus / as sysdbashutdown immediate4.1.3.在节点1操作:#su - oracle$sqlplus / as sysdbaselect SWITCHOVER_STATUS,DATABASE_ROLE,PROTECTION_MODE FROM v$database;alter **mit to switchover to physical standby with session shutdown;shutdown immediatesqlplus / as sysdbastartup nomountalter database mount standby database;alter system set log_archive_dest_state_2=defer;alter system set aq_tm_processes=0 scope=memory;alter database recover managed standby database disconnect;4.2. 备库#su - oracle$sqlplus / as sysdbaselect SWITCHOVER_STATUS,DATABASE_ROLE,PROTECTION_MODE FROM v$database;如果SWITCHOVER_STATUS的值为TO Primary或SESSIONS ACTIVE ,执行脚本ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL; alter **mit to switchover to primary with session shutdown;shutdown immediatesqlplus / as sysdbastartup mountalter system set log_archive_dest_state_2=enable;alter system set aq_tm_processes=0 scope=memory;alter database open;alter database tempfile '/u01/app/oracle/oradata/jygdb/temp01.dbf' resize 1000M; ---第一次主切备要做,以后切换不用4.3. 新备库#su - oracle$sqlplus / as sysdbaALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL; ALTER DATABASE RECOVER MANAGED STANDBY DATABASE NODELAY PARALLEL 2 USING CURRENT LOGFILE DISCONNECT FROM SESSION;第五章FAILOVER紧急状态下直接做5.3步骤5.1. 确认主库状态A、通常,只要主库所在主机可用,则数据库一直在运行,不必要进行主备切换。