ORACLE RAC日常管理和维护
- 格式:pdf
- 大小:229.96 KB
- 文档页数:9
oracle日常运维操作总结一、硬件维护1.确保服务器硬件运行正常,定期检查硬件设备,如服务器、存储设备、网络设备等。
2.根据需要及时更新硬件设备,包括升级内存、硬盘等。
3.确保服务器周边设备运行正常,如UPS电源、空调等。
二、软件维护1.确保Oracle数据库软件运行正常,定期检查软件版本、补丁等。
2.更新Oracle数据库软件,包括升级Oracle版本、打补丁等。
3.定期清理无用文件,包括日志文件、临时文件等。
4.定期备份数据库,确保数据安全。
三、性能优化1.定期检查数据库性能,包括CPU使用率、内存使用率等。
2.根据性能检查结果,进行性能优化,如调整数据库参数、优化SQL语句等。
3.定期对数据库进行优化,包括重建索引、优化表空间等。
四、安全加固1.配置Oracle数据库的安全设置,如用户密码、权限管理等。
2.确保数据库账户的安全性,如定期修改密码、禁用无效账户等。
3.防止SQL注入等攻击行为,如使用参数化查询、限制用户输入等。
4.定期检查数据库的安全日志,包括登录日志、操作日志等。
五、数据备份1.制定数据备份计划,并按照计划执行备份操作。
2.采用多种备份方式,如全备份、增量备份等。
3.确保备份数据的可用性和完整性,如定期测试备份数据的恢复能力。
4.对备份数据进行存储和管理,确保数据安全。
六、故障处理1.建立故障处理流程,明确故障处理责任人和流程步骤。
2.对发生的故障进行及时处理,如系统崩溃、网络故障等。
3.对故障进行分类和总结,建立故障处理知识库。
4.定期对系统进行健康检查和性能测试,预防故障发生。
七、监控管理1.建立监控管理体系,包括监控指标、监控周期等。
2.使用监控工具,如OracleEnterpriseManager、Nagios等,对系统进行实时监控。
3.对监控数据进行分析和处理,及时发现和处理潜在问题。
4.定期对监控数据进行存储和管理,方便后续查询和分析。
八、应急预案1.制定应急预案,明确应急响应流程和责任人。
Oracle 11g RAC维护参考RAC集群,全称Real Application Clusters,译为“实时应用集群”,是Oracle提供的一种高可用、并行集群系统,RAC除了具有高可用能力还有负载均衡能力,整个RAC集群系统由Oracle Clusterware (集群软件)和Real Application Clusters(RAC)两大部分组成。
1硬件环境RAC集群的硬件环境包括主机、共享存储、网络设备。
1.1主机(节点)RAC集群环境中至少有两台主机,也就是两个节点,每个节点配置一样的硬件,至少配置两块物理网卡。
1.2网络设备网卡,每个RAC集群节点上至少配置两块物理网卡。
一块网卡用于集群内部的私有通信,集群节点间数据块的传输都是通过这块网卡,我们称之为私有网卡,IP别名Private IP;另一块网卡用于对外服务,比如数据库的查询等,我们称之为公有网卡,IP别名Public IP。
除此之外,每个节点还有第三个VIP(Virtual IP)的IP。
RAC集群正常运行时,每个节点的VIP会被分配到公有网卡上,当某个节点出现故障宕机时,这个节点的VIP会被移到其它正常运行节点的公有网卡上。
网络交换机,首先,用于连接所有节点的公有网卡以提供对外的数据库服务,其次,用于连接各个节点之间的私有网卡以传递集群节点之间的心跳数据和数据库数据块(Cache Fusion)。
1.3共享存储在RAC集群中,最重要的是共享存储,RAC是一个“多实例、单一数据库”的架构,所有的节点共享一个数据库。
数据文件、联机日志、参数文件、控制文件存放在共享存储上以保证每个节点的实例都能访问。
每个节点安装HBA卡,然后通过光纤线和存储设备连接。
2软件环境RAC集群的软件组成包含:操作系统、集群软件、数据库软件。
2.1操作系统每个节点上所安装的操作系统必须是相同版本的。
2.2集群软件Oracle Clusterware(统称为CRS/Cluster Ready Service)集群软件,负责管理整个集群环境中的硬件资源,并为上层的RAC集群提供基础服务。
最详细的oracle rac日常基本维护命令以下是一些使用Oracle RAC进行日常基本维护的常用命令:1. CRSCTL命令:- crsctl check crs:检查集群资源状态。
- crsctl start crs:启动整个集群资源服务。
- crsctl stop crs:停止整个集群资源服务。
- crsctl disable crs:禁用整个集群资源服务。
- crsctl enable crs:启用整个集群资源服务。
2. SRVCTL命令:- srvctl start instance -db <database_name> -instance<instance_name>:启动指定的实例。
- srvctl stop instance -db <database_name> -instance<instance_name>:停止指定的实例。
- srvctl status instance -db <database_name> -instance<instance_name>:检查指定实例的状态。
- srvctl start service -db <database_name> -service <service_name>:启动指定的服务。
- srvctl stop service -db <database_name> -service <service_name>:停止指定的服务。
- srvctl status service -db <database_name> -service<service_name>:检查指定服务的状态。
3. SQL*Plus命令:- sqlplus / as sysdba:以SYS用户身份登录数据库。
- startup:启动数据库实例。
Oracle Rac日常维护操作手册一、关闭服务器1.1关闭数据库实例在DBSERVER01和DBSERVER02服务器上分别运行以下命令:在cmd命令行中运行C:\Documents and Settings\Administrator>d:D:\>cd D:\oracle\product\10.2.0\crs\BIND:\oracle\product\10.2.0\crs\BIN>crs_stat –t (检查oracle数据库运行状态)名称类型目标状态主机------------------------------------------------------------ora....S1.inst application ONLINE ONLINE dbserver01ora....S2.inst application ONLINE ONLINE dbserver02ora.HBHIS.db application ONLINE ONLINE dbserver02ora....01.lsnr application ONLINE ONLINE dbserver01ora....r01.gsd application ONLINE ONLINE dbserver01ora....r01.ons application ONLINE ONLINE dbserver01ora....r01.vip application ONLINE ONLINE dbserver01ora....02.lsnr application ONLINE ONLINE dbserver02ora....r02.gsd application ONLINE ONLINE dbserver02ora....r02.ons application ONLINE ONLINE dbserver02ora....r02.vip application ONLINE ONLINE dbserver02D:\oracle\product\10.2.0\crs\BIN>sqlplus sys/sys as sysdbaSQL>shutdown immediateSQL>exitD:\oracle\product\10.2.0\crs\BIN>crs_stat –t (再次检查oracle数据库运行状态) 名称类型目标状态主机------------------------------------------------------------ora....S1.inst application OFFLINE OFFLINEora....S2.inst application OFFLINE OFFLINEora.HBHIS.db application OFFLINE OFFLINEora....01.lsnr application ONLINE ONLINE dbserver01ora....r01.gsd application ONLINE ONLINE dbserver01ora....r01.ons application ONLINE ONLINE dbserver01ora....r01.vip application ONLINE ONLINE dbserver01ora....02.lsnr application ONLINE ONLINE dbserver02ora....r02.gsd application ONLINE ONLINE dbserver02ora....r02.ons application ONLINE ONLINE dbserver02ora....r02.vip application ONLINE ONLINE dbserver021.2关闭CRS集群服务在DBSERVER01或DBSERVER02服务器上运行以下命令:C:\Documents and Settings\Administrator>srvctl stop nodeapps -n dbserver01C:\Documents and Settings\Administrator>srvctl stop nodeapps -n dbserver02D:\oracle\product\10.2.0\crs\BIN>crs_stat –t (再次检查oracle数据库运行状态) 名称类型目标状态主机------------------------------------------------------------ora....S1.inst application OFFLINE OFFLINEora....S2.inst application OFFLINE OFFLINEora.HBHIS.db application OFFLINE OFFLINEora....01.lsnr application OFFLINE OFFLINEora....r01.gsd application OFFLINE OFFLINEora....r01.ons application OFFLINE OFFLINEora....r01.vip application OFFLINE OFFLINEora....02.lsnr application OFFLINE OFFLINEora....r02.gsd application OFFLINE OFFLINEora....r02.ons application OFFLINE OFFLINEora....r02.vip application OFFLINE OFFLINE1.3关闭服务器操作系统先关DBSERVER01,在关闭DBSERVER02;二、开启服务器2.1DBSERVER02服务器开机DBSERVER02服务器操作系统启动后待网卡服务全部启动,执行以下命令验证oracle服务启动情况C:\Documents and Settings\Administrator>d:D:\>cd D:\oracle\product\10.2.0\crs\BIND:\oracle\product\10.2.0\crs\BIN>crs_stat –t (检查oracle数据库运行状态)名称类型目标状态主机------------------------------------------------------------ora....S1.inst application OFFLINE OFFLINEora....S2.inst application ONLINE ONLINE dbserver02ora.HBHIS.db application ONLINE ONLINE dbserver02ora....01.lsnr application OFFLINE OFFLINEora....r01.gsd application OFFLINE OFFLINEora....r01.ons application OFFLINE OFFLINEora....r01.vip application OFFLINE OFFLINEora....02.lsnr application ONLINE ONLINE dbserver02ora....r02.gsd application ONLINE ONLINE dbserver02ora....r02.ons application ONLINE ONLINE dbserver02ora....r02.vip application ONLINE ONLINE dbserver02待DBSERVER02上oracle服务全部启动后再开启DBSERVER01。
1、查看所有实例和服务的状态$ srvctl status database -d orclInstance orcl1 is running on node linux1Instance orcl2 is running on node linux22、查看单个实例的状态$ srvctl status instance -d orcl -i orcl2Instance orcl2 is running on node linux23、查看数据库全局命名服务的状态$ srvctl status service -d orcl -s orcltestService orcltest is running on instance(s) orcl2, orcl1 4、查看特定节点上节点应用程序的状态$ srvctl status nodeapps -n linux1VIP is running on node: linux1GSD is running on node: linux1Listener is running on node: linux1ONS daemon is running on node: linux15、查看ASM 实例的状态$ srvctl status asm -n linux1ASM instance +ASM1 is running on node linux1.6、列出配置的所有数据库$ srvctl config databaseorcl7、显示 RAC 数据库的配置$ srvctl config database -d orcllinux1 orcl1 /u01/app/oracle/product/10.2.0/db_1linux2 orcl2 /u01/app/oracle/product/10.2.0/db_18、显示指定集群数据库的所有服务$ srvctl config service -d orclorcltest PREF: orcl2 orcl1 AVAIL:9、显示节点应用程序的配置—(VIP、GSD、ONS、监听器)$ srvctl config nodeapps -n linux1 -a -g -s -lVIP exists.: /linux1-vip/192.168.1.200/255.255.255.0/eth0:eth1GSD exists.ONS daemon exists.Listener exists.10、显示 ASM 实例的配置$ srvctl config asm -n linux1+ASM1 /u01/app/oracle/product/10.2.0/db_111、查看集群中所有正在运行的实例SELECT inst_id,instance_number inst_no,instance_name inst_name,parallel,status,database_status db_status,active_state state, host_name hostFROM gv$instanceORDER BY inst_id;INST_ID INST_NO INST_NAME PAR STATUS DB_STATUS STATE HOST-------- -------- ---------- --- ------- ------------ --------- -------1 1 orcl1 YES OPEN ACTIVE NORMAL rac12 2 orcl2 YES OPEN ACTIVE NORMAL rac212、查看位于磁盘组中的所有数据文件select name from v$datafileunionselect member from v$logfileunionselect name from v$controlfileunionselect name from v$tempfile;NAME-------------------------------------------+FLASH_RECOVERY_AREA/orcl/controlfile/current.258.570913191 +FLASH_RECOVERY_AREA/orcl/onlinelog/group_1.257.570913201 +FLASH_RECOVERY_AREA/orcl/onlinelog/group_2.256.570913211 +FLASH_RECOVERY_AREA/orcl/onlinelog/group_3.259.570918285 +FLASH_RECOVERY_AREA/orcl/onlinelog/group_4.260.570918295 +ORCL_DATA1/orcl/controlfile/current.259.570913189+ORCL_DATA1/orcl/datafile/example.257.570913311+ORCL_DATA1/orcl/datafile/indx.270.570920045+ORCL_DATA1/orcl/datafile/sysaux.260.570913287+ORCL_DATA1/orcl/datafile/system.262.570913215+ORCL_DATA1/orcl/datafile/undotbs1.261.570913263+ORCL_DATA1/orcl/datafile/undotbs1.271.570920865+ORCL_DATA1/orcl/datafile/undotbs2.265.570913331+ORCL_DATA1/orcl/datafile/undotbs2.272.570921065+ORCL_DATA1/orcl/datafile/users.264.570913355+ORCL_DATA1/orcl/datafile/users.269.570919829+ORCL_DATA1/orcl/onlinelog/group_1.256.570913195+ORCL_DATA1/orcl/onlinelog/group_2.263.570913205+ORCL_DATA1/orcl/onlinelog/group_3.266.570918279+ORCL_DATA1/orcl/onlinelog/group_4.267.570918289+ORCL_DATA1/orcl/tempfile/temp.258.57091330321 rows selected.13、查看属于“ORCL_DATA1”磁盘组的所有 ASM 磁盘SELECT pathFROM v$asm_diskWHERE group_number IN (select group_numberfrom v$asm_diskgroupwhere name = 'ORCL_DATA1');PATH----------------------------------ORCL:VOL1ORCL:VOL214、启动/停止RAC集群确保是以 oracle UNIX 用户登录的。
oracle rac的日常维护及注意事项2009-03-13 23:26oracle rac的日常维护及注意事项在Oracle数据库运行期间,DBA应该对数据库的运行日志及表空间的使用情况进行监控,及早发现数据库中存在的问题。
一、Oracle警告日志文件监控Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况:l 数据库的启动、关闭,启动时的非缺省参数;l 数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因;l 对数据库进行的某些操作,如创建或删除表空间、增加数据文件;问题处理启动参数不对检查初始化参数文件因为检查点操作或归档操作没有完成造成重做日志不能切换如果经常发生这样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率;有人未经授权删除了表空间检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限出现坏块检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个对象进行重建表空间不够增加数据文件到相应的表空间出现ORA-600根据日志文件的内容查看相应的TRC文件,如果是Oracle的bug,要及时打上相应的补丁二、数据库表空间使用情况监控(字典管理表空间)数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。
select tablespace_name, count(*) chunks , max(bytes/1024/1024) max_chunk from dba_free_space group by tablespace_name;上面的SQL列出了数据库中每个表空间的空闲块情况,如下所示:TABLESPACE_NAME CHUNKS MAX_CHUNK-------------------- ---------- ----------INDX 1 57.9921875RBS 3 490.992188RMAN_TS 1 16.515625SYSTEM 1 207.296875TEMP 20 70.8046875TOOLS 1 11.8359375USERS 67 71.3671875其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该表空间的碎片状况就比较严重了,可以尝试用以下的SQL命令进行表空间相邻碎片的接合:alter tablespace 表空间名coalesce;然后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减少。
ORACLERAC日常管理概述一、Oracle RAC简介:Oracle RAC 支持Oracle 数据库在集群上运行真正的应用程序。
此处的真正应用是指RAC 能够支持所有类型的主流商业应用程序。
这包含流行的封装产品,如SAP、PeopleSoft 与Oracle E*Business Suite 等,与自主研发的应用程序,其中包含OLTP 与DSS,与Oracle 有效支持混合OLTP/DSS 环境的独有能力。
Oracle 是唯一提供具备这一功能的开放系统数据库的厂商。
Oracle RAC 运行于集群之上,为Oracle 数据库提供了最高级别的可用性、可伸缩性与低成本计算能力。
假如集群内的一个节点发生故障,Oracle 将能够继续在其余的节点上运行。
假如需要更高的处理能力,新的节点可轻松添加至集群。
为了保持低成本,即使最高端的系统也能够从使用标准化商用组件的小型低成本集群开始逐步构建而成。
Oracle 的要紧创新是一项称之高速缓存合并的技术,它最初是针对Oracle9i 真正应用集群开发的。
高速缓存合并使得集群中的节点能够通过高速集群互联高效地同步其内存高速缓存,从而最大限度地低降低磁盘I/O。
高速缓存最重要的优势在于它能够使集群中所有节点的磁盘共享对所有数据的访问。
数据无需在节点间进行分区。
Oracle 是唯一提供具备这一能力的开放系统数据库的厂商。
其它声称能够运行在集群上的数据库软件需要对数据库数据进行分区。
这关于拥有复杂的数据结构的真正应用程序而言,显得不切实际。
而且也不可能对集群系统进行统一变更。
假如您添加或者删除节点或者存储资源,数据则需要完全重新分区。
二、ORACLE RAC工作原理在一个应用环境当中,所有的服务器使用与管理同一个数据库,目的是为了分散每一台服务器的工作量,硬件上至少需要两台以上的服务器,而且还需要一个共享存储设备。
同时还需要两类软件,一个是集群软件,另外一个就是Oracle数据库中的RAC组件。
标题:深度解析rac alter system使用方法一、引言RAC(Real Application Clusters)是Oracle数据库的一种架构,它允许多台服务器共享一个存储器和一个数据库。
在RAC环境中,我们经常需要使用rac alter system命令来管理数据库实例。
本文将全面评估rac alter system的使用方法,并深入探讨其功能和用法。
二、rac alter system的功能和作用rac alter system是Oracle数据库中的一个重要命令,它用来管理数据库实例的状态和行为。
通过rac alter system命令,我们可以进行诸如启动、关闭、重启、切换日志等操作,以实现对数据库实例的有效管理。
在RAC环境中,rac alter system更为重要,因为它可以同时作用于多个节点上的数据库实例,确保数据一致性和完整性。
三、rac alter system的基本用法1. 启动实例在RAC环境中,我们可以使用rac alter system命令来启动数据库实例。
rac alter system start instance 'instance_name';2. 关闭实例同样地,我们也可以使用rac alter system命令来关闭数据库实例。
rac alter system stop instance 'instance_name';3. 重启实例除了启动和关闭实例,rac alter system还可以用来重启数据库实例以完成一些配置变更。
rac alter system restart instance 'instance_name';4. 切换日志在RAC环境中,我们可能需要切换日志以进行一些调试和故障排除。
rac alter system命令可以帮助我们实现这一目的。
rac alter system switch logfile;五、总结与展望在本文中,我们全面评估了rac alter system的使用方法,并深入探讨了其功能和用法。
千里之行,始于足下。
oracle日常运维总结以下是Oracle日常运维总结的一些要点:1. 定期备份数据:重要性不言而喻,确保数据安全。
可以使用Oracle的备份工具或者第三方工具进行备份,定期检查备份的完整性和可用性。
2. 监控数据库性能:使用Oracle的性能监控工具,如AWR报告、ASH报告等,分析数据库性能瓶颈,并及时采取措施进行优化。
3. 维护数据库统计信息:定期收集和更新数据库的统计信息,以便优化查询性能。
可以使用Oracle的DBMS_STATS包来进行统计信息的收集和更新。
4. 定期检查表空间使用情况:监控数据库的表空间使用情况,及时扩展表空间或调整表空间大小,以确保数据库的正常运行。
5. 定期检查数据库日志和告警日志:定期检查数据库的日志文件和告警日志,及时处理数据库异常或错误。
6. 定期进行数据库滚动备份:数据库滚动备份可以保证数据库的连续备份,避免因备份过程中的数据变更造成备份不完整。
7. 定期进行数据库性能调优:定期进行数据库性能调优,如优化SQL语句、调整数据库参数等,以提高数据库的运行效率和性能。
8. 定期进行数据库安全审计:定期审计数据库的安全性,检查数据库的用户权限、网络安全等,并及时修复和加固数据库的安全漏洞。
第1页/共2页锲而不舍,金石可镂。
9. 定期进行数据库版本升级和补丁安装:定期检查Oracle官方网站,了解最新的数据库版本和补丁,并根据需要进行升级和安装,以保证数据库的安全和稳定。
10. 定期进行数据库容量规划:根据业务需求和数据增长情况,定期进行数据库容量规划,以确保数据库能够满足业务的需求并保持良好的性能。
以上是Oracle日常运维总结的一些要点,根据实际情况进行调整和补充。