LR中监控ORACLE数据库常用计数器
- 格式:docx
- 大小:16.55 KB
- 文档页数:5
ORACLE数据库配置规范和监控清单2015年12月目录一、常规参数配置 (3)1.1 数据库最大连接数 (3)1.2 归档配置 (3)1.3 最大文件数设置 (4)1.4 关闭回收站 (4)1.5 控制文件配置 (5)1.6 白名单设置 (5)1.7 闪回区设置 (6)1.8 在线日志组 (6)1.9 控制文件记录保留数 (7)二、常用监控项 (8)2.1 数据库在用连接数 (8)2.2 监控数据库文件数 (8)2.3 表空间使用率 (8)2.4 闪回区使用率 (9)2.5 数据库等待事件 (10)2.6 告警日志监控 (10)2.7 灾备DataGuard同步监控 (10)2.8 AWR采样报告分析 (10)一、常规参数配置1.1数据库最大连接数参数:processes说明:数据库用户最大连接数通过processes参数进行配置,默认值为 300,该值表示能够同时连接到数据库的最大会话数,当连接数达到最大值,后续新增连接均会被拒绝。
修改命令:alter system set processes=1000 scope=spfile;生效方式:需重启实例生效。
1.2归档配置参数:archive log list说明:数据库开启归档,任何生产环境均应在归档方式下运行,从而达到可通过备份进行数据恢复要求,提高系统安全性修改命令:数据库启动至mount状态,执行 alter database archivelog;生效方式:重启数据库设置生效1.3最大文件数设置参数:db_files说明:该参数用于控制在扩容表空间时,数据文件能够达到的最大数量,默认值为 200修改命令:alter system set db_files=800 scope=spfile;生效方式:重启数据库生效1.4关闭回收站参数:recyclebin说明:如果回收站未关闭,则如果表对象被删除,将进入回收站,并不会释放占用的存储修改命令:alter system set recyclebin=’off’ scope=spfile;生效方式:重启实例生效1.5控制文件配置参数:control_files说明:该参数用于指定在DB启动时,读取的控制文件来源,如果有多个控制文件,每个控制文件完全一致,生产系统建议至少为两组冗余,防止出现控制文件损坏后必须进行控制文件手工重建风险。
对ORACLE数据库定期监控参考对ORACLE数据库定期监控参考DBA应按如下方式对ORACLE数据库系统做定期监控一、 DBA工作概要:1. 每天对ORACLE数据库的运行状态,日志文件,备份情况,数据库的空间使用情况,系统资源的使用情况进行检查,发现并解决问题。
2. 每周对数据库对象的空间扩展情况,数据的增长情况进行监控,对数据库做健康检查,对数据库对象的状态做检查。
3. 每月对表和索引等进行Analyze,检查表空间碎片,寻找数据库性能调整的机会,进行数据库性能调整,提出下一步空间管理计划。
对ORACLE数据库状态进行一次全面检查。
二、每天的工作1. 确认所有的INSTANCE状态正常登陆到所有数据库或例程,检测ORACLE后台进程:$ps -ef | grep ora2. 检查文件系统的使用(剩余空间)。
如果文件系统的剩余空间小于25%,需删除不用的文件以释放空间。
(51job使用的是裸设备,只需关注表空间和数据文件使用率即可)$df -k3. 检查日志文件和trace文件记录alert和trace文件中的错误,每天会有定时mail发送。
4. 检查数据库当日备份的有效性。
对RMAN备份方式:检查第三方备份工具(hpdp)的备份日志以确定备份是否成功omnidb -sess -last 2 #检查近2天的备份情况5. 检查数据文件的状态记录状态不是“online”的数据文件,并做恢复。
Select file_name from dba_data_files where status=’OFFLINE’;6. 检查表空间的使用情况SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_freeFROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name), ( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name )WHERE tablespace_name = fs_ts_name;7. 检查剩余表空间SELECT tablespace_name, sum ( blocks ) as free_blk ,trunc ( sum ( bytes ) /(1024*1024) ) as free_m,max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunksFROM dba_free_space GROUP BY tablespace_name;8. 监控数据库性能获取AWR或STATSPACK报表以及TOP时间点的SQL报告,并分析。
常用监测参数一览、windows操作系统监控参数一览:、Unix操作系统监控参数一览:、Oracle数据库监控参数一览:四、Informix数据库监控参数一览:五、DB2数据库监控参数一览:六、WebLogic中间件监控参数一览:七、WebSphere中间件监控参数一览:八、Tuxedo中间件监控参数一览:九、MQ Control中间件监控参数一览:十、Lotus Notes中间件监控参数一览:1^一、存储监控指标HP STORAGE ESSENTIALS 可以很高的支持Oracle, MS SQL, Sybase和MS Exchange Serve啲监控,例如在监控Oracle时,可以给出Oracle的14项参数实现性能的实时监控或历史性能回放。
并可以给出这些应用对硬件,包括主机,HBA卡片,交换机和磁盘阵列的详细依赖关系.可以实时监控存储设备的性能有:・磁盘阵列端口传送数据量-Storage System Port Bytes Tran smitted (MB/sec)・磁盘阵列端口接收数据量-Storage System Port Bytes Received (MB/sec)*磁盘阵列联接失败频率- -Storage System Link Failures (Failures/sec)* 磁盘阵列循环冗余码校验错误频率-Storage System CRC Errors (Errors/sec)同时也提供光纤交换机端口和HBA卡端口的性能监控:*光纤交换机端口和HBA卡端口传送数据量-FC Port Bytes Transmitted (MB/sec)*光纤交换机端口和HBA卡端口接收数据量 -FC Port Bytes Received (MB/sec)*光纤交换机端口和HBA卡端口联接失败频率 -FC Port Link Failures (Failures/sec)*光纤交换机端口和HBA卡端口循环冗余码校验错误频率-FC Port CRC Errors (Errors/sec)可以提供的存储报表包括:•存储资产汇总*存储可用卷报表•存储依赖关系报表*存储详细报表*存储事件报表* LUN Mount 报表*存储系统磁盘阵列过载利用率报表«存储系统磁盘阵列利用率报表«存储系统硬盘Map报表*利用率报表报表的格式包括PDF, XML , HTML和EXCEL四种。
LoadRunner监控Oracle计数器介绍:1、sorts(disk)(V$SYSSTAT)If the number of disk writes is non-zero for a given sort operation, then this statistic is incremented. Sorts that require I/O to disk are quite resource intensive. Try increasing the size of the initialization parameterSORT_AREA_SIZE. For more information, see "SORT_AREA_SIZE".sorts (memory) and sorts (disk):sorts(memory)是在SORT_AREA_SIZE(因此不需要在磁盘进行排序)的排序操作的数量。
sorts(disk)则是由于排序所需空间太大,SORT_AREA_SIZE不能满足而不得不在磁盘进行排序操作的数量。
这两项统计通常用于计算in-memory sort ratio。
2、sort(memory)(V$SYSSTAT)If the number of disk writes is zero, then the sort was performed completely in memory and this statistic is incremented. This is more an indication of sorting activity in the application work load. You cannot do much better than memory sorts, except maybe no sorts at all. Sorting is usually caused by selection criteria specifications within table join SQL operations.In-memory sort ratio:该项显示内存中完成的排序所占比例。
Linux下oracle启动和监听oracle数据库是重量级的,其管理非常复杂,将其在linux平台上的启动和关闭步骤整理一下。
安装完毕oracle以后,需要创建oracle系统用户,并在/home/oracle下面的.bash_profile添加几个环境变量:ORACLE_SID,ORACLE_BASE,ORACLE_HOME。
比如:export ORACLE_SID=test export ORACLE_BASE=oracle_install_dir export ORACLE_HOME=xxx启动步骤:注意$代表shell命令提示符,这里的oracle是9.0以上版本。
1.$ su - oracle2.$ sqlplus / nolog3.sql> conn / as sysdba4.sql> startup (一般不需要加参数,只要设置好环境变量)5.sql> quit (退出sql模式)6.$ lsnrctl start (启动监听器)关闭oracle1.$ lsnrctl stop(关闭监听器,在这之前,应该先关闭应用程序)2.$ sqlplus /nolog3.sql>shutdown 其参数:shutdown有四个参数,四个参数的含义如下:Normal 需要等待所有的用户断开连接Immediate 等待用户完成当前的语句Transactional 等待用户完成当前的事务Abort 不做任何等待,直接关闭数据库normal需要在所有连接用户断开后才执行关闭数据库任务,所以有的时候看起来好象命令没有运行一样!在执行这个命令后不允许新的连接immediate在用户执行完正在执行的语句后就断开用户连接,并不允许新用户连接。
transactional 在拥护执行完当前事物后断开连接,并不允许新的用户连接数据库。
abort 执行强行断开连接并直接关闭数据库。
前三种方式不回丢失用户数据。
IT系统管理参考命令手册1、系统性能采集部分
1.1 AIX性能采集
1.2 Linix性能采集
1.5 Tru64性能采集
1.6 solaris性能采集
1.7 windows wmi性能采集
1.8 oracle8,oracle9i性能采集
1.9 oracle7性能采集
2、报表指标计算公式
1)设备完好率(指硬件完好):100%(固定填写)
2) 系统可用率:核心主机指AIX,
系统可用率=系统可用时间/当月总时长通过网络监测程序产生系统不可用告警,(系统不可用时间=∑系统不可用告警持续时间)
3) 网络可用率=系统可用率
4) 系统平均负荷=系统中主机的CPU负载的平均数负荷=100%-idle%
5) 磁盘使用率=磁盘活动时间百分比%tm_act
6) 磁盘阵列使用率=主机磁盘使用率。
oracledb_exporter 监控指标-回复"oracledb_exporter 监控指标"是一种用于监控Oracle数据库的工具。
它提供了一系列的监控指标,帮助数据库管理员实时了解数据库的运行情况,并可以通过这些指标进行数据库性能分析和故障排查。
本文将详细介绍oracledb_exporter监控指标的使用方法、相关重要指标以及如何利用这些指标进行数据库监控和性能优化。
第一步:oracledb_exporter简介和安装oracledb_exporter是一个开源的Prometheus exporter,用于从Oracle数据库中收集了丰富的性能和运行状况指标,并将其暴露给Prometheus监控系统。
通过Prometheus系统的仪表板和报警规则,我们可以方便地对Oracle数据库进行实时监控和报警。
首先,我们需要在监控服务器上安装Prometheus和oracledb_exporter。
可以通过下载Prometheus并解压它来进行安装。
然后,从oracledb_exporter的GitHub仓库下载可执行文件。
第二步:配置oracledb_exporter安装完成后,我们需要对oracledb_exporter进行配置,以便与Oracle 数据库建立连接并收集相关指标。
配置文件通常以.yml格式提供,并包含以下内容:- 数据库的连接信息,包括用户名、密码和连接字符串。
- 要收集的指标列表,如数据库会话数量、表空间使用率等。
根据配置文件的示例,我们填写数据库连接信息,并根据实际需求选择要监控的指标。
保存配置文件并启动oracledb_exporter。
第三步:使用oracledb_exporter监控指标一旦oracledb_exporter正常运行,我们可以通过浏览器访问所在服务器的IP地址和指定的端口,以获得一个Web界面。
这个Web界面提供了与Oracle数据库相关的各种指标的详细信息,例如数据库会话数、CPU使用率、表空间使用率等。
一、添加自定义计数器的方法要创建自定义查询,请执行以下操作:1. 在安装路径的Mercury LoadRunner\dat\monitors找到vmon.cfg文件,打开。
2. 在vmon.cfg文件的第三行中,CustomCounters=指出要创建的自定义计数器个数。
3. 在vmon.cfg文件中为新计数器新建一节,每节都有以下格式:[Custom0]Name=Five HundredDescription=This counter always returns 500.Query=SELECT 500 FROM DUALIsRate=04. 在[Custom#]行,将计数器顺序中的下一个数字分配给新的自定义计数器。
注意:自定义计数器必须是以数字0开始的联系顺序。
5. 在Name行,输入新计数器的名称(可以输入中文)。
6. 在Description行,输入对该计数器的描述或解释(可以输入中文)。
7. 在Query行,输入恰好返回数据库一行的SQL查询的文本,该行必须包含一列数值。
注意:自定义查询文本不能够超过512字符。
8. 在IsRate行,如果希望数据库将计数器报告为一个绝对值,请输入0;如果希望数据库报告每单位时间计数器的更改,请输入1。
注意:自定义查询无法返回负值。
例:[Custom0];Name must be uniqueName=库快存命中率Description=该计数器返回当前库快存命中率Query=SELECT 100*((sum(pins-reloads))/sum(pins)) from v$librarycacheIsRate=03 配置文件示例对象安装路径的Mercury LoadRunner\dat\monitors找到vmon.cfg文件:[V$ Monitor]Counters=150CustomCounters=12;How many seconds for each data sample?SamplingRate=10[Custom0];Name must be uniqueName=库快存命中率Description=该计数器返回当前库快存命中率Query=SELECT 100*((sum(pins-reloads))/sum(pins)) from v$librarycacheIsRate=0[Custom1];Name must be uniqueName=高速缓存区命中率Description=oracle database shoot straightQuery=SELECT round(1-SUM(PHYSICAL_READS)/(SUM(DB_BLOCK_GETS) + SUM(CONSISTENT_GETS)), 4) * 100 FROM (SELECT CASE WHEN NAME='physical reads' THEN VALUE END PHYSICAL_READS,CASE WHEN NAME = 'db block gets' THEN VALUE END DB_BLOCK_GETS,CASE WHEN NAME = 'consistent gets' THEN VALUE END CONSISTENT_GETS FROM V$SYSSTAT WHERE Name IN ('physical reads','db block gets','consistent gets'))IsRate=0[Custom2];Name must be uniqueName=共享区库缓存区命中率Description=命中率应大于0.99Query=Select round(sum(pins-reloads)/sum(pins) * 100, 2) from v$librarycacheIsRate=0[Custom3];Name must be uniqueName=共享区字典缓存区命中率Description=命中率应大于0.85Query=Select round(sum(gets-getmisses-usage-fixed)/sum(gets) * 100, 2) from v$rowcache IsRate=0[Custom4];Name must be uniqueName=检测回滚段的争用Description=应该小于1%Query=select round(sum(waits)/sum(gets) * 100, 2) from v$rollstatIsRate=0[Custom5];Name must be uniqueName=检测回滚段收缩次数Description=应该小于1%Query=select sum(shrinks) from v$rollstat, v$rollname where v$n =v$nIsRate=0[Custom6];Name must be uniqueName=监控表空间的I/O读总数Description=监控表空间的I/OQuery=select sum(f.phyrds) pyr from v$filestat f, dba_data_files df where f.file# = df.file_id IsRate=0[Custom7];Name must be uniqueName=监控表空间的I/O块读总数Description=监控表空间的I/OQuery=select sum(f.phyblkrd) pbr from v$filestat f, dba_data_files df where f.file# =df.file_idIsRate=0[Custom8];Name must be uniqueName=监控表空间的I/O写总数Description=监控表空间的I/OQuery=select sum(f.phywrts) pyw from v$filestat f, dba_data_files df where f.file# =df.file_idIsRate=0[Custom9];Name must be uniqueName=监控表空间的I/O块写总数Description=监控表空间的I/OQuery=select sum(f.phyblkwrt) pbw from v$filestat f, dba_data_files df where f.file# = df.file_idIsRate=0[Custom10];Name must be uniqueName=监控SGA中重做日志缓存区的命中率Description=应该小于1%Query=selectDecode(immediate_gets+immediate_misses,0,0,immediate_misses/(immediate_gets+immediate_misses)*100) ratio2 from v$latch where name IN ('redo copy')IsRate=0[Custom11];Name must be uniqueName=监控内存和硬盘的排序比率Description=最好使它小于10%Query=select round(sum(case when name='sorts (disk)' then value else 0 end) / sum(case when name='sorts (memory)' then value else 0 end)*100,2) from (select name, value fromv$sysstat where name IN ('sorts (memory)', 'sorts (disk)'))IsRate=0(以上为12个自定义的计数器,以下为LR工具自带的计数器)[0]Name=CPU used by this sessionDescription=This is the amount of CPU time (in 10s of milliseconds) used by a session between when a user call started and ended. Some user calls can complete within 10 milliseconds and as a result, the start and end user-call time can be the same. In this case, 0 milliseconds are added to the statistic. A similar problem can exist in the reporting by the operating system, especially on systems that suffer from many context switches.IsRate=0[1]Name=CPU used when call startedDescription=The CPU time used when the call is started.IsRate=0二、常用自定义计数器列表序号监控名称 SQL算法说明1、数据高速缓存区命中率 SELECTround(1-SUM(PHYSICAL_READS)/(SUM(DB_BLOCK_GETS) +SUM(CONSISTENT_GETS)), 4) * 100 FROM (SELECT CASE WHEN NAME='physical reads' THEN VALUE END PHYSICAL_READS,CASE WHEN NAME = 'db block gets' THEN VALUE END DB_BLOCK_GETS,CASE WHEN NAME = 'consistent gets' THEN VALUE END CONSISTENT_GETS FROM V$SYSSTAT WHERE Name IN ('physical reads','db block gets','consistent gets')) (监控SGA 的命中率)命中率应大于0.90最好2、库快存命中率 SELECT 100*((sum(pins-reloads))/sum(pins)) fromv$librarycache 该计数器返回当前库快存命中率3 、共享区库缓存区命中率 Select round(sum(pins-reloads)/sum(pins) * 100, 2) from v$librarycache (监控SGA 中共享缓存区的命中率)命中率应大于0.994、监控SGA 中字典缓冲区的命中率 Selectround(sum(gets-getmisses-usage-fixed)/sum(gets) * 100, 2) from v$rowcache (共享区字典缓存区命中率)命中率应大于0.855、检测回滚段的争用 select round(sum(waits)/sum(gets) * 100, 2) fromv$rollstat 小于1%6、检测回滚段收缩次数 select sum(shrinks) from v$rollstat, v$rollname wherev$n = v$n7、监控表空间的I/O读总数 select sum(f.phyrds) pyr from v$filestat f, dba_data_files df where f.file# = df.file_id 监控表空间的I/O8、监控表空间的I/O块读总数 select sum(f.phyblkrd) pbr from v$filestat f,dba_data_files df where f.file# = df.file_id 监控表空间的I/O9、监控表空间的I/O写总数 select sum(f.phywrts) pyw from v$filestat f,dba_data_files df where f.file# = df.file_id 监控表空间的I/O10、监控表空间的I/O块写总数 select sum(f.phyblkwrt) pbw from v$filestat f,dba_data_files df where f.file# = df.file_id 监控表空间的I/O11、监控SGA 中重做日志缓存区的命中率 SELECTDecode(immediate_gets+immediate_misses,0,0,immediate_misses/(immediate_gets+immediate_ misses)*100) ratio2 FROM v$latch WHERE name IN ('redo copy') 应该小于1%12、监控内存和硬盘的排序比率 select round(sum(case when name='sorts (disk)' then value else 0 end) / sum(case when name='sorts (memory)' then value else 0 end)*100,2) from (SELECT name, value FROM v$sysstatWHERE name IN ('sorts (memory)', 'sorts (disk)')) 最好使它小于10%。