Oracle Cluster Health Monitor(CHM)简介

2024-04-02 19:04:59 482人浏览独家记忆

摘要

oracle Cluster Health Monitor(CHM)简介概述Cluster Health Monitor（以下简称CHM）是一个Orac

oracle Cluster Health Monitor(CHM)简介

概述

Cluster Health Monitor（以下简称CHM）是一个Oracle提供的工具，用来自动收集操作系统的资源（CPU、内存、SWAP、进程、I/O以及网络等）的使用情况。CHM会每秒收集一次数据。

这些系统资源数据对于诊断集群系统的节点重启、Hang、实例驱逐(Eviction)、性能问题等是非常有帮助的。另外，用户可以使用CHM来及早发现一些系统负载高、内存异常等问题，从而避免产生更严重的问题。

CHM会自动安装在下面的软件：

11.2.0.2 及更高版本的 OracleGrid Infrastructure for linux (不包括Linux Itanium) 、Solaris (Sparc 64 和 x86-64)

11.2.0.3 及更高版本 OracleGrid Infrastructure for aiX 、 windows (不包括Windows Itanium)。

在集群中，可以通过下面的命令查看CHM对应的资源(ora.crf)的状态：

$ crsctl stat res -t -init

[root@testrac2 bin]# ./crsctl stat resora.crf -init

NAME=ora.crf

TYPE=ora.crf.type

TARGET=ONLINE

STATE=ONLINE on testrac2

CHM主要包括两个服务：

1).System Monitor Service(osysmond)：这个服务在所有节点都会运行，osysmond会将每个节点的资源使用情况发送给cluster logger service，后者将会把所有节点的信息都接收并保存到CHM的资料库。

$ps -ef|grep osysmond
root 7984 1 0Jun05 ? 01:16:14/u01/app/11.2.0/grid/bin/osysmond.bin

    2).Cluster Logger Service(ologgerd)：在一个集群中的，ologgerd 会有一个主机点(master)，还有一个备节点(standby)。当ologgerd在当前的节点遇到问题无法启动后，它会在备用节点启用。

     主节点:
     $ ps -ef|grep ologgerd
       root      8257     1  0Jun05 ?        00:38:26/u01/app/11.2.0/grid/bin/ologgerd -M -d      /u01/app/11.2.0/grid/crf/db/rac2

     备节点：
      $ ps -ef|grep ologgerd
       root      8353     1  0Jun05 ?        00:18:47/u01/app/11.2.0/grid/bin/ologgerd -m rac2 -r -d
/u01/app/11.2.0/grid/crf/db/rac1

CHM Repository：用于存放收集到数据，默认情况下，会存在于Grid Infrastructure home 下，需要1 GB 的磁盘空间，每个节点大约每天会占用0.5GB的空间。您可以使用OCLUMON来调整它的存放路径以及允许的空间大小(最多只能保存3天的数据)。

查看当前设置

下面的命令用来查看它当前设置：
     $ oclumon manage -get reppath
       CHM Repository Path =/u01/app/11.2.0/grid/crf/db/rac2
       Done

     $ oclumon manage -get repsize
       CHM Repository Size = 68082 <====单位为秒
       Done
修改设置

修改路径：

$ oclumon manage -repos reploc/shared/oracle/chm
修改大小：

$ oclumon manage -repos resize 68083 <==在3600(小时) 到 259200(3天)之间
      rac1 --> retention check successful
      New retention is 68083 and will use1073750609 bytes of disk space
      CRS-9115-Cluster Health Monitor repositorysize change completed on all nodes.
      Done

获得CHM生成的数据的方法

     1. 一种是使用Grid_home/bin/diaGCollection.pl：
        1). 首先，确定clusterlogger service的主节点：
         $ oclumon manage -getmaster
         Master = rac2

        2).用root身份在主节点rac2执行下面的命令：
         # /bin/diagcollection.pl-collect -chmos -incidenttime inc_time -incidentduration duration
         inc_time是指从什么时间开始获得数据，格式为MM/DD/YYYY24HH:MM:SS, duration指的是获得开始时间后多长时间的数据。

         比如：#diagcollection.pl-collect -crshome /u01/app/11.2.0/grid-chmoshome  /u01/app/11.2.0/grid -chmos -incidenttime06/15/201215:30:00 -incidentduration 00:05

       3).运行这个命令之后，CHM的数据会生成在文件chmosData_rac2_20120615_1537.tar.gz。

    2. 另外一种获得CHM生成的数据的方法为oclumon:
$oclumon dumpnodeview [[-allnodes] | [-n node1 node2] [-last"duration"] | [-s "time_stamp" -e "time_stamp"][-v] [-warning]] [-h]

        -s表示开始时间，-e表示结束时间
       $ oclumon dumpnodeview -allnodes -v-s "2012-06-15 07:40:00" -e "2012-06-15 07:57:00" >/tmp/chm1.txt

       $ oclumon dumpnodeview -n node1 node2node3 -last "12:00:00" >/tmp/chm1.txt
       $ oclumon dumpnodeview -allnodes-last "00:15:00" >/tmp/chm1.txt

下面是/tmp/chm1.txt中的部分内容：
----------------------------------------
Node: rac1 Clock: '06-15-12 07.40.01' SerialNo:168880
----------------------------------------

SYSTEM:
#cpus: 1 cpu: 17.96 cpuq: 5 physmemfree: 32240 physmemtotal: 2065856 mcache:1064024 swapfree: 3988376 swaptotal: 4192956 ior: 57 io
w: 59 iOS: 10 swpin: 0 swpout: 0 pgin: 57 pGout: 59 netr: 65.767 netw: 34.871 procs:183 rtprocs: 10 #fds: 4902 #sysfdlimit: 6815744
#disks: 4 #nics: 3  nicErrors: 0

TOP CONSUMERS:
topcpu: 'mrtg(32385) 64.70' topprivmem: 'ologgerd(8353) 84068' topshm:'oracle(8760) 329452' topfd: 'ohasd.bin(6627) 720' topthread:
'crsd.bin(8235) 44'

PROCESSES:

name: 'mrtg' pid: 32385 #procfdlimit: 65536 cpuusage: 64.70 privmem: 1160 shm:1584 #fd: 5 #threads: 1 priority: 20 nice: 0
name: 'oracle' pid: 32381 #procfdlimit: 65536 cpuusage: 0.29 privmem: 1456 shm:12444 #fd: 32 #threads: 1 priority: 15 nice: 0
...
name: 'oracle' pid: 8756 #procfdlimit: 65536 cpuusage: 0.0 privmem: 2892 shm:24356 #fd: 47 #threads: 1 priority: 16 nice: 0

----------------------------------------
Node: rac2 Clock: '06-15-12 07.40.02' SerialNo:168878
----------------------------------------

SYSTEM:
#cpus: 1 cpu: 40.72 cpuq: 8 physmemfree: 34072 physmemtotal: 2065856 mcache:1005636 swapfree: 3991808 swaptotal: 4192956 ior: 54 io
w: 104 ios: 11 swpin: 0 swpout: 0 pgin: 54 pgout: 104 netr: 77.817 netw: 33.008procs: 178 rtprocs: 10 #fds: 4948 #sysfdlimit: 68157
44 #disks: 4 #nics: 4  nicErrors: 0

TOP CONSUMERS:
topcpu: 'orarootagent.bi(8490) 1.59' topprivmem: 'ologgerd(8257) 83108' topshm:'oracle(8873) 324868' topfd: 'ohasd.bin(6744) 720' t
opthread: 'crsd.bin(8362) 47'

PROCESSES:

name: 'oracle' pid: 9040 #procfdlimit: 65536 cpuusage: 0.19 privmem: 6040 shm:121712 #fd: 33 #threads: 1 priority: 16 nice: 0
...

  关于CHM的更多解释，请参考Oracle官方文档：
  Http://docs.oracle.com/cd/E11882_01/rac.112/e16794/troubleshoot.htm#CWADD92242
  Oracle Clusterware Administration and Deployment Guide
  11g Release 2 (11.2)
  Part Number E16794-17

  或者 My Oracle Support文档：
  Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Oracle Cluster Health Monitor(CHM)简介

本文链接: https://www.lsjlt.com/news/41770.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Oracle RAC 简介及核心概念

Oracle RAC（Real Application Clusters）简介及核心概念随着企业数据量的不断增长和对高可用性、高性能的需求日益突出，数据库集群技术变得越来越重要。Or...

99+

2024-03-07

oracle 概念 rac
Oracle系列：（1）简介和安装

1、Oracle简介1977年美国人 Larry 成立软件开发实验室 1980年用c/c++开发了世界第一个商用关系型数据库（RDBMS）1983年公司更名为Oracle Corporati...

99+

2024-04-02
Oracle高水位High Water Mark(HWM)简介

　　1.什么是高水位　　高水位是Oracle中使用和未使用空间中的边界线，也可以理解为数据文间和非数据文间的分界线，但是这里的数据文件指代的是存储过数据的数据文件，而非仅仅是数据表中有数据的数据文件。　　2...

99+

2024-04-02
oracle逻辑运算符与其优先级简介

Oracle的逻辑运算符也是用在SQL语句中必不可少的因素，一共有三个逻辑运算符意义 ...

99+

2024-04-02
Oracle存储过程Procedure简单介绍（第一部分）

我们都知道SQL语言是没有判断和过程控制语句的，而PL/SQL又很好的补充了SQL语言这方面的不足。而存储过程也是一种PL/SQL块，但是存储过程又跟传统的PL/SQL块不一样，存储过程是以命名的方式存储于...

99+

2024-04-02
简单介绍一下Oracle创建Database Link的两种方式

Oracle创建Database Link的两种方式是静态Database Link和动态Database Link。1. 静态Da...

99+

2023-09-22

Oracle
简单介绍2种Java读取Oracle大字段数据（CLOB）的方法

这篇文章主要介绍了Java读取Oracle大字段数据（CLOB）的2种方法,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下Oracle数据库中有一个字段是CLOB类型，使用java 解析.1...

99+

2023-06-05