简要说明oracle11gr2 rac的进程启动流程:
1.启动流程概览图:
二。rac启动流程的梳理:
第一层:ohasd 启动:(ohasd派生)
1.cssdagent负责启动cssd的agent.以root用户权限启动,负责启动cssd进程。
2.orarootagent负责启动“root”用户下的ohasd的资源的agent.
以 root 用户权限启动,负责启动以下这些守护进程:crsd进程、ctssd进程、diskmon进程、acfs进程。这些进程也都是以root用户权限启动。
3.oraagent 负责启动所用grid用户的ohasd的资源的agent.
以grid用户权限启动,负责mdnsd进程、gipcd进程、gpnpd进程、evmd进程、asm进程
4.cssdmonitor – 监控 cssd 以及节点健康(和 cssdagent 一起)。
以root用户权限启动,负责cssdmonitor进程和启动。
第二层:
1.ohasd rootagent 启动:
crsd -管理集群资源的主要后台进程。
ctssd-cluster time synchronization services daemon
diskmon
acfs (asm cluster file system)驱动。
2.ohasd oraagent启动:
mdnsd-用来实现dns查询
gipcd-用来做节点间通信
gpnpd-grid plug &play profile daemon
evmd-event monitor daemon
asm-asm资源
第三层:crsd启动:
orarootagent-负责启动所有root用户下的crsd资源的agent.
oraagent-负责启动所有grid用户下的crsd资源的agent
第四层:crsd rootagent启动
network resource-监控公共网络
scan vip(s) -single client access name virtural ips
node vips-每个节点1个
acfs registery 挂载asm cluster file system
gns vip(optional)vip for gns
第四层: crsd oraagent 启动:
asm resource -asm 资源
diskgroup -用来管理/监控asm磁盘组
db resource -用来管理/监控数据库和实例
scan listener -scan监听,监听在scan vip 上
listener -节点监听,监听在node vip上
services -用来管理/监听 services
ons- oracle notification services
eons-加强版 oracle notification service
gsd 为了向下兼容9i
gns (optional)-grid naming service -处理域名解析
启动流程对应日志:
clusterware 后台进程日志都放在”grid_home”/log/”nodename”之下,结构如下:
/<grid_home>/log/<nodename>/alert<nodename>.log 对于clusterware的问题,先检查这个文件 /<grid_home>/log/<nodename>/ohasd /<grid_home>/log/<nodename>/agent/ohasd/oraagent_<griduser> /<grid_home>/log/<nodename>/agent/ohasd/oracssdagent_root /<grid_home>/log/<nodename>/agent/ohasd/oracssdmonitor_root /<grid_home>/log/<nodename>/agent/ohasd/orarootagent_root 对应的 ohasd进程和其启动的子进程日志和pid /<grid_home>/log/<nodename>/crsd /<grid_home>/log/<nodename>/ctssd /<grid_home>/log/<nodename>/diskmon 对应 ohasd rootagent 启动的crsd、ctssd和diskmon /<grid_home>/log/<nodename>/mdnsd /<grid_home>/log/<nodename>/gipcd /<grid_home>/log/<nodename>/gpnpd /<grid_home>/log/<nodename>/evmd 对应 ohasd oraagent 启动的mdnsd、gipcd、gpnpd和evmd /<grid_home>/log/<nodename>/agent/crsd/orarootagent_root /<grid_home>/log/<nodename>/agent/crsd/oraagent_<oracleuser> 对应 crsd 启动的orarootagent和oraagent /<grid_home>/log/<nodename>/cssd 对应 ohasd cssdagent 启动的cssd <grid_home> 和 $oracle_base 目录下的 cfgtoollogs 目录存放了一些其它的重要日志 比如 rootcrs.pl 以及其它配置工具,比如 asmca 等等 asm 日志存放在 $oracle_base/diag/asm/+asm/<asm instance name>/trace <grid_home>/bin 目录下的 diagcollection.pl 可以自动收集重要的日志 以 root 用户执行它
clusterware 资源状态检查:
使用root用户检查状态
su - cd "$(su - grid -c 'echo $oracle_home')/bin" ./crsctl status resource -t
或者直接使用grid用户检查状态
su - grid crsctl status resource -t
集群资源管理和维护命令简介:
srvctl 和 crsctl 可以用来管理集群资源
尽量使用 srvctl 来管理资源,当srvctl无法操作时,使用crsctl管理资源
使用俩命令的-h参数列出所有的可用操作选项
ocrconfig 可以用来管理维护ocr(oracle cluster registry)或olr(oracle local registry)
诸如导入导出升级、基于备份的恢复和备份策略等
olsnodes 可以用来管理维护集群的节点信息,如查看集群信息、节点状态等
cluvfy 集群相关状态的检查和维护命令,该命令可以用来对集群状态进行巡检
主要有 comp 和 stage 两类用法
查看相应的帮助:cluvfy comp -help、cluvfy stage -help
可以实现诸如节点探测、共享存储可用性探测、集群安装前的系统或硬件检查等